【如何计算相关系数r】相关系数r是统计学中用于衡量两个变量之间线性关系密切程度的指标。其取值范围在-1到1之间,数值越接近1或-1,表示变量之间的线性关系越强;数值接近0则表示没有明显的线性关系。
以下是对“如何计算相关系数r”的详细总结,包括公式、步骤和示例。
一、相关系数r的定义
相关系数r(Pearson相关系数)用于衡量两个连续变量之间的线性相关程度。计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $:数据对的数量
- $ x $、$ y $:两组变量的观测值
二、计算步骤
| 步骤 | 操作说明 |
| 1 | 收集两组数据(x, y),并列出每一对数据 |
| 2 | 计算每对数据的乘积xy,并求和 |
| 3 | 计算x的总和Σx和y的总和Σy |
| 4 | 计算x的平方和Σx²和y的平方和Σy² |
| 5 | 将以上数据代入公式,计算相关系数r |
三、示例计算
假设我们有以下数据对:
| x | y | xy | x² | y² |
| 1 | 2 | 2 | 1 | 4 |
| 2 | 4 | 8 | 4 | 16 |
| 3 | 6 | 18 | 9 | 36 |
| 4 | 8 | 32 | 16 | 64 |
计算过程:
- $ n = 4 $
- $ \sum x = 1 + 2 + 3 + 4 = 10 $
- $ \sum y = 2 + 4 + 6 + 8 = 20 $
- $ \sum xy = 2 + 8 + 18 + 32 = 60 $
- $ \sum x^2 = 1 + 4 + 9 + 16 = 30 $
- $ \sum y^2 = 4 + 16 + 36 + 64 = 120 $
代入公式:
$$
r = \frac{4 \times 60 - (10 \times 20)}{\sqrt{[4 \times 30 - (10)^2][4 \times 120 - (20)^2]}} = \frac{240 - 200}{\sqrt{(120 - 100)(480 - 400)}} = \frac{40}{\sqrt{20 \times 80}} = \frac{40}{\sqrt{1600}} = \frac{40}{40} = 1
$$
结果为1,说明x与y之间存在完全正相关。
四、相关系数r的解释
| r值 | 含义 |
| 1 | 完全正相关 |
| 0.7~1 | 强正相关 |
| 0.3~0.7 | 中等正相关 |
| 0 | 无相关 |
| -0.3~-0.7 | 中等负相关 |
| -0.7~-1 | 强负相关 |
| -1 | 完全负相关 |
五、注意事项
- 相关系数仅反映线性关系,不能说明因果关系。
- 数据应为连续变量,且尽量满足正态分布。
- 当数据量较少时,相关系数可能不够稳定。
通过上述方法,可以准确计算出两个变量之间的相关系数r,并据此分析它们之间的线性关系强度。


