2021年六西格玛管理黑带(绿带)考试知识要点(77)
2023-07-14 来源:旧番剧
2、通过求解相关系数说明两个变量相关程度。
相关系数 是用来描述两个变量线性相关程度的一种度量。
若相关系数是根据总体数据计算得到的,称为总体相关系数,记为 ρ ;若相关系数是
根据样本数据得到的,称为样本相关系数,记为 r。
相关系数( Pearson 相关系数)
对 r的几点说明:
·( 1) r的取值范围在 -1~ 1 之间 , |r|=1 , 两变量为函数关系 , r=0 , 说明二者不存
在线性相关关系;
( 2) r具有对称性;
( 3) r数值大小与 x和 y的原点及尺度无关;
( 4) r仅仅是 x与 y之间线性关系的一个度量,不能用于描述非线性关系;
( 5)r虽然是两个变量之间线性关系的一个度量 ,却并不一定意味着 x与 y一定有
因果关系。
多个变量间的 相关系数矩阵 :
例 :( 蓝书 P288 例 9-5 ) 某种水泥在凝固时放出的热量与水泥中 4种化学成分物质 x1,
x2, x3, x4的含量有关。现记录了 13 组数据,试分析四种化学成分之间的相关性。
( 1)绘制多变量矩阵图
图形 >矩阵图
( 2)多变量相关性分析
统计 >基本统计量 >相关
6.6.2 一元线性回归模型
1、一元线性回归方程的建立
自变量 :在回归分析中,用来预测或用来解释变量的一个或多个变量,称为自变量,
用 x表示。
因变量 :在回归模型中,被预测或被解释的变量,用 y表示。
回归模型 :描述因变量 y如何依赖自变量 x和误差项 ε 的方程,称为回归模型。只涉
及一个自变量的一元线性回归模型。
总体的回归直线方程可表示为:
回归系数具有如下性质:
( 1)斜率 b是 β 1的无偏估计量,服从正态分布。即
( 2)截距 a是 β 0的无偏估计量,服从正态分布。即
回归方程拟合出来以后,需要进行统计分析以解决以下四个问题:
的估计值。 是 的估计值, 是 归系数。 称为经验回归方程的回
系数: ,然后用样本数据估计 时,就可以将其表示为