线性回归公式详细讲解
线性回归方程公式:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。详解如下。
1、第一:用所给样本求出两个相关变量的(算术)平均值。
2、第二:分别计算分子和分母:(两个公式任选其一)分子。
3、第三:计算b:b=分子/分母。
4、用最小二乘法
估计参数b,设服从正态分布
,分别求对a、b的偏导数
并令它们等于零。
5、先求x,y的平均值X,Y。
6、再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。
7、后把x,y的平均数
X,Y代入a=Y-bX。
8、求出a并代入总的公式y=bx+a得到线性回归方程。
9、(X为xi的平均数,Y为yi的平均数)。
线性回归的一般步骤有什么,要做哪些检验,什么含义
做完线性回归之后,我们需要对模型进行检验。
常用的检验有d-w检验,用来检验模型拟合之后的残差是否依然具有相关性 R^2值,可以告诉我们模型拟合的是否够好。还有就是模型的预测变量之间是否有强烈的相关性的问题。SPSS如何进行线性回归分析操作
线性回归参数设置
1、运行软件,输入演示数据,如下图所示。
2、选择菜单分析>回归>线下,弹出线性回归参数设置窗口。
3、设置广告为自变量,销售额为因变量。
4、选择选项,本经验就模型残差进行Durbin Watson检验,用于判断残差是否独立,作为一个基础条件来判断数据是否适合做线性回归。
5、点击绘制,对参数进行设置,本经验勾选直方图和正态概率图,同样用于判断数据是否适合进行线性回归。
6、点击保存按钮,本经验为了利用广告费用来预测销售量,保存按钮参数与预测和残差有关,可以勾选【未标准化】预测值。
7、选项按钮中直接使用默认参数即可。
主要结果解释
1、下图第3列R方为判定系数,一般认为需要大于60%,用于判定线性方程拟合优度的重要指标,体现了回归模型解释因变量变异的能力,越接近1越好。从结果中可以看出值为0.919,初步判断模型拟合效果良好。
2、方差分析的显著性值=0.000<0.01<0.05,表明由自变量“广告费用”和因变量“销售量”建立的线性关系回归模型具有极显著的统计学意义,即增加广告费用可销售量这样的线性关系显著。
3、下图建模的最直接结果,读取未标准化系数,我们可以轻松写出模型表达式,如下:Y=79.991+9.503X这里关键要看自变量广告费用的回归系数是否通过检验,t检验原假设回归系数没有意义,由最后一列回归系数显著性值=0.000<0.01<0.05,表明回归系数b存在,有统计学意义,广告费用与销售量之间是正比关系,而且极显著。
4、上面已经得出回归逻辑公式,接下来我们需要检验数据是否可以做回归分析,它对数据的要求是苛刻的,有必要就残差进行分析。从标准化残差直方图来看,,左右两侧不完全对称;从标准化残差的P-P图来看,散点并没有全部靠近斜线,并不完美。综合而言,残差正态性结果不是最好的,当然在现实分析当中,理想状态的正态并不多见,接近或近似即可考虑接受。
5、模型残差独立性检验。DW=1.475,查询 Durbin Watson table 可以发现本例DW值恰好出在无自相关性的值域之中,认定残差独立,通过检验。
6、预测。这一步直接使用公式输入即可算出。至此,建立了广告和销售量之间的线性回归模型,并且实施了预测,那么模型的准确性到底如何呢,有待最终实际销售比对分析。
还没有评论,来说两句吧...