多元线性回归--R实现
1.多元线性回归
多元线性回归的代码实现如下:
> data3.1<-read.csv("C:/Users/Administrator/Desktop/data3.1.csv",head=TRUE)
> lm3.1<-lm(y~x1+x2+x3+x4+x5+x6+x7+x8+x9,data=data3.1)
> summary(lm3.1)
输出结果为:
因而yyy对9个自变量的线性回归方程为:
y^=320.6+1.317x1+1.65x2+2.179x3−0.006x4+1.684x5\hat{y}=320.6+1.317x_{1}+1.65x_{2}+2.179x_{3}-0.006x_{4}+1.684x_{5}y^=320.6+1.317x1+1.65x2+2.179x3−0.006x4+1.684x5
+0.01x6+0.004x7−19.13x8+50.52x9+0.01x_{6}+0.004x_{7}-19.13x_{8}+50.52x_{9}+0.01x6+0.004x7−19.13x8+50.52x9
由summary()语句的输出结果可以看出,其中FFF值为299299299,对应的PPP值为2.2e−162.2e-162.2e−16,由此可知次回归方程整体上高度显著,即做出9个自变量整体对因变量yyy产生显著线性影响的判断所犯错误的概率约为0.
2.方差分析
对于线性回归的方差分析,R语言中不仅可使用函数anova()得到方差分析表,还可以使用函数Anova()。
> library(car)
> Anova(lm3.1,type="III")
得到结果如下:
从上述结果中看出,在显著性水平α=0.05\alpha =0.05α=0.05下,只有x1,x2,x3,x5x_{1},x_{2},x_{3},x_{5}x1,x2,x3,x5对yyy产生显著线性影响。
3.偏相关系数
偏相关系数测定在回归方程中已包含若干个自变量时,在引入某一个新的自变量时,yyy的剩余变差的相对减少量,它衡量某自变量对yyy的变差减少的边际贡献。偏决定系数的算术平方根为片相关系数。
> data3.2<-read.csv("C:/Users/Administrator/Desktop/data3.2.csv",head=TRUE)
> lm3.2<-lm(y~x1+x2,data=data3.2)
> r<-cor(data3.2)
> library(corpcor)
> pcor3.2<-cor2pcor(r)
输出结果为:
相关系数:
偏相关系数:
从上面结果可以看出,ry1;2=0.802r_{y1;2}=0.802ry1;2=0.802(ry1;2r_{y1;2}ry1;2表示模型中已含有x2x_{2}x2时再加入x1x_{1}x1使yyy的剩余变差的相对减少量),ry1;2=0.739r_{y1;2}=0.739ry1;2=0.739,进一步计算可得到偏决定系数ry1;22=0.643,ry2;12=0.546r_{y1;2}^{2}=0.643,r_{y2;1}^{2}=0.546ry1;22=0.643,ry2;12=0.546.
由相关系数矩阵可知,yyy与x1x_{1}x1的简单相关系数ry1=0.807r_{y1}=0.807ry1=0.807,则决定系数ry12=(0.807)2=0.652r_{y1}^{2}=(0.807)^{^{2}}=0.652ry12=(0.807)2=0.652.
以上数据表明,用yyy与x1x_{1}x1做一元线性回归时,x1x_{1}x1能消除yyy的变差SST的比例是62.5%,再引入x2x_{2}x2时,x2x_{2}x2能消除剩余变差SSE的比例是54.6%,因而自变量x1x_{1}x1和x2x_{2}x2消除变差的总比例为1−(1−ry12)(1−ry2;12)=1(1−0.652)×(1−0.546)=0.8421-(1-r_{y1}^{2})(1-r_{y2;1}^{2})=1(1-0.652)\times(1-0.546)=0.8421−(1−ry12)(1−ry2;12)=1(1−0.652)×(1−0.546)=0.842,这个值恰好是yyy对x1x_{1}x1和x2x_{2}x2的二元香型回归的决定系数R2R^{2}R2.
更多推荐
所有评论(0)