1.多元线性回归

多元线性回归的代码实现如下:

> data3.1<-read.csv("C:/Users/Administrator/Desktop/data3.1.csv",head=TRUE)
> lm3.1<-lm(y~x1+x2+x3+x4+x5+x6+x7+x8+x9,data=data3.1)
> summary(lm3.1)

输出结果为:
在这里插入图片描述
  因而yyy对9个自变量的线性回归方程为:
  y^=320.6+1.317x1+1.65x2+2.179x3−0.006x4+1.684x5\hat{y}=320.6+1.317x_{1}+1.65x_{2}+2.179x_{3}-0.006x_{4}+1.684x_{5}y^=320.6+1.317x1+1.65x2+2.179x30.006x4+1.684x5
         +0.01x6+0.004x7−19.13x8+50.52x9+0.01x_{6}+0.004x_{7}-19.13x_{8}+50.52x_{9}+0.01x6+0.004x719.13x8+50.52x9
       
  由summary()语句的输出结果可以看出,其中FFF值为299299299,对应的PPP值为2.2e−162.2e-162.2e16,由此可知次回归方程整体上高度显著,即做出9个自变量整体对因变量yyy产生显著线性影响的判断所犯错误的概率约为0.

2.方差分析

对于线性回归的方差分析,R语言中不仅可使用函数anova()得到方差分析表,还可以使用函数Anova()。

> library(car)
> Anova(lm3.1,type="III")

得到结果如下:
在这里插入图片描述
  从上述结果中看出,在显著性水平α=0.05\alpha =0.05α=0.05下,只有x1,x2,x3,x5x_{1},x_{2},x_{3},x_{5}x1,x2,x3,x5yyy产生显著线性影响。

3.偏相关系数

偏相关系数测定在回归方程中已包含若干个自变量时,在引入某一个新的自变量时,yyy的剩余变差的相对减少量,它衡量某自变量对yyy的变差减少的边际贡献。偏决定系数的算术平方根为片相关系数。

> data3.2<-read.csv("C:/Users/Administrator/Desktop/data3.2.csv",head=TRUE)
> lm3.2<-lm(y~x1+x2,data=data3.2)
>  r<-cor(data3.2)
> library(corpcor)
> pcor3.2<-cor2pcor(r)

输出结果为:
相关系数:
在这里插入图片描述
偏相关系数:
在这里插入图片描述
  从上面结果可以看出,ry1;2=0.802r_{y1;2}=0.802ry1;2=0.802ry1;2r_{y1;2}ry1;2表示模型中已含有x2x_{2}x2时再加入x1x_{1}x1使yyy的剩余变差的相对减少量),ry1;2=0.739r_{y1;2}=0.739ry1;2=0.739,进一步计算可得到偏决定系数ry1;22=0.643,ry2;12=0.546r_{y1;2}^{2}=0.643,r_{y2;1}^{2}=0.546ry1;22=0.643,ry2;12=0.546.
  由相关系数矩阵可知,yyyx1x_{1}x1的简单相关系数ry1=0.807r_{y1}=0.807ry1=0.807,则决定系数ry12=(0.807)2=0.652r_{y1}^{2}=(0.807)^{^{2}}=0.652ry12=(0.807)2=0.652.
  以上数据表明,用yyyx1x_{1}x1做一元线性回归时,x1x_{1}x1能消除yyy的变差SST的比例是62.5%,再引入x2x_{2}x2时,x2x_{2}x2能消除剩余变差SSE的比例是54.6%,因而自变量x1x_{1}x1x2x_{2}x2消除变差的总比例为1−(1−ry12)(1−ry2;12)=1(1−0.652)×(1−0.546)=0.8421-(1-r_{y1}^{2})(1-r_{y2;1}^{2})=1(1-0.652)\times(1-0.546)=0.8421(1ry12)(1ry2;12)=1(10.652)×(10.546)=0.842,这个值恰好是yyyx1x_{1}x1x2x_{2}x2的二元香型回归的决定系数R2R^{2}R2.

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐