多元线性回归--R实现

大白羊_Aries

9587人浏览 · 2019-01-19 20:15:47

大白羊_Aries · 2019-01-19 20:15:47 发布

1.多元线性回归

多元线性回归的代码实现如下：

> data3.1<-read.csv("C:/Users/Administrator/Desktop/data3.1.csv",head=TRUE)
> lm3.1<-lm(y~x1+x2+x3+x4+x5+x6+x7+x8+x9,data=data3.1)
> summary(lm3.1)

输出结果为：
在这里插入图片描述
　　因而 $y$ 对9个自变量的线性回归方程为：
　　 $y^=320.6+1.317x1+1.65x2+2.179x3−0.006x4+1.684x5\hat{y}=320.6+1.317x_{1}+1.65x_{2}+2.179x_{3}-0.006x_{4}+1.684x_{5}$
　　　　　　　　　 $0.01x_{6}+0.004x_{7}-19.13x_{8}+50.52x_{9}$
　　　　　　　
　　由summary()语句的输出结果可以看出，其中 $F$ 值为 $299$ ,对应的 $P$ 值为 $2.2 e - 16$ ，由此可知次回归方程整体上高度显著，即做出9个自变量整体对因变量 $y$ 产生显著线性影响的判断所犯错误的概率约为0.

2.方差分析

对于线性回归的方差分析，R语言中不仅可使用函数anova()得到方差分析表，还可以使用函数Anova()。

> library(car)
> Anova(lm3.1,type="III")

得到结果如下：
在这里插入图片描述
　　从上述结果中看出，在显著性水平 $α=0.05\alpha =0.05$ 下，只有 $x_{1},x_{2},x_{3},x_{5}$ 对 $y$ 产生显著线性影响。

3.偏相关系数

偏相关系数测定在回归方程中已包含若干个自变量时，在引入某一个新的自变量时， $y$ 的剩余变差的相对减少量，它衡量某自变量对 $y$ 的变差减少的边际贡献。偏决定系数的算术平方根为片相关系数。

> data3.2<-read.csv("C:/Users/Administrator/Desktop/data3.2.csv",head=TRUE)
> lm3.2<-lm(y~x1+x2,data=data3.2)
>  r<-cor(data3.2)
> library(corpcor)
> pcor3.2<-cor2pcor(r)

输出结果为：
相关系数：
在这里插入图片描述
偏相关系数：

　　从上面结果可以看出， $r_{y1;2}=0.802$ （ $r_{y1;2}$ 表示模型中已含有 $x_{2}$ 时再加入 $x_{1}$ 使 $y$ 的剩余变差的相对减少量）， $r_{y1;2}=0.739$ ，进一步计算可得到偏决定系数 $r_{y1;2}^{2}=0.643,r_{y2;1}^{2}=0.546$ .
　　由相关系数矩阵可知， $y$ 与 $x_{1}$ 的简单相关系数 $r_{y1}=0.807$ ，则决定系数 $r_{y1}^{2}=(0.807)^{^{2}}=0.652$ .
　　以上数据表明，用 $y$ 与 $x_{1}$ 做一元线性回归时， $x_{1}$ 能消除 $y$ 的变差SST的比例是62.5%，再引入 $x_{2}$ 时， $x_{2}$ 能消除剩余变差SSE的比例是54.6%，因而自变量 $x_{1}$ 和 $x_{2}$ 消除变差的总比例为 $1−(1−ry12)(1−ry2;12)=1(1−0.652)×(1−0.546)=0.8421-(1-r_{y1}^{2})(1-r_{y2;1}^{2})=1(1-0.652)\times(1-0.546)=0.842$ ，这个值恰好是 $y$ 对 $x_{1}$ 和 $x_{2}$ 的二元香型回归的决定系数 $R^{2}$ .

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Ruby与其他编程语言的比较

Ruby优点：语法优雅、开发快速、Web生产力高；缺点：性能差、生态系统小、适用领域窄。推荐场景：初创公司Web应用、快速原型开发。若追求性能或广度，可考虑Python（通用性）、JavaScript（全栈）或Java（企业级）。通过以上比较，Ruby在特定场景下表现出色，但选择语言应基于项目需求。例如，构建一个内容管理系统，Ruby on Rails是理想选择；而开发AI模型，Python更合适

2048 AI社区

上下文工程驱动智能体向动态知识图谱构建

例如在文章开头，我们举的产品经理和工程师之间的那一段对话，一个高质量智能体，不再只是让大模型回答用户的问题，而是通过上下文工程，帮助大模型在回答前获得更加结构化的输入，包括项目状态、需求文档、任务历史、甚至团队氛围，实现大模型更好的理解当前的任务规划、团队过往的沟通隐患、对方的工作状态与担忧、文档/知识库的实时状态等等。这和我们维护我们手机上内存很像，一开始所有应用和历史信息都保留，但当手机出现运

2048 AI社区

C++调试与错误排查

资源管理是另一个关键领域，遵循RAII原则，使用智能指针（unique_ptr、shared_ptr）替代裸指针，能够有效防止内存泄漏和异常安全问题。构造函数中的初始化列表使用、拷贝控制成员的正确处理，都是减少对象生命周期错误的重要实践。通过编译器标志（如GCC的-fdiagnostics-color=always）增强错误信息可读性，或使用Clang的更有好的错误提示，都能提升排错效率。编译时错