机器学习——提升树

以上皆参考李航老师的《统计学习方法》，如博客有不足之处，还请指教！！！一、什么是提升树提升树（BT,Boosting Tree）是以分类树和回归树为基本分类器的提升方法。提升树被认为是统计学习中性能最好的方法之一。以决策树为基函数的提升方法称为提升树。二、提升树模型提升方法采用加法模型（即基函数的线性组合）与前向分步方法。对分类问题决策树是二叉分类树，对回归问题决策树是二叉回归树。提升树模型可以表

maggieyiyi

4781人浏览 · 2022-03-31 20:23:09

maggieyiyi · 2022-03-31 20:23:09 发布

以上皆参考李航老师的《统计学习方法》，如博客有不足之处，还请指教！！！

一、什么是提升树

提升树（BT,Boosting Tree）是以分类树和回归树为基本分类器的提升方法。提升树被认为是统计学习中性能最好的方法之一。

以决策树为基函数的提升方法称为提升树。

二、提升树模型

提升方法采用加法模型（即基函数的线性组合）与前向分步方法。

对分类问题决策树是二叉分类树，对回归问题决策树是二叉回归树。

提升树模型可以表示为决策树的加法模型：

三、提升树算法

那么具体怎么计算呢？

首先，提升树算法采用前向分步算法，确定出是提升树f0(x)=0,第m步的模型是：

3.1 分类提升树

分类提升树可看作AdaBoost算法的特殊情况，后续将在AdaBoost中详细介绍。

3.2回归提升树

已知一个训练数据集T={（Xi,Yi),i=1,2,3.....n}，X为输入，Y为输出。如果将X划分为J个互不相交的区域R1,R2,R3,...Rj，并且在每个区域上确定输出的常量Cj，那么树可表示为：

四、提升树例子

五、梯度提升

提升树利用加法模型与前向分步算法实现的优化过程。当损失函数是平方损失和指数损失函数时，每一步优化是很简单的。但对一般损失函数而言，每一步优化并不容易，Freidman提出了梯度提升算法。

利用损失函数的负梯度在当前模型的值

作为回归问题提升树算法的残差的近似值，拟合一个回归树。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

手把手教你玩转开源大模型：从Llama3到企业级应用

2048 AI社区

前端老旧项目全面性能优化指南与面试攻略

核心 Web VitalsLCP (Largest Contentful Paint): 最大内容绘制时间FID (First Input Delay): 首次输入延迟CLS (Cumulative Layout Shift): 累积布局偏移其他重要指标浏览器开发者工具Lighthouse 自动化分析WebPageTest 分析加载性能问题运行时性能问题代码分割与懒加载避免阻塞主线程内存优化2.

2048 AI社区

51c大模型~合集186

9 月 25 日，生数科技新一代图生视频大模型 Vidu Q2 正式全球上线，打破了原有 AI 生成的表情太假，动作飘忽不定，运动幅度不够大，无法指哪打哪的行业问题，实现从 “视频生成” 到 “演技生成”，从 “动态流畅” 到 “情感表达” 的革命性跨越，标志着 AI 视频生成技术正式从追求 “形似” 进入追求 “神似” 的新纪元，将为内容创作、影视产业、广告营销等领域带来全新升级。然而，当前的原