Logistic回归模型和惩罚模型

Logistic回归模型主题思想是一个分类模型，通过对数据的分类边界线建立回归公式，从而实现分类。激活函数将连续的数值转化成0或1的输出。Heaviside函数（阶梯跳跃函数）：0到1的跳跃过程不平滑Sigmoid函数：0到1的渐变过程平滑Logistic回归模型实现过程：将样本特征值与回归系数相乘再将所有特征值与回归系数的乘积相加最后将加和代入sigmoid函数输出一个范围在0-1之间的值结果大

Jepson2017

5940人浏览 · 2021-08-12 09:04:12

Jepson2017 · 2021-08-12 09:04:12 发布

Logistic回归模型

主题思想

是一个分类模型，通过对数据的分类边界线建立回归公式，从而实现分类。

激活函数

将连续的数值转化成0或1的输出。

Heaviside函数（阶梯跳跃函数）：

0到1的跳跃过程不平滑

在这里插入图片描述

Sigmoid函数：

0到1的渐变过程平滑

在这里插入图片描述

Logistic回归模型实现过程：

将样本特征值与回归系数相乘
再将所有特征值与回归系数的乘积相加
最后将加和代入sigmoid函数
输出一个范围在0-1之间的值
结果大于0.5的样本归入1类，小于0.5的归入0类

Logistic回归模型公式：
在这里插入图片描述
Logistic损失函数：对数似然损失函数

即：

梯度下降法

无约束多元函数极值求解方法
一种常用的机器学习参数求解方法
通过迭代得到最小化的损失函数所对应的模型参数

基本思路：

在求解目标函数E(a) 的最小值时，a沿着梯度下降的方向不断变化求解最小值

什么是梯度：

假设优化目标是求解函数E(a)的最小值

参数a的梯度为函数E(a)的偏导数
因此a的迭代公式为：

其中阿尔法为步长

什么是步长：

步长是梯度下降迭代的速度控制器
步长调小：收敛速度慢
步长太大：可能跳过函数最小值，导致发散

参数求解：梯度下降法
循环a和b：
在这里插入图片描述
设置循环次数或者阈值，当达到循环次数或者两次的值小于阈值时，迭代终止。

惩罚模型

惩罚（正则化）定义： 通过在模型损失函数中增加一个正则项（惩罚项）来限制模型的复杂度

惩罚项： 一般来说都是一个随着模型复杂度增加而增加的单调递增函数

惩罚项（正则化）的形式：
假设一个模型的损失函数为：
在这里插入图片描述

则加了惩罚项的损失函数为：
在这里插入图片描述

优化目标则变成：
在这里插入图片描述
正则化的优化目标：求解参数使得模型的误差最小，同时模型的复杂度最低

惩罚项（正则化）的目的：通过降低模型的复杂度，从而防止过拟合，提高模型的泛化能力

解释一：

奥卡姆剃刀原理
解释：能够用简单的方法达到很好的项目，就没有必要使用复杂的方法
原理推广：如果简单的模型就能够达到很好的预测效果，就没有必要选择复杂的模型

解释二：

在模型中使用更多的自变量，一般情况下都会提升模型在训练数据集上的表现，但同时也会提高模型的复杂度，降低模型在验证集上的泛化能力，造成过拟合。

常用的惩罚项（正则化）

以线性回归模型的损失函数为例，假设线性回归模型需要求解的参数为列向量A，数据集中有N个样本

L1正则系数：lasso回归

（所有参数绝对值之和）
L2正则系统：ridge回归

（所有参数平方的和再开方）

常用的惩罚项（正则项）特性：

L1正则系数：lasso回归

L1是模型各个参数的绝对值之和
L1可以将特征参数约束到0，因此L1会趋向于产生少量的特征，而其他的特征都是0
L1也因此具有特征筛选的功能（被筛除的特征特征参数为0）
L1通过融入少量的特征来防止过拟合

L2正则系统：ridge回归

L2是模型各个参数的平方和的开方值
L2只能减少特征参数值，让参数接近0，但不能将参数约束到0
L2通过减少特征的参数值来防止过拟合

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从2025看2026前端发展趋势

从2025到2026，前端行业的核心变化是「从基础到深度、从辅助到核心、从分散到统一」：AI从“辅助工具”变成“核心生产力”，AI原生开发成为主流；跨端开发实现“统一化、轻量化”，彻底解决多端适配痛点；性能优化走向“自动化、精细化”，工具替代人工，降低优化门槛；全栈化深化，全栈能力成为前端开发者的必备技能；工程化升级为“智能化、可扩展”，提升开发效率和代码质量。⚠️ 手绘避坑：2026年前端不追求

2048 AI社区

2017 vs 2026：前端开发的十年变革

2026年的前端开发已全面进化，形成以AI为核心驱动、全栈深度整合、性能极致优化的新生态。开发者转型为AI"指挥官"。开发者自嘲为"配置工程师"，每次依赖升级都如拆弹般紧张。角色从"配置工程师"回归"业务工程师"。展望2026，AI不会取代开发者，而是放大创造力。"双向绑定"与"单向数据流"的争论此起彼伏，技术选型直接影响团队命运。这个曾被戏称为"切图"的岗位，正在经历从工具到思维模式的全面重构。

2048 AI社区

AI辅助下的漏洞POC编写思路

在漏洞防御的战场上，响应速度直接决定了风险暴露的时间窗口。面对持续公开的 N-day 漏洞、常态存在的“两高一弱”（高危漏洞、高危端口、弱口令）风险，以及突发的零日威胁，传统完全依赖安全专家手动编写、验证和部署检测规则（POC）的模式，已日益成为整个响应流程的瓶颈。本文旨在探讨一个切实可行的升级方案：在强大的 Nuclei 扫描引擎基础上，引入 AI 辅助生成与 POC CI/CD 自动化验