ADASYN算法总结

ADASYN 算法根据少数类样本的分布自适应地改变不同少数类样本的，自动地确定每个少数类样本需要合成新样本的数量，，从而补偿偏态分布。

qq_46248151

1028人浏览 · 2024-06-28 19:37:47

qq_46248151 · 2024-06-28 19:37:47 发布

ADASYN 算法根据少数类样本的分布自适应地改变不同少数类样本的权重，自动地确定每个少数类样本需要合成新样本的数量，为较难学习的样本合成更多的新样本，从而补偿偏态分布。

一、算法步骤

1、计算类别不平衡的程度

ms是少数类的数量，ml是多数类的数量

2、定义dth为目前类别不平衡程度的最大阈值

如果 d < dth（即发生不平衡）

①、计算需要为少数类生成的合成数据样本的数量：

β∈[0，1]是用于指定生成合成数据后所需的平衡水平的参数。

β=1表示在泛化过程之后创建完全平衡的数据集。

②、对少数类中的每个样本Xi，根据欧式距离找出其K个最近邻样本，计算ri

其中Δi是xi的K个最近邻中属于多数类的样本

③、计算ri均值

④、计算每个Xi需要生成的样本数

其中G是如第一步公式中定义的需要为少数类生成的合成数据样本的总数。

⑤、从1循环到gi，生成xi的新样本

从数据的K个最近邻居中随机选择一个少数类样本xzi，参与新样本si的计算。λ是一个随机数

二、未来研究点

ADASYN与基于集成的学习算法相结合。为此，需要使用Bootstrap采样技术对原始训练数据集进行采样，然后将ADASYN嵌入到每个采样集以训练假设。最后，可以使用类似于AdaBoost.M1[35][36]的加权组合投票规则来组合来自不同假设的所有决策，以获得最终预测输出。

ADASYN也可以推广到多类不平衡学习问题

还可以对ADASYN算法进行修改，以便于增量学习应用。在这种情况下，学习算法应该有能力积累以前的经验，并使用这些知识来学习额外的新信息，以帮助预测和未来的决策过程。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

2026 四款AI 技术选型不纠结

2048 AI社区

具有非线性不确定性的多智能体系统的固定时间事件触发共识控制（Matlab代码实现）

本文研究了具有非线性不确定性的多智能体系统的固定时间事件触发共识控制问题。基于事件触发策略的固定时间共识协议被提出，这些协议可以显著降低能量消耗和控制器更新的频率。集中式和分布式共识控制策略均被考虑。证明了在所提出的事件触发共识控制策略下，可以避免Zeno行为。与有限时间共识相比，固定时间共识可以在固定的收敛时间内达成，而与智能体的任意初始状态无关。最后，通过两个例子展示了固定时间事件触发共识协议

2048 AI社区

AI工具实战测评：30秒读懂技术真相

AI工具测评指南摘要：本文提出了一套系统化的AI工具测评方法，从测评目标设定到最终结论输出。测评涵盖文本生成、图像处理等工具类型，重点考察功能完整性、性能指标（响应时间、准确率）及资源消耗。通过设计典型测试用例，对比同类工具优劣，并结合实际应用场景验证。最后总结工具适用性，指出改进方向，为不同用户群体提供选用建议。测评过程强调量化分析与案例验证相结合，确保评估结果客观全面。