• 均值替换法:
    适用于连续数据(定量数据),缺失数据占比不超过10%。
    可直接生成新的数据列
    在这里插入图片描述
    在这里插入图片描述

  • 中位数替换
    适用于等级变量 例如满意度。(定性变量先要在变量试图中数值代替)
    在这里插入图片描述
    在这里插入图片描述

需要手动输入(根据频率结果选定替换值,然后升序拍排列-空值置顶, 最后输入替换值)

  • 众数替换
    适用于分类变量 例如性别。(定性变量先要在变量试图中数值代替)
    其余同中位数操作。
  • 回归估计法
    同EM法。
  • 期望最大化法(EM)
    最优的缺失值处理法。(是先求期望,然后再求极大似然估计值)
    在缺失数据较多的情形,收敛的速度较慢.
    在这里插入图片描述
    在这里插入图片描述
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐