数据清洗
- 数值缺失
1.略去该组数据
2.数值填充:1)随机数;2)统一的全局常量,如:UNKNOWN;3)均值、中值;4)按类别的中值、均值;5)回归、决策树等得到的预测值;
- 噪声数据的平滑:随机噪声或偏差引起噪声
1.装箱法:按邻值实现
2.拟合回归函数以平滑数据
3.异常数据分析:在聚合后簇外的数据认为异常
原文地址:https://www.cnblogs.com/bytedance/p/9144099.html
时间: 2024-10-08 08:24:55
1.略去该组数据
2.数值填充:1)随机数;2)统一的全局常量,如:UNKNOWN;3)均值、中值;4)按类别的中值、均值;5)回归、决策树等得到的预测值;
1.装箱法:按邻值实现
2.拟合回归函数以平滑数据
3.异常数据分析:在聚合后簇外的数据认为异常
原文地址:https://www.cnblogs.com/bytedance/p/9144099.html