在ID3算法完全掌握的基础上,学习C4.5算法,需要明白以下几件事:
1、C4.5如何划分数据集?——用信息增益比;
2、连续型属性如何处理?——选择划分属性时,当做离散变量;选择划分点时,用信息增益来选。
3、如何剪枝?——基于误判的剪枝和悲观剪枝,后者更加常用。
参考:
http://shiyanjun.cn/archives/428.html
http://blog.sina.com.cn/s/blog_68ffc7a40100urn3.html
http://www.cnblogs.com/zhangchaoyang/articles/2842490.html
时间: 2024-10-25 10:58:03