特征选择实质上包括两个部分:特征词的选择和特征词权重的计算。
特征词选择的方法分为有监督的方法和无监督的方法。
有监督的方法包括IG和CHI,无监督的方法包括Document Frequency (DF), Term Strength (TS)和 Entropy-based (En)。
可以参考https://www.aaai.org/Papers/ICML/2003/ICML03-065.pdf
时间: 2024-10-11 20:44:34
特征选择实质上包括两个部分:特征词的选择和特征词权重的计算。
特征词选择的方法分为有监督的方法和无监督的方法。
有监督的方法包括IG和CHI,无监督的方法包括Document Frequency (DF), Term Strength (TS)和 Entropy-based (En)。
可以参考https://www.aaai.org/Papers/ICML/2003/ICML03-065.pdf