通过读源码
判定过程如下
1. 分词, 得到 w1, w2, w3, ....., wn
2. 贝叶斯判定
构建 neg, pos数组A、B
数组 =
log(属于该数组的词 - 所有词)
+ log(分词w1~wn在该数组[neg、pos]的频次)
pos | neg 概率 =
exp(数组[neg | pos] - 数组[pos | neg]
即相反的类别剪该类别取指数
时间: 2024-10-03 19:38:07
通过读源码
判定过程如下
1. 分词, 得到 w1, w2, w3, ....., wn
2. 贝叶斯判定
构建 neg, pos数组A、B
数组 =
log(属于该数组的词 - 所有词)
+ log(分词w1~wn在该数组[neg、pos]的频次)
pos | neg 概率 =
exp(数组[neg | pos] - 数组[pos | neg]
即相反的类别剪该类别取指数