Model:
1、预处理 ,使用word2Vec 进行词向量转换 -> K维的词向量: ,所以一个句子就是
2、当过滤窗口设为h时,移动窗口设为1时,特征的卷积可变为之后特征便会缩减为
3、她的下一层设为softmax layer 作为分类标签的概率分布
4、特色在于设置了两种词向量,一种是在训练中保持不变,另一种在训练中通过反向传播进行微调
Regularition:
1.在中间层对向量的权重给一个L2范式的约束
2.使用了dropout,Dropout prevents co-adaptation of hidden units by randomly dropping out—i.e., setting to zero—a proportion p of the hidden units during foward backpropagation.
3.drops使用训练,o表示元素相乘,
时间: 2024-10-10 21:48:41