同族词

head

header  有头的    headless  无头的

header  首领    headship  领导地位

ahead  在前    forehead  额头

behead  斩首    beheading  斩首

subhead  小标题

work

to work  工作    worker  工人

workable  可加工的    workability  可加工性

workless  失业的    workday  工作日

workbox  工具箱    workroom  工作室

workman  工人    workwoman  女工

workmanlike  像工人的    workmanship  手艺

coworker  合作者;帮手    counterwork  对抗

outwork  户外工作    outworker  户外工作者

overwork  劳累过度    unworkable  难以工作的

underwork  怠工    workshop  车间

man

to man  配备人员

时间: 2024-12-07 19:33:00

同族词的相关文章

NLP—WordNet——词与词之间的最小距离

WordNet,是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典.它不是光把单词以字母顺序排列,而且按照单词的意义组成一个"单词的网络".我们这次的任务就是求得词与词之间的最短路径,是对"图"这个数据结构再次灵活运用. 以下为SentiWordNet_3.0.0_20130122.txt文件截图: 应考虑如何存储"单词的网络",此程序是以词作为基本单元,词与词之间的联系是通过语义. 我们简单地构

go语言实现爬虫采集联想词

/**************************************************** go语言实现爬虫_联想词 咨询:qq:1465376564 黄哥python培训班所写 python北京周末培训班 https://github.com/pythonpeixun/article/blob/master/beijing_weekend.md python 上海周末培训班 https://github.com/pythonpeixun/article/blob/master/

Windows下使用Word2vec继续词向量训练

word2vec是Google在2013年提出的一款开源工具,其是一个Deep Learning(深度学习)模型(实际上该模型层次较浅,严格上还不能算是深层模型,如果word2vec上层再套一层与具体应用相关的输出层,如Softmax,便更像是一个深层模型),它将词表征成实数值向量,采用CBOW(Continuous Bag-Of-Words Model,连续词袋模型)和Skip-Gram(Continuous Skip-GramModel)两种模型.具体原理,网上有很多. 本文是在window

ecshop——商城禁止注册敏感词

这个是为了防止一些敏感字眼出现在商城会员中,实现如下: 一.执行sql语句: INSERT INTO `{$prefix}shop_config` (`id`, `parent_id`, `code`, `type`, `store_range`, `store_dir`, `value`, `sort_order`) VALUES (10, 0, 'sensitive', 'group', '', '', '', 1), (1001, 10, 'reg_sensitive', 'textare

coreseek 自定义词库(三)排序 setsortmode

对于mysql获取数据,可以根据不同的条件来进行排序,同样使用coreseek也有同样的排序功能. PHP的API中只有 SetSortMode(模式,条件) 方法,他也支持多个字段一次排序. 根据上一篇的数据: require('sphinxapi.php'); $sc = new SphinxClient(); $sc->SetSortMode(SPH_SORT_ATTR_DESC, 'group_id'); $sc->SetSortMode(SPH_SORT_ATTR_ASC, 'sco

IK分词器 整合solr4.7 含同义词、切分词、停止词

IK分词器如果配置成 <fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" is

简单高效的APP首发选词套路

首先还是介绍下APP关键词优化选词的一般流程,一般思路就是先"粗选",后"细选",逐步缩小选词范围. 第一步,首先确定"有效关键词",主要是进行基础的热度过滤.因为4605热度的词,平均一天有一次搜索,选词的时候,一般选大于等于4605的词,至于其它热度更低的词,大部分都是关键词覆盖的长尾搜索词,不用刻意考虑.appstore中大于4605的词大约有4.6万个(注:7月中旬后,这个词数降到了不到3万),等于4605的约有6万个,这些词一般称为&q

字符串问题之 判断两个字符是否互为旋转词

把一个字符串str 前面任意的部分挪到后面形成的字符串叫做str的旋转词 举例, a="cdab" b="abcd" 返回true a="1ab2" b="ab12" 返回false 解法很简单, 首先长度要一样 然后 生成一个大字符串b2 为两个字符串b拼在一起的结果 最后看看 b2中是否包含字符串a package TT; public class Test3 { public boolean isRotation(Str

转:Java实现敏感词过滤

敏感词.文字过滤是一个网站必不可少的功能,如何设计一个好的.高效的过滤算法是非常有必要的.前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢.我把它程序拿过来一看,整个过程如下:读取敏感词库.如果HashSet集合中,获取页面上传文字,然后进行匹配.我就想这个过程肯定是非常慢的.对于他这个没有接触的人来说我想也只能想到这个,更高级点就是正则表达式.但是非常遗憾,这两种方法都是不可行的.当然,在我意识里没有我也没有认知到那个算法可以解决问题,但是Googl