gensim加载word2vec训练结果(bin文件)并进行相似度实验

# -*- coding: utf-8 -*-
import gensim  

# 导入模型
model = gensim.models.KeyedVectors.load_word2vec_format(‘vectors.bin‘, binary=True)

# 得到两组词的相似度
list1 = [u‘核能‘]
list2 = [u‘电能‘]
list3 = [u‘电力‘]
list_sim1 =  model.n_similarity(list1, list2)
print list_sim1
list_sim2 = model.n_similarity(list2, list3)
print list_sim2, ‘\n‘

# 得到一组词中最无关的词
list4 = [u‘汽车‘, u‘火车‘, u‘飞机‘, u‘北京‘]
print model.doesnt_match(list4)
print ‘\n‘

# 得到与一个词最相关的若干词及相似程度
result = model.most_similar(u‘脱水工艺‘)
for each in result:
    print each[0] , each[1]
时间: 2024-10-06 15:17:32

gensim加载word2vec训练结果(bin文件)并进行相似度实验的相关文章

python实现word2vec训练结果bin文件转txt文件

经理让我把word2vec训练后得到的bin文件转为txt文件,目前还不知道txt文件用来干什么.其实word2vec训练语料时可以选择训练处出bin文件或者txt文件,但是训练出bin文件时过程太漫长,我怕直接训练出txt文件也一样慢,所以还是自己想办法做这个事情了. 我用到了gensim,这个需要自己安装一下,我的电脑装这个还挺麻烦的. # -*- coding: utf-8 -*- import gensim import codecs def main(): path_to_model

[Android学习系列2]用webview写界面,加载本地js,js,html文件

以jquery mobile为例 1.在android界面拖入一个webview,然后添加一个internet权限 <uses-sdk android:minSdkVersion="8" android:targetSdkVersion="18" /> <uses-permission android:name="android.permission.INTERNET"/> <application ........

javaEE:day2-servlet生命周期、提交解决中文乱码、tomcat加载jar包或类文件的顺序

servlet生命周期 生命周期简介: servlet在服务器第一次被请求的时候new出来,并初始化(即init())再调用service方法.这个实在服务器中new出来,然后用HashMap加的,与客户端无关.客户端之后访问只调用这个servlet的service方法. 具体分为4步: 1 构造方法 :服务器在被客户端第一次请求的时候运行 仅在服务器中运行一次 2 init方法:客户端第一次访问服务器的时候在服务器中进行初始化 仅一次.并且可以通过config参数在 web.xml中通过(ke

CocoStudio使用笔记1:cocos2dx3.4加载CocoStudio导出的csb文件

一直以来都是用手写代码来做cocos2dx的游戏界面.看朋友一个星期一个游戏的速度,很让我眼红.他们公司使用的是CocosBuilder做界面.对于CocosBuilder 在他的推荐下我也研究了一个星期,网上的教程太乱,而且坑太多,每个教程的操作还不一样,按照教程来还是搞不定,对此我决定要一点点的来填坑.而本篇笔记是记录下cocostudioV2.3.2版本生成的csb文件在cocos2dx3.4中的运用.对于cocosbuilder的笔记过几天在整理,爬坑爬的心累. Cocostudio已经

ReportView动态加载带参数的RDCL文件

在vs里新建一个winform程序"ReportViewTest",在form1中添加一个reportView控件,from1的load事件如下: private void Form1_Load(object sender, EventArgs e) { DataSet ds = new DataSet(); try { ds = getDS(); } catch (Exception) { throw; } Microsoft.Reporting.WinForms.ReportDat

Away3D 学习笔记(一): 加载3DS格式的模型文件

加载外部的3DS文件分为两种: 1: 模型与贴图独立于程序的,也就是从外部的文件夹中读取 1 private function load3DSFile():Loader3D 2 { 3 loader = new Loader3D(); 4 loader.addEventListener(LoaderEvent.RESOURCE_COMPLETE,onLoadComplete); 5 loader.addEventListener(AssetEvent.ASSET_COMPLETE,onAsset

快速加载DXF、DWG格式文件控件ABViewer

ABViewer是一种高品质,低成本,高效率的多功能设计及工程文档管理应用程序. ABViewer为您提供专业的cad文件浏览和编辑工具. 支持多种格式,如:DWG格式, DXF, DWF, Hewlett-Packard HPGL, PLT, HGL, CGM, SVG, TIFF, BMP, JPG, GIF etc 等. 具体功能: ABViewer它可以方便我们在下述几种情况下大大节省时间: 当您需要在您的MS Word 文档中导入CAD图像时 您可以获得比常规软件快两倍的CAD文件(D

gensim加载词向量文件

# -*- coding: utf-8 -*- # author: huihui # date: 2020/1/31 7:58 下午 ''' 根据语料训练词向量,并保存向量文件 ''' import os import sys import gensim os.reload(sys) sys.setdefaultencoding('utf-8') # 需要提前分词 input_file = "corp_seg.txt" sentences = gensim.models.word2ve

webView 加载本地html css javascript文件路径尝试

一:UIWebView加载数据的方式有三种: 1:- (void)loadRequest:(NSURLRequest *)request NSString * path = [[NSBundle mainBundle] pathForResource:@"demoFolder" ofType:@"html"]; NSURL *url = [NSURL URLWithString:path]; [self.webView1 loadRequest:[NSURLRequ