(64位)本体学习程序(ontoEnrich)系统使用说明文档

系统运行:文件夹system下,可执行文件ontoEnrichment

概念学习

--------------------------------------------------------1、简单概念学习
语料库配置文件:corpusDir(可自行配置,第一行为领域语料文件所在目录,其他为背景语料文件所在目录,每个目录占一行)
------------程序执行:
请输入语料库配置文件(第一行为领域语料):./corpusDir
请输入经过分词预处理的领域文档存放目录:./语料/domainSegment
请输入输出文件名:./shuchu/simple_concept
请输入简单概念筛选阈值(默认x=0.5,y=1.0),如果未输入则选择默认值:
0.5
1.0

--------程序执行结果:./shuchu/simple_concept

-------------------------------------------------------2、复合概念学习

------------程序执行:
请输入构成复合概念词根文件:./Data/root.txt (可以包含多个,每个词一行)
请输入构成复合概念模板文件(按R学习模板文件):./Data/rule (复合概念词性构成规则)

    若要重新学习复合概念规则
      规则获取文件:./Data/ruleTrainData.txt (每行为一个记录,其格式为:句子 该句中包含的复合概念)
请输入领域文档集合所在目录名:./语料/domainWeapon
是否进行复合概念词频统计进行筛选(Y/N):Y
是否进行上下文依赖筛选(Y/N):Y
请输入上下文依赖筛选阈值(未输入则使用默认值0.5):0.5
通过上下文依赖筛选的复合概念存储在(输入文件名):./shuchu/compoundConcept.txt

--------程序执行结果:

终端输出的结果:【复合概念 信息熵】

./shuchu/compoundConcept.txt 文件中的内容:【与终端输出的结果差别是:信息熵大于上下文依赖筛选阈值才存入输出文件中】

关系学习

    1、使用维基百科信息盒进行关系学习
            2、使用维基百科分类名进行关系学习
            3、使用维基百科链接进行关系学习
            4、使用广义后缀树识别概念分类关系
            5、使用层次聚类学习概念间分类关系
            6、模板匹配法学习特定概念间关系(方法一)
            7、模板匹配法学习特定概念间关系(方法二)

1、输入:概念名(关系三元组中的第一个概念)
            ***********************************************
            ****维基百科信息盒(infobox)抽取概念间关系****
            ***********************************************
请输入概念名:航空器        #并不是wiki文件里面所有的概念都有其对应的infobox这一条目,故不是输入任何东西都可以得到信息盒抽取的概念间的关系
请输入配置文件名(包含维基百科dump文件和抽取出的词条文档存放文件):./wikiConfig   
请输入输出文件名:./shuchu/infoboxhkq
infobox关系抽取完成!
是否继续(Y/N)?

----------------程序运行结果

./shuchu/infoboxhkq里面的内容:

2、输入:概念名(关系三元组中的第一个概念)

3、 程序运行前预处理:

  运行./wikiData/wikiGraph程序【该程序是对wiki的xml文件进行预处理,得到维基百科连接图文件】,改程序的输入是:./wikiData/wikiNet.txt【wiki百科文件中每个概念的链接关系】和./wikiData/wikiNetRedict.txt【wiki百科文件中概念的重定向关系】两个文件,最终输出wikiNetGraph文件(名字可以任意自定)【得到的维基百科连接图文件】,该输出文件作为“维基百科链接抽取相关概念”的相关输入之一。

程序运行:

     *******************************
            ****维基百科链接抽取相关概念****
            *******************************

请输入维基百科重定向文件,维基百科链接图文件:./wikiData/wikiNetRedirect.txt
./wikiData/wikiNetGraph   (包含两行记录)
运行结果:

输出:根据用户输入的概念,将该概念中有链接关系的相关概念以追加的方式输出到./wikiVerctor/conceptWikiFile中。

4、输入:./Data/concept(待建立层次关系的概念集合,该文件中每行数据为一个领域概念)

程序输入:system/concept

5、输入:./wordVector/conceptKeyFile(从自然文本中得到的概念集合的上下文词向量) ./wordVector/conceptWikiFile (通过
模块2从维基百科链接图得到的概念相关概念向量,其具体格式见相应的文件)

-----程序运行时,实际是没有输入选项的


6、训练文件: ./6/train
   模板个数:根据训练文件可以自己调整
   测试文件:./Data/test(格式跟训练文件一样)

7、训练文件: ./7/train
   测试文件:./7/test
---------------程序运行结果

时间: 2024-08-23 23:45:17

(64位)本体学习程序(ontoEnrich)系统使用说明文档的相关文章

win7 64位 家庭高级版系统忘记密码了怎么办?

有一同事离职了,他的电脑设置了密码,但没留下密码就走了,我们部门的同事叫我重装系统,我过去看了,那边的同事说,只要能进系统把密码清掉就行了,不一定要重装. 这样的机会对于我这些菜鸟来说,是最好的学习机会,于是马上百度,网上教程不少,不过说的基本上就是三种办法,因为手头有UBUNTU 12.04的光碟,于是,我选用了最简单的办法. 一.把ubuntu 12.04的光碟放进光驱里面,重启电脑,按delete键,进入BIOS,设置第一启动设备为从CDROM启动,保存退出. 二.进入ubuntu 12.

64位 Windows 8/7 系统下的 32位PLSQL 联接 64 位 Oracle 11g

64位 Windows 8/7 系统下的 32位PL/SQL 联接 64 位 Oracle 11g 说明:安装完后Oracle的 oci.dll 是64位的,而32位应用程序 PL/SQL Developer 无法加载 解决方案 步骤一:下载Instant Client for Microsoft Windows (32-bit) 包  地址:http://www.oracle.com/technetwork/topics/winsoft-085727.html 步骤二:解压文件 步骤三:配置系

32位机 64位机 32位操作系统 64位操作系统

32位机: 一般指的是32位的CPU就是说CUP一次能计算32位. 64位机: 一般指的是64位的CPU就是说CPU一次能计算64位. 32位操作系统: 为32位机而制作的.指的是操作系统的字长是32位的 ,也就间接的影响了地址总线,因此,最大寻址空间也就自然是2的32次方,4G.注意:32位操作系统只能安装再32位机子上. 64位操作系统: 为64位机而制作的.指的是操作系统的字长是64位的,也就间接的影响了地址空闲,因此最大寻址空间也就是2的64次方,128G.注意:64位操作系统可以安装在

(64位)本体学习程序(ontoEnrich)配置说明文档

1系统环境 64位 Ubuntu 2 第三方依赖库配置 boost_1_44_0 #解压boost_1_44_0.tar.gz 到 /usr/local.如果出现权限问题,请用sudo执行该命令 tar zxvf boost_1_44_0.tar.gz -C /usr/local #编译Boost.Regex #检查 echo $BOOST_ROOT 是否等于 /usr/local/boost_1_44_0 #如果为空,在~/.bashrc 中写入 export BOOST_ROOT = /us

本体学习程序(ontoEnrich)配置说明文档

1.系统环境 32/64位 Ubuntu 源代码中已经包含在32位下编译生成的.o文件,配置好依赖库(步骤2)后,参考步骤3则可重新link. link无误即可运行程序. 在64位下重新编译项目,缺失源码conceptRecognizor.cpp,暂时无法通过编译. 2.依赖库  2.1 boost_1_44_0 2.1.1 ubuntu 64位 boost_1_44_0安装说明 2.1.2 ubuntu 32位 源码中已经包含boost_1_44_0在32位下编译后的文件,将(boost_1_

关于64位 windows&linux双系统引导问题

换了台本子win7 64位,抽空做个双系统,装了下linux. 遇到开机问题:进linux可以正常使用,进win7花屏死机,初步估计是grub(此时的boot sector位grub)的问题,启动器被破坏一种表现. 对应做了以下处理: 1.在linux下修改/boot/grub/gurb.cfg,把: 1 ### BEGIN /etc/grub.d/30_os-prober ### 2 menuentry 'Windows 7 (loader) (on /dev/sda1)' --class w

(32位)本体学习程序(ontoEnrich)系统使用说明文档

系统运行:文件夹system下,可执行文件ontoEnrichment --------------------------------------------------------1.简单概念学习语料库配置文件:corpusDir(可自行配置,第一行为领域语料文件所在目录,其他为背景语料文件所在目录,每个目录占一行)------------程序执行:请输入语料库配置文件(第一行为领域语料):./corpusDir请输入经过分词预处理的领域文档存放目录:./语料/domainSegment请输

win7 64位 旗舰版装系统记录及window简记

装机指导: Windows 7吧系统安装向导 解决u盘安装原版win7:无法创建新分区.缺少所需的CD/DVD的问题 超全]Windows发展历史最详细介绍(1985-2012) 记录: ----------- 其他 1.C:\Windows\Installer越来越大?让我们一起来删除msp这个毒瘤 2.Dism管理器(12-23圣诞版,更多新特性,祝大家圣诞快乐) 3. 原文地址:https://www.cnblogs.com/xinzhisoft/p/10335470.html

【腾讯GAD暑期训练营游戏程序班】游戏中的特效系统作业说明文档