自然语言与信息与计算科学的关系

对于我们专业,学了一些基础到不能再基础的数学与计算机知识。

我对自然语言处理的理解很浅,上周听老师讲再加上自己平时的了解。

它至少经历了三个阶段,一个是基于规则的原理,然后是基于统计的方法,(两者结合的也有)。到目前最火的深度学习。

这个方向发展的很快,据我了解,目前深度学习的方法还在进步,没准我毕业了深度学习都落后了

语言有很多,对于我们的母语使用的方法,众多专家一直在做不懈的努力。

最短路径是我们专业学数据结构的算法

如果从有向图中某一顶点(称为源点)到达另一顶点(称为终点)的路径可能不止一条,如何找到一条路径使得沿此路径上各边上的权值总和达到最小。

2002年 也就是17年前。。。。我们的专家提出来了N-最短路径方法

这个方法的思想是,根据词典,找出所有可能的词(词典这个东西无论放在今天的深度学习,也同样重要,据我了解,很多nb开发搜索引擎的公司都有自己的一套词典)

根据词语切分成有向无环图。每个词对应着图中的一条有向边,并付给相应的边长。然后求出长度值按严格升序排列的路径集合作为一个结果集

如果每个词对应的边长为1那么说明在图中每个词的地位相等,专家把这个方法叫做统计粗分模型

至于为什么叫N最短路径,我看的文章说是他只求了排序在前面的N个最短路径的集合,这里为什么他只要前N个这样的路径呢?

待更!

原文地址:https://www.cnblogs.com/liuguangshou123/p/11041449.html

时间: 2024-11-10 08:21:43

自然语言与信息与计算科学的关系的相关文章

信息与计算科学

我的专业是信息与计算科学. 对这个专业的未来和课程.我都是非常迷茫.刚開始看到我被这个专业录取了.我还以为是被调剂去的. 如今立即就要读完两年了.随着这几天的复习.我在逐渐了解这门专业. 以下我来谈谈这门专业课. 首先说说.这是一门很好的专业.尤其是如今的信息时代.真的是太好了.可惜……我们的学校.我们的学生…… 从大一開始.我就说说我们开的课程和那些课程对我们的作用.主要课程都是 大一实用的就是数学分析. 这个是高等数学的基础.尤其是那里的微积分.差点儿是大学数学的灵魂.对project类的学

计算科学(转自wiki)

计算科学,又称科学计算,是一个与数学模型构建.定量分析方法以及利用计算机来分析和解决科学问题相关的研究领域.在实际应用中,计算科学主要应用于:对各个科学学科中的问题,进行计算机模拟和其他形式的计算. 这一领域不同于计算机科学(对于计算.计算机以及信息处理的研究),同时也异于科学和工程学的传统形式--理论与实验.科学计算技术要想获得理解,主要需要通过在计算机上实现的数学模型进行分析. 科学家和工程师发展了计算机程序和应用软件,来为被研究的系统创建模型,并以多种输入参数运行这些程序.一般来说,这些模

struts2学习笔记(二)—— 获取登录信息及计算在线人数

实现目的: 1.点击"Login"的超链接,进入登录页面 2.填写登录信息,提交表单,将用户信息保存进Session 3.显示用户名,并计算在线人数 4.点击"Logout"的超链接,在线人数减一,并使Session失效 Struts2实现: 1.配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http:/

php 通过ip获取所在城市地址信息 获取计算机外网ip

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-

向MapReduce转换:计算共现关系

分两部分: <strong><span style="font-size:18px;">/*** * @author YangXin * @info 计算共现关系的Mapper */ package unitSix; import java.io.IOException; import java.util.Iterator; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.map

构建一个学生Student,根据类Student的定义,创建五个该类的对象,输出每个学生的信息,计算并输出这五个学生Java语言成绩的平均值,以及计算并输出他们Java语言成绩的最大值和最小值。

定义一个表示学生信息的类Student,要求如下: (1)类Student的成员变量: sNO 表示学号: sName表示姓名: sSex表示性别: sAge表示年龄: sJava:表示Java课程成绩. (2)类Student带参数的构造方法: 在构造方法中通过形参完成对成员变量的赋值操作. (3)类Student的方法成员: getNo():获得学号: getName():获得姓名: getSex():获得性别: getAge()获得年龄: getJava():获得Java 课程成绩 根据类

基于Spark GraphX计算二度关系

关系计算问题描述 二度关系是指用户与用户通过关注者为桥梁发现到的关注者之间的关系.目前微博通过二度关系实现了潜在用户的推荐.用户的一度关系包含了关注.好友两种类型,二度关系则得到关注的关注.关注的好友.好友的关注.好友的好友四种类型. 如果要为全站亿级用户根据二度关系和四种桥梁类型推荐桥梁权重最高 TopN 个用户,大致估算了下总关系量在千亿级别,按照原有的 Mapreduce 模式计算整个二度关系,需要以桥梁用户为 Key,把它的关注和粉丝两个亿级的表做 Join,如果活跃用户按照亿计,平均关

自然语言26_perplexity信息

http://www.ithao123.cn/content-296918.html 首页 > 技术 > 编程 > Python > Python 文本挖掘:简单的自然语言统计 Python 文本挖掘:简单的自然语言统计 2015-05-12 浏览(141) [摘要:首要应用NLTK (Natural Language Toolkit)顺序包. 实在,之前正在用呆板进修方式剖析情绪的时间便已应用了简略的天然说话处置惩罚及统计.比方把分词后的文本变成单词拆配(或叫单词序] 主要使用N

物理学与其它科学的关系

在这本书的第三章的引言里,Feynman讲的这句话很赞:如果一件事情不是科学,这并不一定不好.一件事情不是科学,也并非就一定意味着它一定有错,这只表明它就不是科学而已.这让人联想到"中医",很多人有一个共识:中医不是科学.陪伴中华民族上千年的中医文化.中草药,对百姓疾病的诊治.对丰富中华文化都有着不可估量的价值.如果"我们"秉着"科学的,才是最美(最好)的"这样的信条,那么不妨借助现代科学技术,发挥聪明才智,拓展"中医的科学"