漫长检索创新路,结下难忘师生情

二十多年前,在清华校园的某个角落里,一项值得回忆的的计算机检索试验在静悄悄地进行之中,......

一台Compaq 386,主频33MHz,内存4MB,其工作指示灯(一个LED小红灯)在我们的面前不断地闪烁。坐在计算机显示屏前面的是一批清华、北航的计算机专业的硕士生。他们在耐心地等待着计算机检索结果出现在屏幕上。他们想知道什么呢?检索过程中,会出现什么意外情况?

在十几兆纯汉字信息的大数据文件中,让计算机的“计算指针”沿着一个、一个的汉字顺序查找下去,从文件头一直查到文件尾,总计需要多少时间?在正式宣布计算机开始”计时“进行这项试验之前,我对大家说:在此之前,没有人做过这项试验,也不知道检索试验的结果。但是,我们需要知道。我们将根据这项检索试验的数据制定电子图书(电子版《邓选》合订本)的设计制作方案。

我宣布“计时”开始!此时,大家静静地注视着时钟(或手表)的秒针,眼角不时地瞄准计算机的工作指示灯的闪动。我注视着计算机屏幕上计数器的读数。一分钟过去了,两分钟过去了,三分钟过去了,......突然间,我宣布“停”,时间到!

每个人的读数都有点儿偏差,根据计算机自身的记时器,全文检索时间是三分四十八秒!这项全文检索的试验结果说明了什么呢?第一,传统检索算法在此根本不适用了,数据结构设计必须走新路。第二,数据文件必须高倍压缩搞创新(限于两张软盘,这是”硬指标“)。

从此,漫长的检索创新之路开始了。每个人心中都知道,从此之后,我们走上了同一条创新之路,荣辱与共,“共存亡”。说句心里话:在这条漫长检索创新路上所结下的师生情谊将永远存留在我的心中!

说明:1月16日上午9点20分,我接到现住在北京阳山书院火星人传来的邮件,内容是:1994年11月11日,国家新闻出版署的《中国新闻出版报》在头版的显著位置刊登重要新闻”电子版《邓小平文选》问世“(记者志红)。该文说:”...这种新型图书载体是我国出版界开发制作电子图书的重要成果,也为深入学习和研究建设有中国特色社会主义理论和邓小平完整的思想体系,提供了一个全新的工具。”

袁萌
1月17日

时间: 2025-01-15 15:53:30

漫长检索创新路,结下难忘师生情的相关文章

(转载)深度学习三十年创新路

转载自:http://36kr.com/p/533832.html 编者注:深度学习火了,从任何意义上,大家谈论它的热衷程度,都超乎想象.但是,似乎很少有人提出不同的声音,说深度学习的火热,有可能是过度的繁荣,乃至不理性的盲从.而这次,有不同的想法出现了. 本篇文章来自依图科技 CEO Leo的投稿,依图科技是一家专注研究CV(Computer Vison,计算机视觉)的以技术驱动的创业公司,Leo自己也在这一领域有深入研究,因此这次写下这篇文章,希望回顾一下深度学习三十年的创新之路. 近期Na

深度学习三十年创新路

深度学习三十年创新路 编者注:深度学习火了,从任何意义上,大家谈论它的热衷程度,都超乎想象.但是,似乎很少有人提出不同的声音,说深度学习的火热,有可能是过度的繁荣,乃至不理性的盲从.而这次,有不同的想法出现了. 本篇文章来自依图科技 CEO Leo的投稿,依图科技是一家专注研究CV(Computer Vison,计算机视觉)的以技术驱动的创业公司,Leo自己也在这一领域有深入研究,因此这次写下这篇文章,希望回顾一下深度学习三十年的创新之路. 近期Nature杂志刊登了Lecun.Bengio.H

热潮下的浮夸 让中国创业者丢了灵魂

谈到创业,脑海里总会出现一个车库,那里诞生过苹果.微软.Google等具有世界影响力的企业,车库里充满着兄弟情.青春气息,大家为了同样的目标而废寝忘食,吃泡面.睡地板,在一个个寒风凛冽的冬夜里冻得瑟瑟发抖,经常几个月都不洗澡,外表邋里邋遢的,但哥几个无不思维清晰.斗志旺盛,浑身上下都是情怀和理想,经过一个画面切换,几年以后,奋斗的兄弟有的成了上市企业CEO,有的作拥香车美女,大把的股票,有的依旧朴素,却在谈吐气质上大不相同,正如<中国合伙人>里的成冬青,土鳖中的极品. 正是这样的故事吸引着越来

Linux下C与Mysql的混合编程

1 概述 MySQL 是一个关系型数据库管理系统.由瑞典MySQL AB公司开发,眼下属于Oracle公司.MySQL是最流行的关系型数据库管理系统. 支持AIX.FreeBSD.HP-UX.Linux.Mac OS.NovellNetware.OpenBSD.OS/2 Wrap.Solaris.Windows等多种操作系统. 为多种编程语言提供了API.这些编程语言包含C.C++.Python.Java.Perl.PHP.Eiffel.Ruby,.NET和Tcl等. 2 安装mysql 2.1

搞定linux上MySQL编程(六):C语言编写MySQL程序(结)

[版权声明:尊重原创,转载请保留出处:blog.csdn.net/shallnet,文章仅供学习交流,请勿用于商业用途] 在实际应用中,我们不可能在命令行登录进数据库进行数据的查询.插入等操作,用户一般是使用一个界面良好的应用程序软件来对数据进行管理.为了方便应用程序的开发,MySQL提供了多种编程语言(C.perl.php等)的编程接口,供开发者使用. 对于C语言来说,MySQL提供了C语言客户机库,它允许从任何C程序的内部访问MySQL数据库,客户机实现API,API定义了客户机如何建立和执

文本分析与检索

主要内容: 1.文本表示与特征提取: 2.隐语义分析LSA和Latent Dirichlet Allocation(LDA) 3.检索模型:Boolean模型.向量模型.概率模型 1.文本表示与特征提取 文本中抽取出的特征词进行量化来表示文本信息: 利用分词工具:极易中文分词:je-analysis-1.5.3,庖丁分词:paoding-analyzer.jar, IKAnalyzer3.0, imdict-chinese-analyzer, ictclas4j 目前通常采用向量空间模型来描述文

160602、如何快速实现高并发短文检索

一.需求缘起 某并发量很大,数据量适中的业务线需要实现一个“标题检索”的功能: (1)并发量较大,每秒20w次 (2)数据量适中,大概200w数据 (3)是否需要分词:是 (4)数据是否实时更新:否 二.常见潜在解决方案及优劣 (1)数据库搜索法 具体方法:将标题数据存放在数据库中,使用like来检索 优点:方案简单 缺点:不能实现分词,并发量扛不住 (2)数据库全文检索法 具体方法:将标题数据存放在数据库中,建立全文索引来检索 优点:方案简单 缺点:并发量扛不住 (3)使用开源方案将索引外置

在WPF中让ListBox和ComboBox的快速检索功能失效

问题来源: 自定义一个ComboBox,用来显示日期.后台数据使用的是DateTime,经过Converter转化成“2015年01月01日”样子的成字符串用于显示. 但是,在实际使用中,不停的按下“[”键,光标会从以一个元素一下一下的向下移动. 经过调查,这是ComboBox的“快速检索”功能在作祟. 关于快速检索: WPF中ListBox和ComboBox有一个“快速检索”的功能. 比如在ListBox里,按下“a”键,光标会定位到第一个首字母为“a”的Item上. ComboBox也是一样

华为轮值董事长徐直军:加速智能,共创未来

"智能网联.于斯为盛",2019互联网岳麓峰会于4月1日在湖南长沙开幕.华为副董事长.轮值董事长徐直军发表了题为<加速智能,共创未来>的演讲,他呼吁中国政府和企业抓住人工智能带来"变道"的战略机遇,构建面向未来的竞争力.华为轮值董事长徐直军:加速智能,共创未来以下是徐直军发言全文各位领导.各位来宾: 大家好. 今天,我相信没有人再怀疑未来世界将走向智能时代,未来是智能社会,这已经成为全世界的基本共识.那么,人工智能也好.智能社会也好,对我们产业界意味着什