二十多年前,在清华校园的某个角落里,一项值得回忆的的计算机检索试验在静悄悄地进行之中,......
一台Compaq 386,主频33MHz,内存4MB,其工作指示灯(一个LED小红灯)在我们的面前不断地闪烁。坐在计算机显示屏前面的是一批清华、北航的计算机专业的硕士生。他们在耐心地等待着计算机检索结果出现在屏幕上。他们想知道什么呢?检索过程中,会出现什么意外情况?
在十几兆纯汉字信息的大数据文件中,让计算机的“计算指针”沿着一个、一个的汉字顺序查找下去,从文件头一直查到文件尾,总计需要多少时间?在正式宣布计算机开始”计时“进行这项试验之前,我对大家说:在此之前,没有人做过这项试验,也不知道检索试验的结果。但是,我们需要知道。我们将根据这项检索试验的数据制定电子图书(电子版《邓选》合订本)的设计制作方案。
我宣布“计时”开始!此时,大家静静地注视着时钟(或手表)的秒针,眼角不时地瞄准计算机的工作指示灯的闪动。我注视着计算机屏幕上计数器的读数。一分钟过去了,两分钟过去了,三分钟过去了,......突然间,我宣布“停”,时间到!
每个人的读数都有点儿偏差,根据计算机自身的记时器,全文检索时间是三分四十八秒!这项全文检索的试验结果说明了什么呢?第一,传统检索算法在此根本不适用了,数据结构设计必须走新路。第二,数据文件必须高倍压缩搞创新(限于两张软盘,这是”硬指标“)。
从此,漫长的检索创新之路开始了。每个人心中都知道,从此之后,我们走上了同一条创新之路,荣辱与共,“共存亡”。说句心里话:在这条漫长检索创新路上所结下的师生情谊将永远存留在我的心中!
说明:1月16日上午9点20分,我接到现住在北京阳山书院火星人传来的邮件,内容是:1994年11月11日,国家新闻出版署的《中国新闻出版报》在头版的显著位置刊登重要新闻”电子版《邓小平文选》问世“(记者志红)。该文说:”...这种新型图书载体是我国出版界开发制作电子图书的重要成果,也为深入学习和研究建设有中国特色社会主义理论和邓小平完整的思想体系,提供了一个全新的工具。”
袁萌
1月17日