这里介绍一个基础的搜索引擎技术
假如有两段文字
1,books and friends should be few but good
2,A good book is a good friend
假如我们忽略掉大小写和复数,可以整理出一张单词表,显示哪个单词再哪段文字,
英文单词 | 文章编号 |
a | 2 |
and | 1 |
be | 1 |
book | 1,2 |
有了这样一张表,就可以短时间内根据给定单词找到对应的文章。由于单词是有序的,查找效率很高,
索引的通用结构是:
次关键码:例如上面的英文单词
记录号表,例如上面的文章编号
其中记录号表存贮具有相同次关键字的所有记录的记录号
时间: 2024-12-22 20:05:23