/**************************************************************
技术博客
http://www.cnblogs.com/itdef/
技术交流群
群号码:324164944
欢迎c c++ windows驱动爱好者 服务器程序员沟通交流
**************************************************************/
由于工作关系,需要写一个类似于字典的key value的小代码。根据给予的唯一性的ID给出该网点的名称、地址、联系方式等信息
一开始考虑是将全部信息放于内存中,使用map容器,便于查找。
但是扩展延伸下,如果数据量巨大,内存无法一次放下呢? 量变引起质变。
假设一个巨大的数据文件,6G大小,那么这个文件的数据就需要组织下,不能随意排列,需要额外建立一个索引文件,方便我们迅速定位需要的数据在文件中的问题。
而内存中就不再是简单的使用标准库的map结构了,而是采用了hash和链表数据结构
当获取当需要查找的网点的ID或者名称,我们首先在内存中查找,根据网点的名称或者ID的hash值 找到对应的槽,遍历槽中的链表找到数据信息。如果查找到,该数据在链表位置需要提前。 因为链表的位置表示该数据块被访问的频率。 一定周期后,末尾的数据块将被删除以便节省资源,因为它们没被访问到。
如果内存中没有查找到,则查找磁盘上的索引文件,得出网点在大数据文件中的位置,将它读出,载入内存
时间: 2024-11-13 07:24:23