摘要
在CDN系统中,IP地址库在流量调度、网络服务质量监测等方面起到重要的作用,本文主要介绍了IP地址库的功能、内容以及IP地址库的生成和评价方法
什么是IP地址库?
所谓IP地址库,指的是提供了IP地址(段)同地理、ISP、结构等信息映射关系的一组数据
IP地址库有什么用?
IP地址库应用的场合较为广泛,下面举几个常见的例子:
(1)根据客户的IP地址确定客户来源,为后期的客户行为分析提供基础,例如需要统计学生群体的访问特点,这时我们就是通过分析来自教育网的IP地址的那些请求得到的
(2)为不同区域的用户提供不同的天气、物流、文化等信息。很多网站对于不同区域的用户提供了不同的访问内容,这些网站往往就是通过IP地址来确定用户的地域信息的
(3)区域化的广告投放。很多商家需要精准的广告投放,这就依赖于IP地址库的准确性。
(4)CDN调度系统希望将各区域的用户访问流量调度到最近的CDN节点,这点也依赖于IP地址库的准确性
(5)网站访问质量监测。 为了准确的提供各区域用户访问网站的质量,我们需要比较精确地知道访问用户所在的区域,这一点目前主要也是依靠IP地址库来实现的
IP地址库内容
IP地址库主要提供的是IP地址同下列一些常见信息的对应关系:
(1)国家、大区、省/州/区、(地级)市、县(级市)等地域信息
(2)ISP信息
(3)机构信息
(4)经、纬度
(5)详细地址
(6)路由信息
IP地址库的来源
现有很多的IP地址库,各IP库在提供者、提供信息等方面都比较相近,常见的有:
(1)APNIC(Asia-Pacific Network Information Center),亚太互联网络信息中心相关资源
IP地址段分配每日更新文件
http://ftp.apnic.net/apnic/stats/apnic/delegated-apnic-latest
whois服务方便了用户对NIC域名数据库的查询
(2)QQ纯真库 http://www.cz88.net/fox/
(3)IPInfodb http://ipinfodb.com/download.php?file=ipinfodb_one_table_full.sql.bz2
(4)MaxMind GeoIP http://geolite.maxmind.com/download/geoip/database/GeoLiteCity_CSV/GeoLiteCity_20100401.zip
IP地址库评价指标
如何评价一个IP地址库的优劣,个人觉得目前主要查看以下几个指标:
(1)粒度。所谓粒度,指的是IP地址库中IP(段)对应的其他信息的精确程度。例如,是精确到国家,还是能精确到市或县?不同的应用对IP地址库的粒度要求是不同的,但就IP地址库自身的评价指标来说,粒度越细,IP地址库的价值越大
(2)准确度。所谓准确度,指的是所提供信息的正确的程度,显然,准确度越高,IP地址库的价值越大
(3)覆盖度。所谓覆盖度,指的是对一个特定的集合,IP地址库涵盖该结合的程度。例如,中国IP(ipv4)地址有3.1亿,某IP地址库中含有中国的IP地址数为2.8亿,则覆盖度约为90%。显而易见,覆盖度越高,IP地址库越好
IP地址库的集成
不同的IP地址库在信息粒度、置信度、覆盖度等方面各有千秋,我们可以考虑将不同IP地址库的信息进行集成,原则上将,这样就能得到一个更好的IP地址库,这也是我们目前采用的思路