免费百度地图矢量下载工具V5.7发布了,可以在 https://download.csdn.net/download/niudieyi/10669822 下载。没有CSDN积分的可以加QQ群 732173652 下载。主要更新为POI下载提供简单和复杂版本的关键字。同时提供了软件使用文档。
最近闲来无事,写了一个使用文档。内容如下:
免费百度地图矢量数据爬取器V5.7使用手册
一、软件安装
软件无需安装,直接运行文件夹下的 “百度地图矢量数据下载.exe” 即可
二、软件使用
软件主界面如下图所示:
软件提供POI下载、行政区划下载、学校面下载、小区面下载、道路线下载等功能。接下来逐个介绍:
POI爬取
POI,即兴趣点。相信搜到这个软件的应该都知道这个概念。同样,Shapefile的概念我也就不多介绍了,不了解的可以去问问度娘。
要想在百度地图上爬取POI相关信息,一般需要申请key,调用百度地图API才可以,免费key的调用次数是有限的。但是,本软件是不需要申请key的。具体如何实现不细说,想知道的可以参考源码。
接下来介绍一下每一个参数的设置:
1、选择数据来源:本软件POI数据爬取提供百度地图和搜狗地图两种POI数据的爬取,按需选择即可。
2、选择输出POI的坐标系:支持输出为bd09ll(百度经纬度坐标)、bd09mc(百度米制墨卡托投影坐标)、gcj02(国测局经纬度坐标系)、wgs84(地球经纬度坐标系)。这些坐标系对于新手来说可能看着有点晕乎,可以结合https://cnodejs.org/topic/564c0a27e4766d487f6fe38d文章了解一下。简单来说,就是wgs84是国际标准,gcj02是在wgs84上的一次加密,bd坐标系是在gcj02的进一步加密。按需选择即可。
3、选择存储POI的txt文件
4、选择包含关键字的txt文件:要下载POI数据,必须提供关键字,关键字越多,下载得到的POI数据越全。本软件提供简单和复杂两个版本的关键字,存储在conf路径下。KeyWord.txt是简单版本,KeyWord_Many是复杂版本。只有如果要自定义关键字,打开文件修改内容即可。
5、请输入城市:城市名一般不包含市,如果不确定可以参考conf路径下的BaiDuCityCode.txt文件。
6、请输入线程数:POI下载支持多线程,使用多线程下载时会将数据临时存储到conf\tempfiles文件夹下,等全部下载完成后再合并到第3步设置的存储POI的txt文件中。
TXT转SHP
在前面将POI爬取到txt文件中后,为了方便使用。提供此功能,将txt文件转换shp文件。
如果遇见输出shp文件属性表乱码,则将txt文件用记事本打开,另存为ANSI格式,然后再转即可。
转换为shp数据以后属性表包括如下图所示,UID是百度地图的唯一标识符,KeyWord是爬取关键字、BdSmallTag是百度小标签,BdBigTag是百度大标签。
行政区划爬取
参数设置很简单,就不具体介绍,这里主要介绍一下行政区划数据爬取得数据来源。经常逛百度地图的小伙伴可能会知道,从2017年左右开始,当我们在百度地图搜索某一个行政区划时,百度地图会返回一个矢量形式的范围在前端进行渲染。
如下图所示:
既然能在前端渲染矢量,那数据一定市可以抓取的。本软件就实现了该功能。
学校面爬取
参数设置也比较简单,坐标系统可以参考前面POI爬取。不做过多介绍。与行政区划类似,当我们在百度地图上搜索学校时,也会返回一个矢量范围进行前端渲染。以笔者的母校为例:
此功能会自动爬取中学和大学学校矢量范围。输出shp。
小区\道路爬取
参数设置也比较简单,坐标系统可以参考前面POI爬取。不过小区和道路的爬取是基于关键字进行爬取的,关键字来自图吧(http://www.mapbar.com/)。爬取的数据不是很完善。爬取时是按照关键字第一个字拼音a-z排序的。
三、爬取数据处理(POI、小区、道路)
经过前面的爬取过后,生成的shp格式的数据,但是爬取的数据中POI和小区数据是有重复的,还需要使用ArcMap的Delete Identical进行进一步的去重处理。
以POI数据为例:找到Delete Identical工具,然后根据百度地图的唯一标识符UID进行去重。
在POI去重中,如果不会使用ArcMap也可以在Excel中根据UID去重后再进行TXT转SHP,如此即可。
对于道路数据,不需要进行去重,但是需要进行融合,在ArcMap中找到Dissolve工具,依据UID进行融合。
四、效果图
合肥
北京
原文地址:https://www.cnblogs.com/niudieyi/p/9655820.html