百度地图商家爬虫

import requests,json
from bs4 import BeautifulSoup
import pandas

aa=[‘‘‘http://map.baidu.com/?newmap=1&reqflag=pcmap&biz=1&from=webmap&da_par=direct&pcevaname=pc4.1&qt=con&from=webmap&c=131&wd=%E5%81%A5%E8%BA%AB&wd2=&pn={}&nn=70&db=0&sug=0&addr=0&pl_data_type=life&pl_sub_type=%E5%81%A5%E8%BA%AB-&pl_price_section=0%2C%2B&pl_sort_type=data_type&pl_sort_rule=0&pl_discount2_section=0%2C%2B&pl_groupon_section=0%2C%2B&pl_cater_book_pc_section=0%2C%2B&pl_hotel_book_pc_section=0%2C%2B&pl_ticket_book_flag_section=0%2C%2B&pl_movie_book_section=0%2C%2B&pl_business_type=life&pl_business_id=&da_src=pcmappg.poi.page&on_gel=1&src=7&gr=3&l=10&tn=B_NORMAL_MAP&u_loc=12947364,4845057&ie=utf-8&b=(12944120,4766193;12995064,4922865)&t=1501815552268‘‘‘.format(i +1) for i in range(2103)]

all_data=[]

def url_parser(url):
    res = requests.get(url)
    soup = BeautifulSoup(res.text,‘lxml‘)
    data = str(soup).lstrip(‘<html><body><p>‘).rstrip(‘</font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></font></p></body></html>‘)
    jdata = json.loads(data)

    for i in jdata[‘content‘]:
        fdata = {
            ‘名称‘:i[‘name‘],
            ‘地址‘:i[‘addr‘],
        }
        try:
            fdata[‘电话‘]=i[‘tel‘]
        except Exception as e :
            fdata[‘电话‘] = 0

        all_data.append(fdata)

for c in aa:
    url_parser(c)
    print(len(all_data))

df =pandas.DataFrame(all_data)
df.to_excel(‘jianshen.xlsx‘,index=False)
时间: 2024-08-28 21:42:28

百度地图商家爬虫的相关文章

百度地图商家数据(联系方式、具体位置)采集方法

随着营销和商业化的需要,尤其是O2O领域,寻找电销的目标客户都是需要准备的工作,那么如何能快速找到联系方式?百度地图可能是目前已知数据最全,最大的数据中心.这里几乎包含了各行各业的数据商家数据,如医院.银行.KTV.美发等等各种数据. 百度数据采集攻略: 第一步:在百度地图搜索一下看看能不能搜出来.[改部分可略] 第二步:通过goodsbye,提供采集服务.goodsbye可以根据关键词,城市,为用户免费采集.goodsbye的官网:http://www.goodsbye.com     goo

百度地图里面搜索到的公司商家电话导出表格?怎样将把百度地图里面搜索到的公司 电话 地址 等数据导出excel里?

好多人在问:如何将百度地图里面搜索到的公司商家电话导出表格?怎样将把百度地图里面搜索到的公司 电话 地址 等数据导出excel里? 现在,很多人都在网络上找商家,联系业务. 百度地图里有很多的商家联系方式地址等数据,这便成为很多人的便捷方式.但是一个个地复制出来商家的电话,地址是一件很痛苦的事情, 于是想到开发一个程序,模拟人的操作,将所有的数据提取保存到EXCEL里. 交流学习QQ:3125547039 主要代码思路: m_objConnection.Open();             b

微信开发之附近商家地理位置计算和腾讯地图坐标转百度地图坐标的方法

原文:微信开发之附近商家地理位置计算和腾讯地图坐标转百度地图坐标的方法 腾讯地图坐标转百度坐标 案例:本次开发的系统是一个商家联盟积分系统.在全国各地都有商家联盟的网点. 要求实现的功能 a.微信粉丝通过微信号就能查看附近的商家 b.我的联盟系统统计在2公里之内的商家网点 c.并标出商家和粉丝位置的距离是多少米. d.在商家的详细介绍页面设置百度地图接入步行.公交.驾车一键导航功能 那么现在问题来了: 问题1:在做微信O2O开发的过程中,通过微信地理位置功能事件获得的是腾讯地图坐标.而我们的导航

【百度地图API】如何快速创建带有标注的地图?——快速创建地图工具+如何标注商家

原文:[百度地图API]如何快速创建带有标注的地图?--快速创建地图工具+如何标注商家 摘要: 如果你不会程序,如果你不想写代码. 如果你想拥有一张自己的地图,如果你想在该地图上标注出你商店的位置. 不要犹豫了,就使用快速创建地图工具吧! -------------------------------------------------------------------------------------- 如何快速创建地图? 一.转入百度提供的快速创建地图工具页面:http://openap

零基础掌握百度地图兴趣点获取POI爬虫(python语言爬取)(基础篇)

实现目的:爬取昆明市范围内的全部中学数据,包括名称.坐标. 先进入基础篇,本篇主要讲原理方面,并实现步骤分解,为python代码编写打基础. 因为是0基础开始,所以讲得会比较详细. 如实现目的所讲,爬取昆明市全部中学数据,就是获取百度地图上昆明市范围内所有关键字带中学的地理信息数据(兴趣点). 怎么把百度地图上的数据抓取下来呢? 以下是教程: 本篇目录如下: 1. 百度地图开放平台注册,AK获取 2.关于ak的说明 3.请求URL说明 4.百度地图坐标拾取器 5.以坐标范围获取兴趣点POI 6.

VUE之使用百度地图API

利用vue创建点餐系统,在点餐系统中需要知道商家地址信息,这时就需要借用百度地图API. 步骤一:申请百度地图密钥: 步骤二:在index.html中添加百度地图JavaScript API接口: <script type="text/javascript" src="http://api.map.baidu.com/api?v=2.0&ak=KCzp8claYra8uYAvahElV9oKUT6j7Gx1" ></script> 步

百度地图与 高德导航

概述 百度地图是百度提供的一项网络地图搜索服务,用户可以查询街道,商场,楼盘的位置,也可以找到自己附近的餐馆,学校,公园,银行等,高德导航是一款为车主用户提供的安全.易用.高效的离线手机导航软件,产品覆盖所有手机平台. 一简介 百度地图是百度提供的一项网络地图搜索服务,覆盖了国内近400多个城市,数千个区县,在百度地图里,用户可以快速定位到自己的位置,搜索周边美食娱乐,不但可以帮你找位置,还能帮你到哪去,公交,驾车,步行三种出行方式任你选择!还有蚯蚓路线.免费语音导航.时间胶囊让你出行无忧. 高

百度地图api2.0体验

前言:这两天在做百度地图的功能,查看了百度官网的api完成了基本功能 api地址http://developer.baidu.com/map/jshome.htm 注意是javascript API 大众版2.0 废话不说先上图 一.导入百度地图api <script type="text/javascript" src="/Scripts/jquery.min.js"></script> <script src="http:

百度地图的O2O思考:从工具化到服务化

前言:在O2O时代,每个地图都在画自己的O2O生态圈.在这个生态圈里,代理服务商.系统架构供应商.服务提供商.金融支付供应商与消费者有机地结合在一起. 百度世界大会上,李彦宏带着新产品“度秘”又秀了一把技术帝是如何做服务的,同时,百度不出意外地将各产品布局落子O2O服务.其中,作为O2O服务入口的百度地图打出了突破基础功能,向生活服务平台转型的迭代核心. 作为出行工具,地图时刻都在为人们提供出行的便利.传统的移动端数字地图服务,基本是围绕LBS功能开发上线的.作为地图这样的产品,在移动互联网 时