饿了吗上面原来有这么多无证店铺!还是大Python比较牛逼!

先看一下抓取的截图,竟然有这么多店没有营业执照。

二、运行环境

  • python3
  • pymongo
  • requests

三、分析

首先访问饿了么主页,输入想搜寻的区域,页面随即返回附近区域店铺。

页面浏览器地址如下:

https://www.ele.me/place/wtw39y8614v4?latitude=31.237236&longitude=121.36636

打开浏览器开发者工具,分析需要抓取的数据,接着用requests抓取该页面地址,使用BeautifulSoup解析数据,竟然返回空值数据。

再次查看页面信息,向下滚动页面,发现XHR异步加载类型中有返回JSON格式数据。如下图所示:

作者:麦口胡

链接:https://www.jianshu.com/p/19c38bfa7388

來源:简书

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

其中参数:

1、longitude,latitude采用的高德坐标系对应搜索区域的经纬度

2、limit=24 每次限制返回上限24个店铺;设置再多后台最多返回30个

3、offset=24 每次返回的店铺数量,24个数量级增加,比如页面继续往下翻offset=48,72……

用循环增加offset的偏移量,就可以得到更多的店铺数据。

此页面我们需要采集name ,phone, address 即商户名称,电话,营业地址三个数据即可。一个页面可以采集24个商家数据,json数据如下图:

代码如下:

import requestsimport jsonurl=‘https://www.ele.me/restapi/shopping/restaurants?extras[]=activities&geohash=wtw39y8614v4&latitude=31.237236&limit=24&longitude=121.36636&offset=24&terminal=web‘r=requests.get(url).textd=json.loads(r)for v in d: print (v[‘name‘],v[‘phone‘],v[‘address‘])

返回结果如下:

四、代码截图

五、结果显示

在mongodb中按照地址排序,sort({address:1}) 按照地址升序排序

你学会了吗?

欢迎大家关注我的博客:ttps://home.cnblogs.com/u/Python1234

欢迎加入千人交流答疑群:125240963

原文地址:https://www.cnblogs.com/Python1234/p/9063560.html

时间: 2024-10-08 13:58:55

饿了吗上面原来有这么多无证店铺!还是大Python比较牛逼!的相关文章

饿了么购物车动画

前言 之前用饿了么印象最深刻的是联动菜单和小球飞入购物车动画,所以想看看别人是怎么实现的,但是看了很多仿饿了么的demo都是实现了一个完整的大的项目,要找到那个小模块很麻烦,所以自己将联动菜单和动画提取出来写了一个demo,方便学习. 目的只是想突出功能所以界面细节很relax,大家也relax的看看吧~ 效果图 实现功能 1. 联动菜单 1.1 用户点击左侧导航栏会跳转到相应的内容 这个很简单,给导航栏的每一个元素加一个点击事件,其实也可以通过a标签的锚点来实现 <li v-for="(

解析“饿了么”为什么会选择加入阿里新零售?

自从去年10月马云提出"新零售"概念后,相关人士都在解析.布局.然而,什么是新零售?新零售相比传统零售有什么不同?新零售能带来哪些产业机会?一时间众说纷纭,阿里说,新零售是人货场的重构,京东则认为,零售的改变其实是背后零售基础设施的改变. 抛开这些花哨的定义不说,我们可以肯定的是,零售业走到了时代的新阶段,正在经历着一场巨大的变革.今天,我们就来梳理一下,在这场零售业的变革中,关键性的几个环节将出现怎样的变化 供应链流程的变革 在新零售的时代下,供应链管理的本质其实并未发生改变,还是要

好用不需多说的微信公众号实用技巧,一起来叨叨!

至此军训之际,太阳大大当空照,火热的阳光真是好! 小编的心情也是非常的好,想一想那么多嗮黑了,饿瘦了的小学妹们,终于可以显的我好白好白啦(不是白胖白胖)! 白白瘦瘦的我现在比较容易紧张,一紧张我就...喜欢装逼... 装逼我就想到了微信,想到了微信就忍不住和大家叨叨几个超级牛逼的技巧(⊙o⊙) 牛逼的技巧一:图文封面图的获取 不知道大家是否知道如何获取,如果这个图文的封面图比较的符合你的气质,这个时候你就需要下面这样子做了 首先,在电脑上的浏览器打开文章,右键点击查看源代码 然后,点击[Ctrl

做正确的事,不做容易的事

原文<李想:"做正确的事,不做容易的事"> 本文是我(李想)在去经纬投资和他们聊天的时候,速记员帮助我把聊天的内容记录了下来的整理.因为内容量很大,所以速记会有一些记录错误的地方.我想了一下,还是使用原文重新整理了一遍,把里面的错字和错误的数据进行了修改,从而避免对阅读者的误导. 不过,仍然感谢经纬和速记的帮助,这确实是我过去十几年创业最实实在在的记录. 我也开通了长微博打赏的功能,各位大爷看的好,赏几个零花钱! 李想,汽车之家网站创始人,前任汽车之家总裁.李想是80后的典

python多线程学习记录

1.多线程的创建 import threading t = t.theading.Thread(target, args--) t.SetDeamon(True)//设置为守护进程 t.start(),启动线程 t.join(),阻塞当前线程,即使得在当前线程结束时,不会退出.会等到子线程结束之后才退出. 如果不加join语句,主线程不会等到子线程结束才结束,但却不会立即杀死该线程. 但是如果添加了SetDaemon(True),如果不加join,则会在主线程结束后马上杀死子线程. 如果join

学会拒绝摔倒“哭泣”,拒绝接受老师“溺爱”

======================================== 学习的核心是养成好的学习习惯,培养自己的学习能力!提升自己的运维思想! 这些才是学习时,你要获取的真谛,其次才是学到的知识! 学会拒绝摔倒"哭泣",拒绝接受老师"溺爱". --------你们的老男孩老师 为在线直播班2期的答疑 22:30 2016/6/2 ======================================== 老男孩的linux课程迄今为止绝对是全球最牛逼

一个普通程序员的中国梦

哈哈,题目有点大,如果我说并不是为了博眼球应该也没人相信.但是在成为程序员也快要一年了,心中有很多感慨,也推翻了自己以前的很多看法,所以这里想结合自身谈谈对程序员这个职业的一些看法. 本人15年毕业于北京某211,专业是信息与计算科学(写入党申请即视感).这个专业是调剂过去的,当时看了以为是学计算机的,想一想计算机也不错,以后可以当个黑客盗个qq号什么也不错.结果去了以后才发现学的都是数学,我各个学科中数学是最差的,差到什么地步呢,就是高中有一次考试,我们班的数学大神们不知道是不是商量好了,集体

习惯的力量笔记

什么是习惯?    1. 每个习惯有三个组成部分:一个触机(cue),让你的行动开展:一个跟该触机直接相关联的"奖励"(reward):一个惯性行为(routine),就是我们所看到的习惯性行为--触机下我们想起了那个难以抵抗的诱惑,于是习惯性的行为就出现了.    2. 习惯是自动展开的.你以为你是在为自己做决定("嗯我现在想吃冰淇淋了"),其实只是你的习惯在某个触机下自动展开了(下午三点,一个工作刚好阶段性的结束,你处在了每天都有的忙碌和无聊间歇状态,这一切触发

鸵鸟非鸟?

TQ: 有如下定义: Class 鸟{...:public virtual void Fly(){};...} Class 麻雀{...:public virtual void Fly(){...};...} Class 大雁{...:public virtual void Fly(){...};...} ...... 如果是鸵鸟不能飞,就在飞的方法里抛出异常...异常不能算是一种正常编程逻辑吧 XJ 异常并不是一种好的方法 FX·SL 异常是可以的--异常名就是NotImplException