都说Python找不到工作?那这些岗位都是什么?零基础爬智联!

前言

作为一名准备转行数据分析的小白,我先接触到的是网络爬虫学习,每次爬虫运行都有新的bug收获,通过不断debug,终于稍微能爬一些数据了,在此想和大家分享一下~

私信小编007即可获取小编精心准备的PDF十套哦!

看看最后一页搜索结果

PS:小技巧,在页面下部跳转页面输入一个很大的数字,比如10000可以跳到最后一页。

右键查看网页源代码,CTRL+F搜索关键要爬取信息,如下图红框内容

页面红框上的 大数据分析师 字样竟然搜不到!!!

可能藏在json文件里了

那就再试试,搜一下 数据分析师

这下总算有了

为什么会这样呢,经过检查发现:

大和后面的数据分析中间有个<b>标签,这是什么意思,吓得我赶紧百度了一下

设置成粗体?exm?好吧 图上确实是显示粗体

继续观察源代码,发现我想要的信息都在这(下图红框),看来不用抓包分析辣~

没时间解释了,快上车!

好吧,你根本不是司机,开始写代码。。。

以上是设置路径和为最后数据写入excel文件做铺垫

result11=[]

result21=[]

result31=[]

result41=[]

result51=[]

建立五个空的列表放我要抓的最终信息

里面没有中文啊,复制出来访问看看。

果然一样!!!

注意到这个url最后有个p=1,这很可能是页码,我换成5试试吧

看上图,果然是这样,我试试最后第90页

range(1,91)循环爬取1~90页,p="+str(k)是为了构造循环网址(我要把90页全爬下来)

通过观察网页构造选择正则提取

每次提取一页中的所有信息不断循环存在result11~51的列表里

结果如下图

一共5221条数据,并不是网页搜索的12354条,这活生生被吃了一半不止啊!

我又运行了一下,果然数量不一样了,好吧。。。这个问题还有待解决,麻烦各位dalao懂的话留言提醒一下小弟

这个<b></b>标签看着难受,用excel做点后处理

查找替换

报错了额

原来我默认的是wps打开,换成office的excel打开之后操作结果如下

是不是好多了呢,有机会以后继续谢谢针对本数据后续的数据分析~

完整代码如下:

代码运行大概15~20second

原文地址:https://www.cnblogs.com/PY1780/p/9343433.html

时间: 2024-08-05 20:43:34

都说Python找不到工作?那这些岗位都是什么?零基础爬智联!的相关文章

他学习一年Python找不到工作;背后肯定是有原因的;大佬都说你别再学Python了!

引言: 都说,滴水穿石非一日之功.然而有些人即使奋斗一辈子也比不上别人一年,别人学习一年比不得你学习一个月.其中缘由,有些人看了大半辈子还没看明白. 即使Python这么火,为何你学习一年的Python还找不到工作? 我认为有以下四点非常关键: 1,功利心强: 急需赚钱之人,所以才会着重强调"赚钱"这个字眼.如果越是功力心强,进取心弱,越着急学,越学不明白. 2,基础薄弱: Python编程零基础的人,或者是基础十分薄弱之人,所在的工作岗位应该也涉及不到计算机编程,那么也许你也许还是一

python找出一个正序反序都相等的数字(例如28682)

直接上代码 #coding:utf-8 def f1(x): #定义一个函数,查找正序反序都相等的数字 if type(x) !=int: #如果函数参数不是整型,退出程序 exit('must a int type') x=str(x) lix=list(x) str1='' i=len(lix)-1 while i <len(lix) and i >=0: #循环的作用是将字符串从尾到头重新组合相加一次 str1=str1+lix[i] i=i-1 if x==str1: #如果源字符串和

使用Python开发一个超级简单的接水果小游戏,零基础也可以学会

Pylash项目地址 创建项目 这样的话我们的项目就创建好了,然后只用往Main.py里填写代码运行即可. 编写Hello World小程序 编写游戏 有以上对pylash的小小了解,我们接下来可以开始编写游戏了.首先我们把第四行以后所有代码删除. 引入所需 全局变量 游戏里面要用到一些全局变量,大家先浏览一遍,不同知道它们是干什么的,之后会用到: 加载资源 创建开始界面 在main函数中我们调用了gameInit函数,所以添加这个函数: 开始游戏 舞台层鼠标点击事件的监听器是startGame

“学了半年 Python,还是找不到工作”不如回家卖红薯!

在编程界,Python是一种神奇的存在.有人认为,只有用Python才能优雅写代码,提高代码效率:但另一部分人恨不能把Python喷成筛子.那么,Python到底有没有用,为什么用Python找不到工作?Python: 创一个小群,供大家学习交流聊天如果有对学python方面有什么疑惑问题的,或者有什么想说的想聊的大家可以一起交流学习一起进步呀.也希望大家对学python能够持之以恒python爱好群,如果你想要学好python最好加入一个组织,这样大家学习的话就比较方便,还能够共同交流和分享资

编程零基础应当如何开始学习 Python?

提前说一下,这篇福利多多,别的不说,直接让你玩回最有手感的怀旧游戏,参数贴图很方便自己可以根据喜好修改哦. 本篇通过以下四块展开,提供大量资源对应. 选一个好版本 有没有看过<在下坂本,有何贵干?>那个坂本可以装B,Python的版本则是你的工作环境. 首先,在学习之前一定会考虑一个问题--Python版本选择对于编程零基础的人来说,选择Python3. 1.学习基础知识 首先,Python 是一个有条理的.强大的面向对象的程序设计语言.建议从下面课程开始: Python 教程 Python

零基础如何开始学习 Python?看完这篇从小白变大牛!

1.选择Python版本 对于Python工程师来说,Python的版本则是你们的工作环境.所以在学习之前一定要考虑选择一个合适自己的版本,Python3对零基础的小白很友好,易上手.选好版本后就可以开始学习了.创一个小群,供大家学习交流聊天如果有对学python方面有什么疑惑问题的,或者有什么想说的想聊的大家可以一起交流学习一起进步呀.也希望大家对学python能够持之以恒python爱好群,如果你想要学好python最好加入一个组织,这样大家学习的话就比较方便,还能够共同交流和分享资料,给你

零基础学习hadoop到上手工作线路指导(编程篇)

问题导读:1.hadoop编程需要哪些基础?2.hadoop编程需要注意哪些问题?3.如何创建mapreduce程序及其包含几部分?4.如何远程连接eclipse,可能会遇到什么问题?5.如何编译hadoop源码? 阅读此篇文章,需要些基础下面两篇文章零基础学习hadoop到上手工作线路指导(初级篇) 零基础学习hadoop到上手工作线路指导(中级篇)如果看过的话,看这篇不成问题,此篇讲hadoop编程篇. hadoop编程,hadoop是一个Java框架,同时也是编程的一次革命,使得传统开发运

零基础学习hadoop到上手工作线路指导(中级篇)

此篇是在零基础学习hadoop到上手工作线路指导(初级篇)的基础,一个继续总结. 五一假期:在写点内容,也算是总结.上面我们会了基本的编程,我们需要对hadoop有一个更深的理解: hadoop分为hadoop1.X.hadoop2.X,并且还有hadoop生态系统.这里只能慢慢介绍了.一口也吃不成胖子. hadoop 1.x分为 mapreduce与hdfs其中mapreduce是很多人都需要迈过去的槛,它比较难以理解,我们有时候即使写出了mapreduce程序,但是还是摸不着头脑. 我们不知

Python零基础学习系列之二--Python介绍及环境搭建

1-1.Python简介: Python是一种解释型.面向对象.动态数据类型的高级程序设计语言.Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年.像Perl语言一样, Python 源代码同样遵循 GPL(GNU General Public License)协议. Python(英国发音:/?pa?θ?n/ 美国发音:/?pa?θɑ?n/), 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第