都说Python找不到工作？那这些岗位都是什么？零基础爬智联！

前言

作为一名准备转行数据分析的小白，我先接触到的是网络爬虫学习，每次爬虫运行都有新的bug收获，通过不断debug，终于稍微能爬一些数据了，在此想和大家分享一下~

私信小编007即可获取小编精心准备的PDF十套哦!

看看最后一页搜索结果

。

PS:小技巧，在页面下部跳转页面输入一个很大的数字，比如10000可以跳到最后一页。

右键查看网页源代码，CTRL+F搜索关键要爬取信息，如下图红框内容

页面红框上的大数据分析师字样竟然搜不到！！！

可能藏在json文件里了

那就再试试，搜一下数据分析师

这下总算有了

为什么会这样呢，经过检查发现：

大和后面的数据分析中间有个<b>标签，这是什么意思，吓得我赶紧百度了一下

设置成粗体？exm？好吧图上确实是显示粗体

继续观察源代码，发现我想要的信息都在这（下图红框），看来不用抓包分析辣~

没时间解释了，快上车！

好吧，你根本不是司机，开始写代码。。。

以上是设置路径和为最后数据写入excel文件做铺垫

result11=[]

result21=[]

result31=[]

result41=[]

result51=[]

建立五个空的列表放我要抓的最终信息

里面没有中文啊，复制出来访问看看。

果然一样！！！

注意到这个url最后有个p=1，这很可能是页码，我换成5试试吧

看上图，果然是这样，我试试最后第90页

range（1，91）循环爬取1~90页，p="+str(k)是为了构造循环网址（我要把90页全爬下来）

通过观察网页构造选择正则提取

每次提取一页中的所有信息不断循环存在result11~51的列表里

结果如下图

一共5221条数据，并不是网页搜索的12354条，这活生生被吃了一半不止啊！

我又运行了一下，果然数量不一样了，好吧。。。这个问题还有待解决，麻烦各位dalao懂的话留言提醒一下小弟

这个<b></b>标签看着难受，用excel做点后处理

查找替换

报错了额

原来我默认的是wps打开，换成office的excel打开之后操作结果如下

是不是好多了呢，有机会以后继续谢谢针对本数据后续的数据分析~

完整代码如下：

代码运行大概15~20second

原文地址：https://www.cnblogs.com/PY1780/p/9343433.html

时间： 2024-10-10 04:09:46

都说Python找不到工作？那这些岗位都是什么？零基础爬智联！的相关文章

他学习一年Python找不到工作;背后肯定是有原因的;大佬都说你别再学Python了!

引言: 都说,滴水穿石非一日之功.然而有些人即使奋斗一辈子也比不上别人一年,别人学习一年比不得你学习一个月.其中缘由,有些人看了大半辈子还没看明白. 即使Python这么火,为何你学习一年的Python还找不到工作? 我认为有以下四点非常关键: 1,功利心强: 急需赚钱之人,所以才会着重强调"赚钱"这个字眼.如果越是功力心强,进取心弱,越着急学,越学不明白. 2,基础薄弱: Python编程零基础的人,或者是基础十分薄弱之人,所在的工作岗位应该也涉及不到计算机编程,那么也许你也许还是一

python找出一个正序反序都相等的数字（例如28682）

直接上代码 #coding:utf-8 def f1(x): #定义一个函数,查找正序反序都相等的数字 if type(x) !=int: #如果函数参数不是整型,退出程序 exit('must a int type') x=str(x) lix=list(x) str1='' i=len(lix)-1 while i <len(lix) and i >=0: #循环的作用是将字符串从尾到头重新组合相加一次 str1=str1+lix[i] i=i-1 if x==str1: #如果源字符串和

使用Python开发一个超级简单的接水果小游戏，零基础也可以学会

Pylash项目地址创建项目这样的话我们的项目就创建好了,然后只用往Main.py里填写代码运行即可. 编写Hello World小程序编写游戏有以上对pylash的小小了解,我们接下来可以开始编写游戏了.首先我们把第四行以后所有代码删除. 引入所需全局变量游戏里面要用到一些全局变量,大家先浏览一遍,不同知道它们是干什么的,之后会用到: 加载资源创建开始界面在main函数中我们调用了gameInit函数,所以添加这个函数: 开始游戏舞台层鼠标点击事件的监听器是startGame

“学了半年 Python，还是找不到工作”不如回家卖红薯！

在编程界,Python是一种神奇的存在.有人认为,只有用Python才能优雅写代码,提高代码效率:但另一部分人恨不能把Python喷成筛子.那么,Python到底有没有用,为什么用Python找不到工作?Python: 创一个小群,供大家学习交流聊天如果有对学python方面有什么疑惑问题的,或者有什么想说的想聊的大家可以一起交流学习一起进步呀.也希望大家对学python能够持之以恒python爱好群,如果你想要学好python最好加入一个组织,这样大家学习的话就比较方便,还能够共同交流和分享资

编程零基础应当如何开始学习 Python？

提前说一下,这篇福利多多,别的不说,直接让你玩回最有手感的怀旧游戏,参数贴图很方便自己可以根据喜好修改哦. 本篇通过以下四块展开,提供大量资源对应. 选一个好版本有没有看过<在下坂本,有何贵干?>那个坂本可以装B,Python的版本则是你的工作环境. 首先,在学习之前一定会考虑一个问题--Python版本选择对于编程零基础的人来说,选择Python3. 1.学习基础知识首先,Python 是一个有条理的.强大的面向对象的程序设计语言.建议从下面课程开始: Python 教程 Python

零基础如何开始学习 Python？看完这篇从小白变大牛！

1.选择Python版本对于Python工程师来说,Python的版本则是你们的工作环境.所以在学习之前一定要考虑选择一个合适自己的版本,Python3对零基础的小白很友好,易上手.选好版本后就可以开始学习了.创一个小群,供大家学习交流聊天如果有对学python方面有什么疑惑问题的,或者有什么想说的想聊的大家可以一起交流学习一起进步呀.也希望大家对学python能够持之以恒python爱好群,如果你想要学好python最好加入一个组织,这样大家学习的话就比较方便,还能够共同交流和分享资料,给你

零基础学习hadoop到上手工作线路指导（编程篇）

问题导读:1.hadoop编程需要哪些基础?2.hadoop编程需要注意哪些问题?3.如何创建mapreduce程序及其包含几部分?4.如何远程连接eclipse,可能会遇到什么问题?5.如何编译hadoop源码? 阅读此篇文章,需要些基础下面两篇文章零基础学习hadoop到上手工作线路指导(初级篇) 零基础学习hadoop到上手工作线路指导(中级篇)如果看过的话,看这篇不成问题,此篇讲hadoop编程篇. hadoop编程,hadoop是一个Java框架,同时也是编程的一次革命,使得传统开发运

零基础学习hadoop到上手工作线路指导（中级篇）

此篇是在零基础学习hadoop到上手工作线路指导(初级篇)的基础,一个继续总结. 五一假期:在写点内容,也算是总结.上面我们会了基本的编程,我们需要对hadoop有一个更深的理解: hadoop分为hadoop1.X.hadoop2.X,并且还有hadoop生态系统.这里只能慢慢介绍了.一口也吃不成胖子. hadoop 1.x分为 mapreduce与hdfs其中mapreduce是很多人都需要迈过去的槛,它比较难以理解,我们有时候即使写出了mapreduce程序,但是还是摸不着头脑. 我们不知

Python零基础学习系列之二--Python介绍及环境搭建

1-1.Python简介: Python是一种解释型.面向对象.动态数据类型的高级程序设计语言.Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年.像Perl语言一样, Python 源代码同样遵循 GPL(GNU General Public License)协议. Python(英国发音:/?pa?θ?n/ 美国发音:/?pa?θɑ?n/), 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第