python3 requests 获取 拉勾工作数据

 1 #-*- coding:utf-8 -*-
 2 __author__ = "carry"
 3
 4 import requests,json
 5
 6 for x in range(1, 15):
 7     url =‘http://www.lagou.com/jobs/positionAjax.json‘
 8     #proxies = {"http":"http://125.105.17.229:808"}
 9     headers={‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36‘}
10     payload = {"city":"杭州", "district":"西湖区", "needAddtionalResult":"false", "first":"true", "pn":x, "kd":"测试"}
11     result = requests.post(url,data=payload,headers=headers)
12     #result = requests.post(url,data=payload,proxies=proxies)
13     result_json = result.json()
14     print(result_json)
15
16     l = result_json["content"]["positionResult"]["result"]
17     for x in l:
18         s = "岗位名称:%s,公司名:%s,业务:%s,工作年限:%s,工资:%s" 19         % (x["positionName"],x["companyFullName"],x["industryField"],x["workYear"],x["salary"])
20
21         with open("D:\\lagou.txt", "a+", encoding="utf-8") as f:
22             f.write(s)
23             f.write("\n")
时间: 2024-12-25 17:15:49

python3 requests 获取 拉勾工作数据的相关文章

python3抓取到的拉勾数据统计

趁着最近有时间写了个拉勾爬虫抓取了后端.前端和移动端技术岗位的数据,总共大约6多万条记录,对其取前十名进行统计 按地域划分: 可以看出北上广深杭的数量远远超出其它城市,机会相对较多 2. 按融资阶段来看: 初创型未融资的居多,已上市及A轮的差不多,C轮是最少的,难道就是传说中的C轮魔咒 3. 按所需最低学历来看: 本科占绝对主力,大专次之,看来这行还是有一定的门槛 4. 按行业领域来看: 移动互联网占绝对统治地位,这是响应"大众创业,万众创新"的互联网+? 5. 按职位类型来看: 0,

python3爬虫-通过requests获取拉钩职位信息

import requests, json, time, tablib def send_ajax_request(data: dict): try: ajax_response = session.post(url=ajax_url, params={"needAddtionalResult": "false", "city": city}, data=data, headers=ajax_headers, timeout=timeout) i

UWP 拉勾客户端

前些天, 用 Xamarin.Forms (XF) 将就着写了个拉勾的 UWP 和 Android 的客户端. XF 对 Android  和 IOS 的支持做的很到位, 但是对 UWP 的支持目前仅限于预览版, "预留" 了很多BUG. 本想着等 Xamarin 团队尽快发部更新, 我好改掉这些 BUG, 但是苦等了个把月, 发部的 DLL 不但没有修改我所遇到的这些 BUG, 反而 BUG 越来越多了... 算鸟, 我也不等你了, 直接新开个项目, 直接写个 UWP 的... 源码

爬取拉勾部分求职信息+Bootstrap页面显示

今天在用python实现爬虫的时候,就想看一下用c#实现同样的功能到底会多出来多少code,结果写着写着干脆把页面也简单的写一个出来,方便调试, 大致流程如下: 1.分析拉勾数据 2.查找拉勾做了哪些反爬虫限制 3.抓取数据,show page 过程中用到一个HtmlAgilityPack第三方库,获取热门城市的时候使用XPath表达式抓取数据 解析JSON使用的是JSON.NET,一如既往的好用 github:https://github.com/hxd1230/XD.Job.Spider.g

程序员的进化 - 在拉勾1024程序员节上的演讲

注:以下本文来自于我在拉勾网1024程序员节上的现场演讲. 我是蒋宇捷,信天创投的合伙人,之前是百度魔图的联合创始人. 我先做个自我介绍,其实每次介绍自己其实是很痛苦的事情,因为我前不久在拉勾的分享刚刚介绍过.开个玩笑,我希望再过几年,只要站到这里大家都认识我,不用再做自我介绍,这才是我的人生目标. 王啸刚才分享的经历非常直接,创业成功就开始做天使投资.我的经历比较类似,但是更曲折,工作7年,经历过4家公司. 我最开始在傲游,是创业团队的第11号员工,在这家公司呆了3年的时间.后来2010年我去

使用nodejs爬取拉勾苏州和上海的.NET职位信息

最近开始找工作,本人苏州,面了几家都没有结果很是伤心.在拉勾上按照城市苏州关键字.NET来搜索一共才80来个职位,再用薪水一过滤,基本上没几个能投了.再加上最近苏州的房价蹭蹭的长,房贷压力也是非常大,所以有点想往上海去发展.闲来无聊写了个小爬虫,爬了下苏州跟上海的.NET职位的信息,然后简单对比了一下. 是的小弟擅长.NET,为啥用nodejs?因为前几天有家公司给了个机会可以转nodejs,所以我是用来练手的,不过后来也泡汤了,但是还是花两晚写完了.刚学,代码丑轻喷哈! 一:如何爬取拉勾的数据

模拟拉勾鼠标移入效果1

今天逛拉勾,发现一个漂亮的效果,晚上按捺不住,自己尝试敲了出来,以便日后温故知新. <!-- 你的html代码,以下是样板 --> <!doctype html> <h1>测试一口吧!</h1> 运行代码

拉勾上的一道题目

在拉勾上看到一道题目,或许有很多精妙的做法,欢迎讨论,集思广益.题目如下: FizzBuzzWhizz你是一名体育老师,在某次课距离下课还有五分钟时,你决定搞一个游戏.此时有100名学生在上课.游戏的规则是: 1. 你首先说出三个不同的特殊数,要求必须是个位数,比如3.5.7. 2. 让所有学生拍成一队,然后按顺序报数. 3. 学生报数时,如果所报数字是第一个特殊数(3)的倍数,那么不能说该数字,而要说Fizz:如果所报数字是第二个特殊数(5)的倍数,那么要说Buzz:如果所报数字是第三个特殊数

js 也来 - 【拉勾专场】抛弃简历!让代码说话!

前些日子谢亮兄弟丢了一个链接在群里,我当时看了下,觉得这种装逼题目没什么意思,因为每种语言都有不同的实现方法,你怎么能说你的方法一定比其他语言的好,所以要好的思路 + 好的语言特性运用才能让代码升华. 题目如下:<[拉勾专场]抛弃简历!让代码说话!> ? FizzBuzzWhizz 你是一名体育老师,在某次课距离下课还有五分钟时,你决定搞一个游戏.此时有100名学生在上课.游戏的规则是: 1. 你首先说出三个不同的特殊数,要求必须是个位数,比如3.5.7. 2. 让所有学生拍成一队,然后按顺序