英语学习自测神器——用python爬虫打造专属英文词汇量测试脚本!

英语是现在传播很广的一门语言,它是由26个字母组成,像小编这种小时候不喜欢学英语的人,一直都是看见英语就头大。后来发现这东西不学不行,还是咬着牙学了。大家应该都知道学习英语,最重要的是词汇量,所以今天我们就用python做一个小的爬虫,然后自己写一个脚本来实现这个功能吧!

目标:打造一个英文词汇量测试脚本

url:

扇贝网

工具:

python3.6、pycharm、requests库

思路:

和网页一样,总共分三步:

先来看看网页中数据,用F12开发者工具抓包就可以

为了更好的演示,这里网页缩小了。

点击开始,在来看看出现了什么

这里我们抓到了一个包,这个json数据中包含了所有的类别或者说是级别,一共十大类,我们点击”响应”验证下

可以看到,显示内容在我们抓到的json数据中,但是0和1中的内容有的一样,有的不一样是什么鬼?不要急,我们先选择‘高考’,在抓下包看看

选择高考后,网页直接给出了第二步,50个单词选择,注意,先看下抓到的json数据的真实地址

还记得我们在第一步抓到的包吗?0里面就是这个真实地址最后的category的值,1里面是对应的显示在网页中的内容,好了,第二步的真实url也被我们找到规律了,那下来就是分析单词了,看看有什么规律,我们点开一个看看

有几个值非常重要,也是我们的目标:

Content的值是显示的单词

Definition_choices是需要我们判断的多个词义,中间包含有正确的词义,每个词义中的rank值应该是该词义的标识

rank值是正确的词义,也由此判断上述多个词义中的正确词义

ok,到这里我们就可以开始写代码了,具体过程就不一一说明了,没有反爬,全部是json数据的读取和判断,先放上我的代码和运行效果

文章到此就告一段落了,喜欢本文的小伙伴欢迎转发或点波关注喔!

如果大家在学习Python的路上,或者打算学习Python需要学习资料,可以加群571799375,群里学习资料免费赠送大家喔!

本文来自网络,如有侵权,请联系小编删除!

原文地址:https://www.cnblogs.com/jiajia101/p/10243457.html

时间: 2024-11-06 07:39:45

英语学习自测神器——用python爬虫打造专属英文词汇量测试脚本!的相关文章

python爬虫—爬取英文名以及正则表达式的介绍

python爬虫—爬取英文名以及正则表达式的介绍 爬取英文名: 一.  爬虫模块详细设计 (1)整体思路 对于本次爬取英文名数据的爬虫实现,我的思路是先将A-Z所有英文名的连接爬取出来,保存在一个csv文件中:再读取csv文件当中的每个英文名链接,采用循环的方法读取每一个英文名链接,根据每个英文名链接爬取每个链接中的数据,保存在新的csv文件当中. 需要写一个爬取英文名链接的函数.将爬取的内容保存在csv文件的函数以及读取csv文件内容的函数.爬取英文名详情页内容的函数. 表5.3.1 函数名

自学Python十一 Python爬虫总结

通过几天的学习与尝试逐渐对python爬虫有了一些小小的心得,我们渐渐发现他们有很多共性,总是要去获取一系列的链接,读取网页代码,获取所需内容然后重复上面的工作,当自己运用的越来越熟练之后我们就会尝试着去总结一下爬虫的共性,试着去写个helper类以避免重复性劳动. 参考:用python爬虫抓站的一些技巧总结 zz 1.访问网站 #最简单的得到网页代码的方法 1 import urllib2 2 response = urllib2.urlopen("http://www.xx.com"

(转)Python爬虫--通用框架

转自https://blog.csdn.net/m0_37903789/article/details/74935906 前言: 相信不少写过Python爬虫的小伙伴,都应该有和笔者一样的经历吧只要确定了要爬取的目标,就开始疯狂的写代码,写脚本经过一番努力后,爬取到目标数据:但是回过头来,却发现自己所代码复用性小,一旦网页发生了更改,我们也不得不随之更改自己的代码,而却自己的程序过于脚本化,函数化,没有采用OPP的思维方式:没有系统的框架或结构. 指导老师看了笔者的爬虫作品后,便给出了以下三点建

暴力英语学习法 + 严格的目标管理 = 成功快速靠谱的学好英语

Updated: 留下邮件的同学,我已经将链接发到你们邮件了,没有留邮箱的同学,你们就自己到下面拿链接和密码下载吧.:) 园子里时不时就吹起一阵学英语的浪潮,不少同鞋表示一直想学,或者一直在学,就是效果不明显(你躺枪了么?)相信自己或者身边的人都或多或少吃了英语弱的当(你懂的,我们重点在说薪水的问题:).而各种英语成功学,方法论,版本是一个接一个层出不穷.今天我们不说为什么要学好英语,好处太多而且已经广为流传了,我们主要结合目标管理来讨论一下如何坚定不移的,快速的学好英语.以我自己的亲身经历作样

【转】暴力英语学习法 + 严格的目标管理 = 成功快速靠谱的学好英语

园子里时不时就吹起一阵学英语的浪潮,不少同鞋表示一直想学,或者一直在学,就是效果不明显(你躺枪了么?)相信自己或者身边的人都或多或少吃了英语弱的当(你懂的,我们重点在说薪水的问题:).而各种英语成功学,方法论,版本是一个接一个层出不穷.今天我们不说为什么要学好英语,好处太多而且已经广为流传了,我们主要结合目标管理来讨论一下如何坚定不移的,快速的学好英语.以我自己的亲身经历作样板,以下情况全部属实,绝无虚构. 先说说我在开始学英语之前的情况: 时间:2012年2月,已工作4.5年 词汇量:小于15

暴力英语学习法(转载)

暴力英语学习法 园子里时不时就吹起一阵学英语的浪潮,不少同鞋表示一直想学,或者一直在学,就是效果不明显(你躺枪了么?)相信自己或者身边的人都或多或少吃了英语弱的当(你懂的,我们重点在说薪水的问题:).而各种英语成功学,方法论,版本是一个接一个层出不穷.今天我们不说为什么要学好英语,好处太多而且已经广为流传了,我们主要结合目标管理来讨论一下如何坚定不移的,快速的学好英语.以我自己的亲身经历作样板,以下情况全部属实,绝无虚构. 先说说我在开始学英语之前的情况: 时间:2012年2月,已工作4.5年

Python实战:Python爬虫学习教程,获取电影排行榜

Python应用现在如火如荼,应用范围很广.因其效率高开发迅速的优势,快速进入编程语言排行榜前几名.本系列文章致力于可以全面系统的介绍Python语言开发知识和相关知识总结.希望大家能够快速入门并学习Python这门语言. 本文是在前一部分Python基础之上程序员带你十天快速入门Python,玩转电脑软件开发(四),再次进行的Python爬虫实战课程. 正则表达式实例简单详解 正则表达式干什么用? 就是在字符串中提取我们需要的内容的. 记得哦,要先引用正则表达式模块的哦. re就是正则表达式相

开始我的Python爬虫学习之路

因为工作需要经常收集一些数据,我就想通过学爬虫来实现自动化完成比较重复的任务. 目前我Python的状况,跟着敲了几个教程,也算是懂点基础,具体比较深入的知识,是打算从做项目中慢慢去了解学习. 我是觉得如果一开始就钻细节的话,是很容易受到打击而放弃的,做点小项目让自己获得点成就感路才更容易更有信心走下去. 反正遇到不懂的就多查多问就对了. 知乎上看了很多关于入门Python爬虫的问答,给自己总结出了大概的学习方向. 基础: HTML&CSS,JOSN,HTTP协议(这些要了解,不太需要精通) R

《Python爬虫学习系列教程》学习笔记

转自:http://cuiqingcai.com/1052.html 大家好哈,我呢最近在学习Python爬虫,感觉非常有意思,真的让生活可以方便很多.学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫,在这里跟大家一同分享,希望对Python爬虫感兴趣的童鞋有帮助,如果有机会期待与大家的交流. 一.Python入门 1. Python爬虫入门一之综述 2. Python爬虫入门二之爬虫基础了解 3. Python爬虫入门三之Urllib库的基本使用 4. Python爬虫