2020寒假 12

发现一个问题:

bs4 FeatureNotFound: Couldn‘t find a tree builder with the features you requested: lxml. Do you need to install a parser library?

解决方法:将"lxml"改成"html.parser"

soup = BeautifulSoup(content, "lxml")改成

soup = BeautifulSoup(content, "html.parser")

今天学习了关于python中beautiful soup的一些内容

了解到soup.find_all("tr",attrs={"class":"alt"})中的树形结构以及contents的使用

运行了简单的爬取中国大学排名的代码,结合网页源代码进行python源码分析理解

 1 import requests
 2 from bs4 import BeautifulSoup
 3
 4 headers = {
 5     "User-Agent": "Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14"
 6 }
 7 response = requests.get("http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html", headers=headers)
 8 response.encoding = "utg-8"
 9 if response.status_code == 200:
10     soup = BeautifulSoup(response.text,"html.parser")
11     trTags = soup.find_all("tr",attrs={"class":"alt"})
12     for trTag in trTags:
13         id = trTag.contents[0].string
14         name = trTag.contents[1].string
15         addr = trTag.contents[2].string
16         sco = trTag.contents[3].string
17         sco1 = trTag.contents[4].string
18         print(f"{id} {name} {addr} {sco} {sco1}")
19     #代码来源于网络,比较简单

代码运行结果:

原文地址:https://www.cnblogs.com/lixv2018/p/12288915.html

时间: 2024-11-09 02:47:44

2020寒假 12的相关文章

窦小凤2020寒假学习心得

2020年1-2月寒假学习心得—窦小凤 一.学习成果 赛事准备上,每天坚持做题,完成代码量6000行(其中还包括了很多知识点学习上的代码). 学习python基础,对python有了基本认识,完成代码1500行(但其中基本都是python中的基础语法) 选择性学习了一些用Java语言讲的数据结构与算法. 前期主要是将Java的基础视频重看了一遍(主要是在学校的时候没认真),然后从最基础入门开始做起,到寒假末来看,自身在Java方面跟在大一上学期还是有较大进步,但仍还有很长的路要走. Python

2020 寒假记录(一)

2020 冬 寒假记录(一) 费解的开关 https://vijos.org/p/1197 当第 \(i\) 行的状态确定了之后,只有第 \(i+1\) 行可以影响它,也就是翻完第一行后,后面每一行的操作也就是确定的了,所以枚举第一行的32种状态即可. 深搜 #include <iostream> #include <algorithm> #include <cstdio> using namespace std; int dir[4][2] = { {0,-1},{0

2020寒假训练计划

今天是2019年的最后一天了,按照计划.应当对Python有了初步了解,Linux基础操作比较熟悉. 是时候分一下方向了,首先看看各个方向该学些什么. Web PHP 在Web通常是以代码审计.PHP各种协议.特性等等情况出现.基础要求是看懂题中的PHP代码,然后要对题目中常见绕过方法有了解.因此,PHP语言上,要学习到面对对象,能了解PHP序列化和反序列化及各种魔法方法.还要多刷题,了解题目的一些常见的考点,针对考点学习. SQL 要学习SQL注入首先要会SQL的基础语法,SQL语法比较简单,

【置顶】技术每天一点点--2020.01-2020.12

  序号 主题 日期 内容 备注   01 补码,原码,反码 2020.01.01 补码:https://baike.baidu.com/item/补码/6854613?fr=aladdin ==就是因为有模的存在,减法变成了加法 a-b = a+(mod-b) == 负数的补码是其各位取反(符号位为0时变成1,符号位为1时不变化).后加1                                                     原文地址:https://www.cnblogs.c

2020.1.6 ~ 2020.1.12 阅读小结

一周阅读总结(1.6-1.12) 本周主要在看Operation System:3 Easy Pieces,看了5章,不知为何虽然序言里推荐要先读完CSAPP,但是感觉本书比CSAPP简单 OSTEP: cpu-intro 介绍进程,CPU通过分时复用处理多进程,实现CPU资源的虚拟化 OSTEP: cpu-api 以shell交互为例,介绍UNIX系统fork(),wait(),exec()系列函数的使用,Java写多了,确实会感觉这些UNIX API不够友好 ,有时间写个文章总结下.作者还专

FZU ICPC 2020 寒假训练 6 —— 字符串处理

P1603 斯诺登的密码 题目描述 2013年X月X日,俄罗斯办理了斯诺登的护照,于是他混迹于一架开往委内瑞拉的飞机.但是,这件事情太不周密了,因为FBI的间谍早已获悉他的具体位置--但这不是最重要的--最重要的是如果要去委内瑞拉,那么就要经过古巴,而经过古巴的路在美国的掌控之中. 丧心病狂的奥巴马迫降斯诺登的飞机,搜查时却发现,斯诺登杳无踪迹.但是,在据说是斯诺登的座位上,发现了一张纸条.纸条由纯英文构成:Obama is a two five zero.(以"."结束输出,只有6个

2020年1--2月学习心得 闫秋婷

一.写出自己寒假整个8周具体技术学习收获,所花时间及完成代码量.如在某些技术上所学习的哪些知识点,统计所花费的总小时,代码总行数.是否和预期的寒假学习目标相符,达到80小时,2000行代码量等,并对自身制定计划和执行能力做一个自我评价,如学习计划是否合理,行动执行力如何? 1.原定目标是80小时,但是只学习了50小时左右,并没有达到原定目标.主要是因为自身没有很好的自律.前八周呢主要是看了python语言程序设计的mooc课程,并学习打了里面的代码.完成代码量加起来大约有500行上下.很显然仍有

2020.4.12 个人rating赛 解题+补题报告

A. Balloons  1.题意 有n包气球,每包气球有ai个,将这n包气球以包为单位全部分给两个人,要求每人至少有一包气球且两人气球总个数不能相等.  2.题解 用结构体将n包气球的编号和气球数存起来,按每包气球个数排序后,如果第一包气球的个数不为总个数的一半,满足题意.  3.代码 1 #include<bits/stdc++.h> 2 using namespace std; 3 int n; 4 struct node{ 5 int id,x; 6 }a[15]; 7 bool cm

寒假 12 (表的链表实现彻底结束,find kth未解决)

表:元素,元素个数,元素相对关系:元素操作:find,delete,insert,print,make null 简单数组实现: 元素都被加上了有自然顺序节点的链条,要预先估计一个较高的长度,有空间浪费.每次insert或delete时,因为自然节点固定要整体移动,占用时间. 链表实现: 不连续存储,概念里没有固定的位置编号,仅可以从value上识别,寻找,一个element或一个位置:或者直接用绝对地址调用 具体步骤:建立node结构并连缀,处理函数实现 相关技巧: 使用typedef,对该结