python,网络爬虫完整示例代码－－抓取中国最好大学排名网站信息，并进行输出显示

import requests,bs4
from bs4 import BeautifulSoup
def getHTMLText(url):
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("request failed")

def getObjectData(soup):
    li=[]
    for tr in soup.find(‘tbody‘).children:
        if isinstance(tr,bs4.element.Tag):
            tds=tr(‘td‘)
            li.append([tds[0].string,tds[1].string,tds[3].string])
    return li

def printUnivList(result,num):
    print("sequence"+"\t"+"UnivName"+"\t"+"Score")
    for i in range(num):
        print(result[i][0]+‘\t‘+result[i][1]+‘\t‘+result[i][2])

url="http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html"
demo = getHTMLText(url)
soup = BeautifulSoup(demo,"html.parser")
result = getObjectData(soup)
printUnivList(result,10)

上面的代码成功地实现了从＂中国最好大学２０１９网站（http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html）上抓取大学排名，大学名称，总成绩等内容，并进行显示．运行结果如下：

sequence   UnivName   Score
1   清华大学   94.6
2   北京大学   76.5
3   浙江大学   72.9
4   上海交通大学   72.1
5   复旦大学   65.6
6   中国科学技术大学   60.9
7   华中科技大学   58.9
7   南京大学   58.9
9   中山大学   58.2
10   哈尔滨工业大学   56.7

原文地址：https://www.cnblogs.com/iceberg710815/p/12207395.html

时间： 2024-12-03 09:09:28

python,网络爬虫完整示例代码－－抓取中国最好大学排名网站信息，并进行输出显示

python,网络爬虫完整示例代码－－抓取中国最好大学排名网站信息，并进行输出显示的相关文章

网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(2): 抓取allitebooks.com书籍信息及ISBN码

网络爬虫: 从allitebooks.com抓取书籍信息并从amazon.com抓取价格(3): 抓取amazon.com价格

iOS开发——网络使用技术OC篇&网络爬虫－使用正则表达式抓取网络数据

iOS开发——网络实用技术OC篇&网络爬虫－使用青花瓷抓取网络数据

Python开发爬虫之动态网页抓取篇：爬取博客评论数据

http协议请求实战——get请求示例之抓取百度搜索关键词对应网页信息

python网络爬虫第三弹(<爬取get请求的页面数据>)

Python网络爬虫（6）--爬取淘宝模特图片

python网络爬虫（7）爬取静态数据详解