获取微博热搜榜前十

import requests
from lxml import etree
url="https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6"
header={‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36‘}
def main():
    html=etree.HTML(requests.get(url,headers=header).text)
    rank=html.xpath(‘//td[@class="td-01 ranktop"]/text()‘)
    affair=html.xpath(‘//td[@class="td-02"]/a/text()‘)
    view = html.xpath(‘//td[@class="td-02"]/span/text()‘)
    top=affair[0]
    affair=affair[1:11]
    print(‘{0:<10}\t{1:<40}‘.format("top",top))
    for i in range(0, len(affair)):
        print("{0:<10}\t{1:{3}<30}\t{2:{3}>20}".format(rank[i],affair[i],view[i],chr(12288)))
main()

原文地址:https://www.cnblogs.com/wxjbk/p/12543165.html

时间: 2024-08-30 09:19:57

获取微博热搜榜前十的相关文章

爬取百度热搜榜前十

1.导入相应的库 2.找到要爬取的网站:http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b341_c513 3.找到爬取的内容: 4.用for循环将需要的内容添加到空列表中,在使用DataFrame打印出热搜榜前十 import requests from bs4 import BeautifulSoup import bs4 import pandas as pd url = 'http://top.baidu.com/buzz?b=34

爬取微博热搜榜

import requestsfrom bs4 import BeautifulSoupurl = 'https://s.weibo.com/top/summary?cate=realtimehot'headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64)'                  'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safar

爬取百度热搜榜

1.打开网站:http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b42 2.按Ctrl+u查看网页源代码 3.招到要爬取的数据 4. import requests from bs4 import BeautifulSoup import pandas as pd url = 'http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b341_c513' headers = {'Use

2020不平凡的90天,Python分析三个月微博热搜数据带你回顾

前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:刘早起早起 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun 北京时间4月3日凌晨,全球新冠病毒感染人数突破100万,死亡人数超过5万.而这一切都在2020年刚开始的三个月内发生.可能你觉得这三个月很快,有些事情已经逐渐忘记,而互联网的记忆不会消失,数据也会说话.因此作者抓取了2020年1月1日至4月2日的每

微博热搜、天猫秒杀、12306抢票,都是高并发,难点相同吗?

又是一年春运抢票时,12306 又挂了.同为高并发,微博热搜.天猫秒杀.12306 抢票有什么不同呢? 本文完全基于个人的有限的经验和了解,如果文中有什么问题还请大家一起讨论和指正. 微博热搜 「微博热搜」是一个典型的读多写少场景.读今日的热点新闻,写自己的微博评论. 作为一个后端开发,看到"读多写少",第一反应就应该想到要加缓存. 可是,为什么微博总是宕机,抵挡不住 xxx 明星出轨新闻流量? 对微博来说,难点在于热点无法预测,在面对突发流量时,如何快速扩容. 电商秒杀 电商秒杀的大

Django学习---抽屉热搜榜分析【all】

Python实例---抽屉热搜榜前端代码分析 Python实例---抽屉后台框架分析 Python学习---抽屉框架分析[点赞功能分析] Python学习---抽屉框架分析[数据库设计分析]180313 Python学习---抽屉框架分析[ORM操作]180314 Python学习---抽屉框架分析[小评论分析]0315 Python学习---抽屉框架分析[点赞功能/文件上传分析]0317 原文地址:https://www.cnblogs.com/ftl1012/p/9495299.html

TestBird测试游戏《口袋联盟》稳居付费榜前十

有热酷发行的<口袋联盟>是基于口袋妖怪题材的拟人化小精灵对战手游.<口袋联盟>上线4个月,目前在IOS付费排行榜排在第7名并长时间占据前十的位置,TestBird全程为口袋联盟提供手游兼容性测试业务.这款拟人化小精灵对战手游便凭借其激萌的游戏人设.绚丽的游戏画面.新颖的战斗玩法等获得了玩家与媒体的广泛赞誉. <口袋联盟>拥有绚丽的场景,极致游戏画面塑造了一个美轮美奂的精灵世界.全屏的精美特效让人欲罢不能,所有精彩瞬间凝聚于完美画质,最夺人眼球的画面场景尽情展现眼前.充分

爬去百度热搜榜

1.打开网站http://top.baidu.com/buzz?b=1&fr=topindex 2.右键找到源代码 3.用工具爬取数据 import requestsfrom bs4 import BeautifulSoupimport pandas as pdtitles=[]hots=[]url='http://top.baidu.com/buzz?b=1&fr=topindex'#百度今日热搜headers = {'User-Agent':'Mozilla/5.0 (Windows

Python实例---抽屉热搜榜学习版

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>欢迎来到FTL的网站</title> <style> /*------------------------------------头部信息开始------------------------*/ * { margin: 0; padding: 0