Python实验:百度搜索关键字自动打开相关URL

#! python
# coding: utf-8
# python实现百度搜索关键字,并依次用浏览器打开前五个搜索结果
##
##Beautiful Soup 是一个模块,用于从HTML 页面中提取信息(用于这个目的时,它比正则表达式好很多)。BeautifulSoup 模块的名称是bs4(表示Beautiful Soup,第4 版)。要安装它,需要在命令行中运行pip install beautifulsoup4
import bs4, sys, webbrowser, requests
#res = requests.get(‘http://www.baidu.com/s?wd=‘ +‘‘.join(sys.argv[1]) + ‘%20‘ +  ‘‘.join(sys.argv[2]) + ‘&cl=3&t=12&fr=news‘) # 接收两个关键字
res = requests.get(‘http://www.baidu.com/s?wd=‘ + ‘‘.join(sys.argv[1]) + ‘&cl=3&t=12&fr=news‘) # 接收一个关键字
res.raise_for_status()     #检查状态
soup = bs4.BeautifulSoup(res.text, ‘html5lib‘)    # 使用BeautifulSoup提取html,并用html5lib解析器解析  安装html5lib  用pip install html5lib
linkElems = soup.select(‘.t a‘)         # 通过在浏览器页面审查元素,会发现前五个URL中都会有个 class=‘t‘ 类作为标记,a表示需要查找的<a>元素
print(linkElems)
numOpen = min(5, len(linkElems))       # 搜索出来的结果不止5个,这里需要做限制,根据需要定义
for i in range(numOpen):
    print(linkElems[i].get(‘href‘))    # 使用get(‘href‘)方法获取超链接
    webbrowser.open(linkElems[i].get(‘href‘))   # webbrowser.open()打开浏览器

###最后测试,打开cmd, 执行命令
    # luck.py nginx
#接下来会输出关于nginx的前5个url,并自动打开系统默认浏览器以此打开5个URL
时间: 2024-10-26 17:39:36

Python实验:百度搜索关键字自动打开相关URL的相关文章

python实现百度搜索

利用Python mechanize模块模拟浏览器实现百度搜索 # -*- coding:utf-8 -*- import mechanize import sys reload(sys) sys.setdefaultencoding('utf8') br=mechanize.Browser() br.set_handle_equiv(True) br.set_handle_redirect(True) br.set_handle_referer(True) br.set_handle_robo

我的第一个自动化脚本(python)----百度搜索

这是一个纯小白胡说八道的个人总结,如果有人看到什么不对的,欢迎批评指正 博客园开通了很久,一直不知道该怎么去写,总觉得自己要写的东西都是别人已经写过的,我再去写就是在重复之前人所说,今天去面试和面试姐姐聊到这个问题的时候,我才真正的意识到写博客的意义,其实博客只要是写出来对自己有帮助,管其他人怎么看呢,就算百度搜索出来好多一样的那又怎么样呢,博客是写给自己的,如果能因此帮助别人少走一些弯路又何乐而不为呢 接下来就来我实现这个自动化脚本经历的过程,首先要在火狐浏览器安装selenium IDE:其

Python实现百度搜索并保存到本地示例,Python实现百度搜索

实现百度搜索并保存到本地 User_Agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.81 Safari/537.36' import urllib2 import urllib url = "https://www.baidu.com/s?wd=" key = "博客园" key_code = urllib.quo

百度搜索关键字提示、跳转

模拟的百度搜索的搜索栏,输入数据时会在百度库里提取关键词数组,加入到输入框下面的列表中,可以回车跳转,点击跳转 css和html部分 js部分

【数据分析】python分析百度搜索关键词的频率

涉及知识点 1.抓取数据 2.分页爬虫 规律分析 1.抓取数据,发现每一项都是data-tools标签 2.分页分析 代码 import requests from bs4 import BeautifulSoup import re import json import jieba #获取html页面信息 def getKeywordResult(keyword, pagenum):     url = 'http://www.baidu.com/s?wd=' + keyword + '&pn

ashx仿百度搜索的自动下拉列表

制作环境是在c#中 先是前台页面,可以是aspx也可以是html页面,这就是ashx的好处 代码: 1 <div> 2 <input type="text" id="search" onkeyup="SearchTo()" /><input type="button" value="查询" /><br /> 3 <div id="search_

原生JS模拟百度搜索关键字与跳转

<style type="text/css"> *{ margin: 0; padding: 0; } #text{ width: 300px; height: 30px; } ul { width: 302px; border: 1px solid #ddd; border-top:0; display: none; } ul li { list-style: none; font-size: 12px; font-family: "微软雅黑"; he

python爬取百度搜索结果ur汇总

写了两篇之后,我觉得关于爬虫,重点还是分析过程 分析些什么呢: 1)首先明确自己要爬取的目标 比如这次我们需要爬取的是使用百度搜索之后所有出来的url结果 2)分析手动进行的获取目标的过程,以便以程序实现 比如百度,我们先进行输入关键词搜索,然后百度反馈给我们搜索结果页,我们再一个个进行点击查询 3)思考程序如何实现,并克服实现中的具体困难 那么我们就先按上面的步骤来,我们首先认识到所搜引擎,提供一个搜索框,让用户进行输入,然后点击执行 我们可以先模拟进行搜索,发现点击搜索之后的完整url中有一

小练习:用jQuery简单模拟百度搜索框的提示功能

今天第一次接触jQuery,用jQuery模拟了一下百度搜索的自动提示功能.连带jQuery的基本知识点,简单总结如下: 首先得在工程中导入插件:jquery-1.4.2.js ,并在html的head中引入该js: 1 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> 2 <html>