使用BeautifulSoup 检索 www.163.com 主页面所有超链接

#coding:utf-8import urllib2from bs4 import BeautifulSoup

response=urllib2.urlopen("http://www.163.com")

HtmlDoc=response.read()

soup = BeautifulSoup(HtmlDoc,‘html.parser‘,from_encoding=‘utf-8‘)

links =soup.find_all("a")print(‘打印所有链接‘)for link in links:    print link.name,link[‘href‘]print len(links)

执行结果

打印所有链接a http://www.163.com/#f=topnava http://m.163.com/newsapp/#f=topnava http://music.163.com/#f=topnava http://yuedu.163.com/#f=topnava http://note.youdao.com/#f=topnava http://y.163.com/?from=wsdha http://open.163.com/#f=topnava http://caipiao.163.com/mobile/client_cp.jsp#from=yingyonga http://cidian.youdao.com/?vendor=topnava http://mail.163.com/client/dl.html?from=mail46a http://www.lofter.com/?act=qb163rk_20141031_01a http://study.163.com/client/download.htm?from=163app&utm_source=163.com&utm_medium=web_app&utm_campaign=businessa http://www.163.com/a http://reg.163.com/a http://reg.163.com/RecoverPassword.shtml?f=wwwa http://mail.163.com/client/dl.html?from=mail46a http://reg.email.163.com/mailregAll/reg0.jsp?from=163navi&regPage=163a http://reg.vip.163.com/register.m?from=topnava http://reg.163.com/Logout.jspa http://rd.da.netease.com/redirect?t=I4iYc8&p=EA7B9E&target=http%3A%2F%2Fwww.kaola.com%2Fa http://www.kaola.com/outter/promote/myzq.htmla http://www.kaola.com/outter/promote/mrcz.htmla http://www.kaola.com/outter/promote/jjry.htmla http://www.kaola.com/outter/promote/jkms.htmla http://www.kaola.com/outter/promote/yybj.htmla http://www.kaola.com/outter/promote/hwzy.htmla http://rd.da.netease.com/redirect?t=W1rULs&p=pESsw1&proId=1024&target=http%3A%2F%2Fwww.kaola.com%2Factivity%2Fdetail%2F5288.html%3Ftag%3Dbe3d8d027a530881037ef01d304eb505a http://www.kaola.com/outter/promote/khd.htmla http://email.163.com/#from=163nav_icona http://email.163.com/#f=topnava http://vipmail.163.com/#f=topnava http://qiye.163.com/#f=topnava http://reg.email.163.com/mailregAll/reg0.jsp?from=ntes_nav&regPage=163a http://reg.email.163.com/unireg/call.do?cmd=register.entrance&flow=mobile&from=ntes_nava http://mail.163.com/dashi/dlpro.html?from=mail46a http://pay.163.com/
时间: 2024-08-07 08:29:36

使用BeautifulSoup 检索 www.163.com 主页面所有超链接的相关文章

Selenium+Python之163邮件发送

今晚写了一个163邮箱登录的脚本,不知是163登录策略的限制还是163邮箱改版的问题,直接访问163邮箱主页登录需要输入验证码,因为无法获取到验证码,就这导致直接访问主页登录脚本不可行,现在先访问hao123主页,再从主页点击'邮箱'登录. 1 #coding=utf-8 2 from selenium import webdriver 3 from time import sleep 4 5 driver = webdriver.Firefox() 6 driver.maximize_wind

我的第二十七篇博客---beautifulsoup与csv操作方法

Beautiful Soup和lxml一样,也是一个HTML/XML的解析器,主要的功能也是如何解析和提取HTML/XML数据lxml只会局部遍历,而Beautiful Soup是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于lxml/Beautiful Soup 用来解析HTML比较简单,API非常人性化,支持CSS选择器,Python标准库中的HTML解析器,也支持lxml的解析器 bs4的基本使用实:首先必须要导入bs4库from b

ASP.NET内置对象(转)

asp.net学习笔记,在网上找了比较全的总结.转自:http://www.cnblogs.com/MyBeN/archive/2011/03/23/1992591.html ASP.NET中常用的内置对象(一) ASP.NET中常用的内置对象及功能说明如下所示:对 象 名 功  能  说  明Page 用于操作整个页面Response 用于向浏览器输出信息Request 用于获取来自浏览器的信息Server                    提供服务器端的一些属性和方法Applicatio

asp.net内置对象

转:http://www.cnblogs.com/MyBeN/archive/2011/03/23/1992591.html (1)简述ASP.NET内置对象. 答:ASP.NET提供了内置对象有Page.Request.Response.Application.Session.Server.Mail和Cookies.这些对象使用户更容易收集通过浏览器请求发送的信息.响应浏览器以及存储用户信息,以实现其他特定的状态管理和页面信息的传递. (2)简述Response对象. 答:Response对象

VB.net笔记 (二)内置对象

ASP.NET内置对象  转 (1)简述ASP.NET内置对象. 答:ASP.NET提供了内置对象有Page.Request.Response.Application.Session.Server.Mail和Cookies.这些对象使用户更容易收集通过浏览器请求发送的信息.响应浏览器以及存储用户信息,以实现其他特定的状态管理和页面信息的传递. (2)简述Response对象. 答:Response对象用来访问所创建的并客户端的响应,输出信息到客户端,它提供了标识服务器和性能的HTTP变量,发送给

Nginx笔记

nginx 的安装 下载地址: http://nginx.org/download/nginx-1.4.2.tar.gz 安装准备: nginx依赖于pcre库,要先安装pcre yum install pcre pcre-devel cd /usr/local/src/ wget http://nginx.org/download/nginx-1.4.2.tar.gz tar zxvf nginx-1.4.2.tar.gz cd nginx-1.4.2 ./configure --prefix

几大网站论坛之感想

(这篇文写于什么时候不记得了,应该是long long ago--) 记得我很久以前也写过一篇几大网站的日志,现在再来补充补充,嘻嘻.. 163好!我现在看新闻还是去163看,因为163的主页上面都是各大版块的新闻,很直观,而且新闻大多数都很头条,让我很感兴趣.我曾经打算换个其他网站换新闻,不过后来综合了一下,好像只有163比较符合我的求知欲,哈哈!只不过我看了这么多新闻,我发现网易的评论网友是嘴下不留情的一类人群,因为几乎每条新闻下面都会有一堆恶毒的评论,很多不堪入目的言语,当然也有很多爆笑的

每周网页练习—网易邮箱首页

之前计划是一周还原一个网页或者切一张psd来练习基本功的.正好周五的时候接到一个电话面试,让我还原一下163邮箱主页,晚上发给他,就正好当是这周的练习吧. 吃完完成开工,做到12点,差不多4个小时,基本上做完了,不过还有些局部没完成.算还原度90%吧,剩下的这两天有空再补啦. 这是目前的完成情况 wzlinsen.com/program/163mail 记录一下收获吧 一.首先是这个二维码的滑动效果吧,其实就是绝对定位加上透明度变化加上css3的transition属性 <div class=&qu

CityEngine 2013部署安装

安装环境: windows8.1 专业版 已安装arcgis10.2 所需文件下载地址: CityEngine_2013_1_136371 http://yunpan.cn/csH2iHdEWSgKe  提取码 68ee CityEngine_2013.1_x32x64 http://yunpan.cn/csH27pYFybCnZ  提取码 6562 声明:所有软件都来自于互联网络,仅用于学习之用,不得用于任何商业用途,否则后果自负. 一.部署安装CityEngine2013 1.部署安装Cit