利用python 获取网址中的href(基于python 3.6)

import urllib.request

from bs4 import BeautifulSoup
def get_link(page):  # 寻找链接的href    linkData = []    for page in page.find_all(‘td‘):        links = page.select("a")        for each in links:            # if str(each.get(‘href‘))[:1] == ‘/‘: 过滤if代码                data=each.get(‘href‘)                linkData.append(data)    return(linkData)
def findAll(): #主函数    url=‘http://www.nco.ncep.noaa.gov/pmb/codes/nwprod/nosofs.v3.0.4/‘    page = urllib.request.urlopen(url).read()    soup = BeautifulSoup(page,‘lxml‘) #利用BeautifulSoup取得网页代码    links=get_link(soup)    # print(links)    for childLink in links:        #print(childLink )        links2=url+childLink        print(links2 )
				
时间: 2024-08-09 08:48:19

利用python 获取网址中的href(基于python 3.6)的相关文章

利用POI获取Excel中图片和图片位置

利用POI获取Excel中图片和图片位置(支持excel2003or2007多sheet) 转自:http://blog.csdn.net/delongcpp/article/details/8833995 第三方JAR包(apache下载POI即可): poi-3.9-20121203.jar dom4j-1.6.1.jar poi-ooxml-3.9-20121203.jar poi-ooxml-schemas-3.9-20121203.jar poi-scratchpad-3.9-2012

利用javascript获取url中的传值并创建页面元素

url传值: 在地址后附加 ?键1=值1&键2=值2&键3=值3... ...(注意:该方法会将参数显示在地址栏中,传入的值应该不影响网站安全和透露网站内部信息) <script type="text/javascript"> //该函数将获取url中的键值组合,并通过传入的键参数返回键所对应的值 function getvl(name) { var reg = new RegExp("(^|\\?|&)" + name + &q

Python获取网络中的存活主机以及哪些主机是Linux

这个脚本用于扫描网络中的存活主机,通常在CMDB中自动获取主机的时候用到. #!/usr/bin/env python # -*- coding: utf-8 -*- """ 执行这个脚本的主机要安装下面两个模块 pip3 install python-nmap 这个Python模块依赖操作系统的nmap 确保操作系统安装了nmap yum -y install nmap # for centos 主要功能:扫描网段获取存活主机以及主机是否为Linux.不是Linux的被标记

获取网址中参数的方式

1: $c=$_GET['c'];  获取这种形式的参数http://127.0.0.1/?c=1 2: example.com/class/function/ID.  id是function函数的参数,这样function函数可以获取到ID的值当作函数的参数传递进自己.3:$_GET数组是超全局变量数组,是通过HTTP GET方法传递的变量组成的数组.它属于外部变量,即在服务器页面中通过$_GET超全局数组获取URL或表单的GET方式传递过来的参数.示例 http://www.lam.com/

Python获取列表中的最后一个或者倒数第几个的方案

print(members[3]) 灵魂所在“ - (负号 )” 我们先来创建一个列表,和php中的数组一样. members = ['张三','李四','王五','芳芳','小明','小王'] 按照正常的方法,我们要取出第几个值,那么我们只需在知道他的索引即可,Python的索引从0开始 下面我们取出第一个用户的名称 print(members[0]) 得到的结果是张三,如果是 print(members[3]) 这是正向的取值,那么我们反序取值,只需加上 - 号即可 print(member

获取网址中的参数,解决中文乱码问题;

第一种:参数只能是英文. function GetQueryString(name) { var reg = new RegExp("(^|&)" + name + "=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if (r != null) return unescape(r[2]); return null; } 第二种:参数可以是中文也可以是英

selenium 获取table中的元素。python

#获取table的行数rowCount = len(driver.find_elements_by_xpath('//*[@id="list-table"]/tbody/tr')) #获取第三列的每一行的值for i in range(2,rowCount): print driver.find_element_by_xpath('//*[@id="list-table"]/tbody/tr[%s]/td[3]'%(i)).text

python 获取类中除内置方法外的所有方法名

#!/usr/bin/env python# !-*- coding:utf-8 -*- class Menu: def __init__(self): pass def updateProject(self): pass def restartProject(self): pass def restartTomcat(self): pass def stopTomcat(self): pass def startTomcat(self): pass def methods(self): ret

[python]获取网页中内容为汉字的字符串的判断

IPerf%E2%80%94%E2%80%94%E7%BD%91%E7%BB%9C%E6%B5%8B%E8%AF%95%E5%B7%A5%E5%85%B7%E4%BB%8B%E7%BB%8D%E4%B8%8E%E6%BA%90%E7%A0%81%E8%A7%A3%E6%9E%904 ?????DbYE1tZV??x?????g ????o12dt6wwG???ó??????? http://auto.315che.com/tyrs/qa23824193.htm?hwx http://auto.3