python小程序 获取url

获取中国比较有权重的网站

# encoding=utf-8
import re
import requests
from bs4 import BeautifulSoup

class getUrl(object):

    def __init__(self,num):
        self.totle = num
        self.myheader = {‘Host‘: ‘top.chinaz.com‘,
                         ‘Connection‘: ‘ keep-alive‘,
                    ‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.80 Safari/537.36‘,
                    ‘Accept‘:‘*/*‘,‘Referer‘:‘http://www.chinaz.com/‘,
                    ‘Accept-Encoding‘:‘gzip, deflate, sdch‘,‘Accept-Language‘:‘zh-CN,zh;q=0.8‘}  # 表头信息

    def beginer(self):
        print ‘get start‘
        page = 2
        urlliset = []
        while page < 1680:
            url = ‘http://top.chinaz.com/all/index_‘+str(page)+‘.html‘
            r = requests.get(url,headers=self.myheader)
            soup = BeautifulSoup(r.text)
            list = soup.select(‘.col-gray‘)
            site = re.findall(‘<span.*?>(.*?)</span>‘,str(list))
            del site[0]
            for elem in site:
                urlliset.append(elem)
            page += 1
        self.writeQQ(text = urlliset,file_dir=‘site.text‘,mode=‘w‘)

    def writeQQ(self,text, file_dir, mode):
        with open(file_dir, mode) as f:
            for site in text:
                f.write(site)
                f.write("\n")

spidre = getUrl(44)
spidre.beginer()
时间: 2024-10-05 18:51:03

python小程序 获取url的相关文章

python小程序获取诸多域名的过期时间

#!/usr/bin/env python #-*- coding:utf-8 -*- __author__ = 'jony' import urllib2 import time from bs4 import BeautifulSoup import sys reload(sys) sys.setdefaultencoding('utf8') def getexpiredate(domain):     url = "http://tool.chinaz.com/DomainDel/?wd=

python小程序 获取wooyun厂商site

# encoding=utf-8 import re import requests class getUrl(object): def __init__(self,num): self.totle = num self.myheader = {'Host': 'www.wooyun.org', 'Connection': ' keep-alive', 'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, li

微信小程序 获取用户openid

1,可以在小程序app.js入口文件中放入登录代码 wx.login({ success: res => { // 登录注册接口 if (res.code) { // 调用服务端登录接口,发送 res.code 到服务器端换取 openId, sessionKey, unionId并存入数据库中 } else { console.log('登录失败!' + res.errMsg) } } }); 2,服务端PHP,小程序获取openid接口 // 获取openid function getOpe

微信小程序-获取用户信息和openid,session_key,

1:微信小程序获取用户信息:比如常用的 avatarUrl (用户头像),nickName (用户名称) 等等, (1):获取用户信息调用 wx.getUserInfo 代码如下: 直接请求接口就可以了,随后把数据存放到storage中,下次直接取 就不用再请求接口,, 2:获取 openid (1):请求wx.login 接口,代码如下: url:是微信提供的 appid:是小程序的appid secret:是小程序开发设置的 AppSecret 只要获取到这两项,用户信息可以用于页面,ope

微信小程序获取登录手机号

小程序获取登录用户手机号. 因为需要用户主动触发才能发起获取手机号接口,所以该功能不由 API 来调用,需用 <button> 组件的点击来触发. 首先,放置一个 button 按钮,将 button 的 open-type 的属性值设为 getPhoneNumber . 当用户点击并通过之后,通过绑定的事件获取微信服务器返回过来的加密数据,再根据 session_key 和 app_id 通过后台解密就可以获取手机号啦. 说到这,就上码吧!!! 1 <!--index.wxml--&g

微信小程序获取国外今日天气预报信息接口

使用天气API的国外今日天气预报接口制作 返回json预览 { cityid: "601010100", city: "堪培拉", cityEn: "Canberra", country: "澳大利亚", countryEn: "Australia", update_time: "2019-04-24 18:00:00", wea: "晴", wea_img: &qu

python小程序之一

来个Python小程序 #输入年月日确定这个日期是一年中的第多少天# -*- coding: UTF-8 -*-y=int(raw_input("请输入年:"))m=int(raw_input("请输入月份:"))d=int(raw_input("请输入日期:"))a=(0,31,28,31,30,31,30,31,31,30,31,30,31)if m>12: raise ValueError("输入月份错误")if

Python 小程序,对文件操作及其他

下面是自己写的几个对文件操作的小程序,里面涉及到文件操作,列表(集合,字典)的运用等.比如说,从文件中读取一行数据,分别存放于列表中,再对列表进行操作,如去掉里面的重复项,排序等操作. 常见对文件中行进行操作: #这里列出两个常用的方法 方法01: 一次性读取所有行 >>> f = file('1.txt') >>> while 1: lines = f.readlines() if not lines: break for line in lines: print l

Python 小程序,对文件操作及其它

以下是自己写的几个对文件操作的小程序,里面涉及到文件操作,列表(集合,字典)的运用等.比方说,从文件里读取一行数据.分别存放于列表中,再对列表进行操作.如去掉里面的反复项.排序等操作. 常见对文件里行进行操作: #这里列出两个经常使用的方法 方法01: 一次性读取全部行 >>> f = file('1.txt') >>> while 1: lines = f.readlines() if not lines: break for line in lines: print