百思不得姐图片同步下载

import requests from lxml import etree from urllib import request import re import os import datetime def parse_page(url): domain = "http://www.budejie.com" header = {"User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:63.0) Gecko/20100101 Firefox/63.0" } response = requests.get(url,headers=header).text html = etree.HTML(response) links = html.xpath("//div[@class=‘j-r-list-c-img‘]//a/@href") img_detail_urls = map(lambda url:domain+url,links) #print(img_detail_urls) return img_detail_urls


def get_img(url):

    header = {"User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:63.0) Gecko/20100101 Firefox/63.0"

              }

    response = requests.get(url,headers=header).text

    html = etree.HTML(response)

    img_url = html.xpath("//div[@class=‘j-r-list-c-img‘]//img/@src")[0]

    #print(img_url)

    img_title = html.xpath("//div[@class=‘j-r-list-c-img‘]//img/@title")[0]

    img_title = re.sub(r‘[\?？\.，。！1~【】\/]‘,‘‘,img_title)

    suffix = os.path.splitext(img_url)[1]

    #print(img_title)

    file_name = img_title.strip()+suffix

    request.urlretrieve(img_url,‘/home/yuyang/PycharmProjects/py3_spider/image/‘+file_name)

    print("下载图片:{}".format(file_name))
delta_time = 0

def main():

    global delta_time

    for x in range(5,6):

        start = datetime.datetime.now()

        base_url = "http://www.budejie.com/pic/{}".format(x)

        print("================开始下载第{}页====================".format(x))

        img_urls = parse_page(base_url)

        for img_url in img_urls:

            #print(img_url)

            get_img(img_url)

        delta = (datetime.datetime.now() - start).seconds

        delta_time += delta

        print("================第{}页消耗时间{}秒==================".format(x, delta))

    print("================下载完毕，共计耗时{}秒===============".format(delta_time))

if __name__ == ‘__main__‘: main()

原文地址：http://blog.51cto.com/2143754/2308997

时间： 2024-10-14 17:00:30

百思不得姐图片同步下载

百思不得姐图片同步下载的相关文章

网络数据的下载（NSUrlconnection异步下载和NSstring同步下载）和UI界面数据的刷新（都是抛弃第三方库的一些本质）

自己动手写工具：百度图片批量下载器

Android 解决图片大量下载：软引用必须懂4点

NSData的同步下载与NSConnection的同步下载

python爬虫实战——5分钟做个图片自动下载器

【图文详解】python爬虫实战——5分钟做个图片自动下载器

同步下载异步下载

IOS开发－UI学习－根据URL显示图片，下载图片的练习（button，textfield，image view，url，data）

【Android进阶】使用HttpURLConnection实现图片的下载与现显示