多线程下载图片


# -*- coding:utf8 -*-

from bs4 import BeautifulSoup
import os, sys, urllib2, urllib
import thread, threading


class downloader(threading.Thread):
    """docstring for downloader"""
    def __init__(self, url, name):
        threading.Thread.__init__(self)
        self.url = url
        self.name = name
    def run(self):
        print ‘downling from %s‘ % self.url
        urllib.urlretrieve(self.url, self.name)

threads=[]

def page_loop(page=1):
    url = ‘http://www.beautylegmm.com/Tiara/beautyleg-936.html?page=%s‘ % page
    content = urllib2.urlopen(url)

    soup = BeautifulSoup(content)

    my_girl = soup.find_all(‘img‘)  

    global x
    # 加入结束检测，写的不好....
    if len(my_girl) <5:
        print ‘已经全部抓取完毕‘
        sys.exit(0)

    print ‘开始抓取‘
    for girl in my_girl:
        link = girl.get(‘src‘)
        if ‘jpg‘ in link:
            flink = ‘http://www.beautylegmm.com‘ + link
        print flink
        path = ‘dbmeizi‘+‘/‘ + str(x) + flink[-4:]
        x = x + 1
        t = downloader(flink, path)
        threads.append(t)
        t.start()
        # content2 = urllib2.urlopen(flink).read()
        # with open(‘dbmeizi‘+‘/‘ + str(x) + flink[-4:],‘wb‘) as code: 
        #     code.write(content2)
       
    page = int(page) + 1
    print ‘开始抓取下一页‘
    print ‘the %s page‘ % page
    page_loop(page)
   
x = 1
page_loop()

来自为知笔记(Wiz)

时间： 2024-10-12 09:21:05

多线程下载图片的相关文章

多线程下载图片,滑动tableView崩溃--资源抢夺问题

最近练习使用NSoperation模拟SDWebImage下载图片,发生了崩溃的问题,还专门写博客记录这件事情: http://www.cnblogs.com/tufei7/p/7074030.html, 当时以为是因为weakSelf和StrongSelf造成的崩溃, 然而我尽管用了StrongSelf和WeakSelf仍然崩溃,当时我也很崩溃. 思前想后还是跟demo源码对比下吧,对比发现: demo代码红框里面的代码是写在 mainQueue的block里面的, 我的是写在mainQue

MAP函数应用于多线程下载图片

# -*- coding:utf8 -*- from bs4 import BeautifulSoup import os, sys, urllib2, urllib from multiprocessing.dummy import Pool as ThreadPool urls = [] def download(url): urllib.urlretrieve(url, 'd:/'+url[-7:]) def page_loop(page=1): url = 'http://www.bea

curl多线程下载类

<?php /** * curl多线程下载类 */class MultiHttpRequest{ public $urls = array (); private $res = array (); private $curlopt_header = 0; private $method = "GET"; private $curlopt = array (); public function __construct($urls = false, $curlopt = array

iOS多线程自定义operation加载图片不重复下载图片

摘要:1:ios通过抽象类NSOperation封装了gcd,让ios的多线程变得更为简单易用: 2:耗时的操作交给子线程来完成,主线程负责ui的处理,提示用户的体验 2:自定义operation继承自NSOperation,在子线程中下载图片: 3:保证图片只下载一次,还有保证下载任务不重复 ------------------------------------------------------------------------------------ 实现原理:1:图片缓存:用

ios多线程GCD下载图片

1 - (void)touchesBegan:(NSSet *)touches withEvent:(UIEvent *)event 2 { 3 dispatch_queue_t queue = dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0); 4 dispatch_async(queue, ^{ 5 NSLog(@"--download--%@", [NSThread currentThread]); 6 /

【幻化万千戏红尘】qianfengDay27-HttpURLConnection,OkHttpClient,,多线程下载且断点续传基础学习：

课程回顾: Servlet:java语言开发的运行在服务器上的开发步骤:1.创建Servlet类2.重写doGet或doPost方法3.运行在服务器生命周期:1.初始化2.服务3.销毁 URL:统一资源定位符,网址openConnection 今日内容:Http协议:超文本传输协议常用方式:1.HttpURLConnection2.okHttp HttpURLConnection的使用步骤:1.创建URL对象---URL url=new URL("网址");2.获取连接对象--Htt

Java 仿迅雷多线程下载

package net.webjoy.jackluo.android_json; /** * 1.http Range "bytes="+ start+end * 2.RandomAccessFile设置写入的位置 * 3开启多线程下载 * * Created by jackluo on 9/30/15. */ import android.os.Environment; import android.os.Handler; import android.os.Message; imp

iOS多线程与网络开发之大文件下载 (边下边写/暂停恢复下载/压缩解压zip/多线程下载）

郝萌主倾心贡献,尊重作者的劳动成果,请勿转载. 如果文章对您有所帮助,欢迎给作者捐赠,支持郝萌主,捐赠数额随意,重在心意^_^ 我要捐赠: 点击捐赠 Cocos2d-X源码下载:点我传送游戏官方下载:http://dwz.cn/RwTjl 游戏视频预览:http://dwz.cn/RzHHd 游戏开发博客:http://dwz.cn/RzJzI 游戏源码传送:http://dwz.cn/Nret1 A.需求边下边写入硬盘显示下载进度暂停/恢复下载解压文件多线程下载 B.基本知识 1

0422 多线程下载(分类/类扩展)/封装mySdWebImage

1. 创建分类 Source - OC Files - 选择UIImageView创建分类(category) 2. 在分类中创建一个对象方法: 分析分类需要做什么,需要什么参数? 1) 分类需要获得url,从而下载图片 2) 分类需要传进来一个图片,作为placeholder 所以,定义一个方法: -(void)my_SdWebImageWithUrl:(NSURL*)url placeholder:(UIImage*)placeholder; 3. 把创建线程的方法从原先的ViewDidLo