下载图片-使用正则表达式

图片处理


如何处理图片

  1. 拿到网页
  2. 使用正则表达式匹配
  3. 使用urlretrieve下载图片
import re
import urllib2
import urllib

def getContext(url):
    ‘‘‘
    获取html
    ‘‘‘
    html = urllib2.urlopen(url)

    return html.read()

def getPicture(html):
    ‘‘‘
    获取图片网址
    ‘‘‘
    regex = r‘class="BDE_Image" src="(.+?\.jpg)"‘

    pattern = re.compile(regex)

    imageUrl = re.findall(pattern, html)

    i = 1
    for url in imageUrl:

        print url

        urllib.urlretrieve(url, ‘%s.jpg‘ % i)

        i +=1

url = ‘http://tieba.baidu.com/p/3932177087‘
if __name__==‘__main__‘:
    html = getContext(url)

    getPicture(html)

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-09 17:48:09

下载图片-使用正则表达式的相关文章

[python][爬虫]从网页中下载图片

说明:仅为测试下载图片.正则表达式 测试url为钢铁侠贴吧的一个介绍mark各代盔甲帖子 以下代码将第一页的图片全部下载到本程序根目录 #!/usr/bin/env python #! -*- coding: utf-8 -*- import urllib,urllib2 import re #返回网页源代码 def getHtml(url): html = urllib2.urlopen(url) srcCode = html.read() return srcCode def getImg(

在C#中使用正则表达式筛选出图片URL并下载图片URL中的图片到本地

本功能主要用到的知识点如下: 1.正则表达式 2.C#中下载文件功能的实现 3.泛型集合的使用 4.进程的简单操作(用于结束当前程序) 下面就简单说一下是如何使用这些知识点的.先详细说下这个程序主要实现的功能是什么,现有一个文本文件里面都是从网页上复制下来的源代码.现需要将其中的以http.https.ftp开头,以.jpg,.png,.gif开头的图片URL地址筛选出来,并去访问这些链接,将URL中所对应的图片下载下来.经过分析后.决定使用正则表达式筛选URL地址.并使用WebClient类去

我的第一个python爬虫程序(从百度贴吧自动下载图片)

这个学期开设了编译原理和形式语言与自动机,里面都有介绍过正则表达式,今天自己学了学用python正则表达式写爬虫 一.网络爬虫的定义 网络爬虫,即Web Spider,是一个很形象的名字. 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛. 网络蜘蛛是通过网页的链接地址来寻找网页的. 从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址, 然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止. 如果把整个互联网当成

java远程下载图片

从别的网站复制文章的时候,要把图片下载到我们网站,再把图片地址换成我们网站的地址 <img id="mbkenHUwhWeOj9U8K6c8LlAXaes3oXit-M4SnmRvB4wXXEue2ol7MviqfDlnDFgp.jpg" alt="图片" onerror="NextPic('/attached/image/mbkenHUwhWeOj9U8K6c8LlAXaes3oXit-M4SnmRvB4wXXEue2ol7MviqfDlnDFgp

一个失误导致微信下载图片接口Token失效

公司的应用调了一个微信上传下载图片的接口,本来在线上跑的好好的,什么问题没有,但是这两天总是不定时的出现下载下来的图片损坏,拿着Token和serverid去接口测试网页验证,返回的是Token失效了,返回信息:"errcode": 40001, "errmsg": "invalid credential, access_token is invalid or not latest hint: [17ZG50664ent3].我是把Token和ticket

利用Node 搭配uglify-js压缩js文件,批量下载图片到本地

Node的便民技巧-- 压缩代码 下载图片 压缩代码 相信很多前端的同学都会在上线前压缩JS代码,现在的Gulp Webpack Grunt......都能轻松实现.但问题来了,这些都不会,难道就要面对几十个JS文件一遍遍来回“复制-压缩-创建-粘贴”,这样太不人性化了. 于是可以借助Node + uglify-js 轻松实现.(前提你会点node操作) 1.首先看一下目录: |--uglifyJS |--js |--test1.js |--test2.js |--uglify.js   //这

【iOS开发之旅】AFNetworking与SDWebImage下载图片

AFNetworking与SDWebImage下载图片 // // ViewController.m // AFNetworkingDemo // // Created by ChenQianPing on 16/1/31. // Copyright © 2016年 chenqp. All rights reserved. // #import "ViewController.h" #import "AFNetworking.h" #import "UII

安卓AsyncTask异步下载图片

package com.example.day7_practise; import java.io.IOException;import java.net.HttpURLConnection;import java.net.MalformedURLException;import java.net.URL;import android.app.Activity;import android.app.ProgressDialog;import android.graphics.Bitmap;imp

UI13-异步下载图片

1 使用封装好的工具类,进行加载数据,存在数组中,加载好后重新刷新表内容.异步下载图片. 2.在model类中,使用方法对图片的网址进行解析,讲自己的image的地址,转化为image图片/ 在cell加载的时候调用. 3.在加载cell中图片的时候,如果图片为空,且不是正在加载中,调用model的方法进行对m的image赋值,此时注册观察者,当image的值发生改变时 触发观察者方法,此时已经有值可以对cell进行赋值:::如果图片有值,直接对cell进行赋值. 4.触发的观察者方法,找到新改