spider_jpg

#coding=utf-8

#urllib模块提供了读取Web页面数据的接口
import urllib
#re模块主要包含了正则表达式
import re
#定义一个getHtml()函数
def getHtml(url):
page = urllib.urlopen(url) #urllib.urlopen()方法用于打开一个URL地址
html = page.read() #read()方法用于读取URL上的数据
return html

def getImg(html):
reg = r‘src="(.*?\.jpg)"‘ #正则表达式，得到图片地址
imgre = re.compile(reg) #re.compile() 可以把正则表达式编译成一个正则表达式对象.
imglist = re.findall(imgre,html)
#re.findall() 方法读取html 中包含 imgre（正则表达式）的数据
#把筛选的图片地址通过for循环遍历并保存到本地
#核心是urllib.urlretrieve()方法,直接将远程数据下载到本地，图片通过x依次递增命名
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,‘C:\ATIEBA\%s.jpg‘ % x)
x+=1
print ‘I have gotten %s pictures‘ %x
print ‘Please be careful about sipder‘

html = getHtml("http://tieba.baidu.com/p/4878382516")
print getImg(html)

时间： 2025-01-04 17:14:45

spider_jpg的相关文章

猜你喜欢

微信接口校验

1.Servlet package com.itmayiedu.servlet; import java.io.IOException;import java.io.PrintWriter;impor ...

java webservice

1.1 [什么是webservice] 1.1.1 什么是webservice? l Web service 即web服务,它是一种跨编程语言和跨操作系统平台的远程调用技术即跨平台远程调用技术. l ...

ORA-12519: TNS:no appropriate service handler found 解决

最近做项目遇到一个连接Oracle的问题,报错如题:ORA-12519: TNS:no appropriate service handler found,应该是项目中的有些算法把所有连接都占用了,没 ...

zabbix部署

服务端 m01-61 关闭防火墙 /etc/init.d/iptables stop [[email protected] x86_64]# getenforce Disabled [[email p ...

Java垃圾收集器与内存分配策略

程序的计数器.虚拟机栈.本地方法栈3个区域随线程而生,随线程而灭:栈中的栈侦随着方法的进入和退出而有条不紊地执行出栈和如栈操作. 判断对象是不是已经死亡的方法: 一.引用计数算法: 给对象添加一个引用 ...

30 行代码实现 JS 中的 MVC

一连串的名字走马观花式的出现和更迭,它们中一些已经渐渐淡出了大家的视野,一些还在迅速茁壮成长,一些则已经在特定的生态环境中独当一面舍我其谁.但不论如何,MVC已经并将持续深刻地影响前端工程师们的思维方 ...

Eclipse出现了一个找不到java\jdk1.6.0_23\bin\..\jre\bin\client\jvm.dll的错误

昨天打开Eclipse出现了一个找不到java\jdk1.6.0_23\bin\..\jre\bin\client\jvm.dll的错误,不知道所以,然后去这个路径下,发jvm.dll是存在的然后怀 ...

小凡带你搭建本地的光盘yum源

小凡带你搭建本地的光盘yum源导读当我们在使用Yum工具安装软件包时,我们会感觉非常简单,它解决了一定程度软件包的依赖关系.但是Yum工具默认提供的是一种在线安装的方式,它会从默认的网上地址来寻找 ...

android从应用到驱动之—camera(1)---程序调用流程（转）

一.开篇写博客还得写开篇介绍,可惜,这个不是我所擅长的.就按我自己的想法写吧. 话说camera模块,从上层到底层一共包含着这么几个部分: 1.apk------java语言 2.camera的ja ...

Android总结篇系列：Activity生命周期

Android官方文档和其他不少资料都对Activity生命周期进行了详细介绍,在结合资料和项目开发过程中遇到的问题,本文将对Activity生命周期进行一次总结. Activity是由Activit ...

【反演复习计划】【COGS2432】爱蜜莉雅的施法

也是一个反演. 第一次手动推出一个简单的式子,激动.jpg 1 #include<bits/stdc++.h> 2 #define N 10000010 3 using namespace ...

2017寒假零基础学习Python系列之函数之函数之定义可变参数

若想让函数接受任意个参数,就可以定义一个可变的参数: def fn(*args): print args fn() >>>() fn(1,2,5,6) >>>(1, ...

思维导图：第八天的记录

1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.or ...

Android 实现高斯模糊效果及低版本兼容

Android 实现高斯模糊效果及低版本兼容 Hello,好久不见,好久没写博客了,总结了下原因有三,第一,变懒了:第二,变懒了:第三,还是变懒了:因为任何不更新博客的理由都是借口! 一.效果演示项 ...

Python替换文件内容（文件处理）

#需求用Python来替换掉文件里面的内容 #脚本内容如下 #!/usr/bin/env python #_*_ coding:utf-8 _*_ import sys,os #小于四个位置变量则退 ...

水榕生长环境

http://shuicao.cc/thread-883928-1-1.html 用剪刀清除部分根须,一是便于绑定,二是刺激根部生长水榕的种类是以喀麦隆为中心,分部在西非一带.水榕的栽培比起其他水草 ...

去掉chrome、火狐（以及360）input在得到焦点时出现黄色（蓝色）边框的方法

去掉chrome.FF(360 v6.3)input在得到焦点时出现黄色(360 v6.3为蓝色)边框的方法,只需要在input中增加样式outline:0px;即可,如下: input{outlin ...

uva10780Again Prime? No Time.

质因数分解. 1 //Accepted 0 KB 12 ms 2 #include <cstdio> 3 #include <cstring> 4 #include <c ...

这次的作业没有用Adapter来做,而是在Activity中实现内容的传递,对于Adapter还不行.1.第一个是ListView列表<?xml version="1.0" ...

Windows App开发之集合控件与数据绑定

为ListView和GridView添加数据 ListView采用垂直堆叠得方式显示数据,而GridView则采用水平堆叠得方式. 长相的话嘛,它们都差不多. <Grid Name=" ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.015 s.