妹子网抓美女

网络爬虫的主要目的就是用来抓妹子图，而“妹子图”网站没有烦人的反爬虫机制，是我选择用来寄生的好网站，而且自从我写出来这个代码，我瘦了两斤我会到处乱说？

实验目标：从5200页爬虫爬到5205页，抓取图片。（5200页是偶家小美人武田玲奈！！）

from bs4 import BeautifulSoup #本次实验的主要捕获方式是用bs4#

import requests

import re

i=0

for a in range(5200,5206): #设定从5200页翻到5205页#

url="http://www.meizitu.com/a/"+str(a)+".html" #比较直白的翻页方式#

html=requests.get(url)

A=‘<p><div id="picture">‘

content=html.text.partition(A)[2]

B=‘<div class="boxinfo">‘

body=content.partition(B)[0]

#源代码里的img节点里的title不全相同，采用了partition方式切块，但是这样的情况用Xpath更好#

soup=BeautifulSoup(body,"html.parser")

pictures=soup.find_all("img")

for picture in pictures:

# print(picture["src"])

print("Now Downloading："+str(i))

pic=requests.get(picture["src"])

fp=open("e:/pythonaaa/b/Study & test/"+str(i)+".jpg","wb")

fp.write(pic.content) #wb二进制写入搭配content将整个文件抓下来#

i=i+1

时间： 2024-10-22 03:40:58

妹子网抓美女的相关文章

javascript之抓美女

javascript之抓美女 2014/11/8 21:36:31 来源燕十八的javascript视频2014年版代码 </style> img{ width:130px; height:130px; postition:relative; left:0px; top:0px; } </style> <body>

爬取妹子网的低级教程连接如下:[爬妹子网](https://blog.csdn.net/baidu_35085676/article/details/68958267) ps:只支持单个套图下载,不支持整体下载在说说我的这个爬虫代码的设计思路: ①当我们浏览这个网站时,会发现,每一个页面的URL都是以网站的域名+page+页数组成,这样我们就可以逐一的访问该网站的网页了 ②当我们看图片列表时中,把鼠标放到图片,右击检查,我们发现,图片的内容由ul包裹的li组成,箭头所指的地方为每个套图的地址,

Excel催化剂开源第41波-网抓网络采集类库及工具分享

在VBA开发网抓程序中,会用到xmlhttp/winHttp.winHttprequest.5.1等组件,当时笔者也是这样进入了网抓领域的,这些都是非常过时的东西,在.Net的开发中,有大量的更好用的轮子使用,在Excel催化剂开发过程中,也会用到,在此向大家简单分享,希望对VBA转VSTO开发群体有所帮助. 微软原生自带类库 HttpRequest类库在.Net4.0的框架上,只能用这个类库,在更高的框架.Net 4.5中,可以用HttpClient,比HttpRequest更高级的更易使用

网抓取工具和技巧

偶尔会有需求提取竞争对手的网站数据,而且网站一般会有一些防护程序抓取的方案. 工具: httpclient:有点笨重的工具,入门还是要些门槛 jsoup:轻量强大 webdriver:谷歌出品的精品,可以抓取网页和执行javascript Selenium :做测试的朋友推荐的,可以录制脚本基本jsoup+webdriver就能完成所有浏览器模拟的工作

网抓实例：自动修正系统日期和时间

电脑系统日期和时间,用户可以自己修改.下面的工具可以自动获取标准的北京日期和时间,并修正系统时间. 代码: 'By 刘永富,QQ群:61840693 Public IE As InternetExplorer Sub GetDateTime() On Error GoTo Err1: Dim span_date As MSHTML.HTMLSpanElement Dim span_time As MSHTML.HTMLSpanElement Dim Sdate As String, Stime

千图网_性感美女图片爬取--图片懒加载

#爬取千图网性感美女模块的图片 #第一页:http://sc.chinaz.com/tupian/xingganmeinvtupian.html #第二页:http://sc.chinaz.com/tupian/xingganmeinvtupian_2.html #两种url结构不同,注意可以使用if语句判断 import urllib.request import urllib.parse from lxml import etree import time import os #定义下载图

如何进入“深网”

暗网(又称作深网,不可见网,隐藏网)是指互联网上的内容,不属于那些可以被标准搜索引擎索引的表面网络. 迈克尔·伯格曼将当今互联网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索,巨量的表面信息固然可以通过这种方式被查找得到,可是还有相当大量的信息由于隐藏在深处而被搜索引擎错失掉.绝大部分这些隐藏的信息是须通过动态请求产生的网页信息,而标准的搜索引擎却无法对其进行查找.传统的搜索引擎"看"不到,也获取不了这些存在于暗网的内容,除非通过特定的搜查这些页面才会动态产生.于是相对的,暗

iPhone上网络抓包方法详解

iPhone上网络抓包方法详解 Mac上常用抓包工具: Charles, Fiddler, Wireshark Wi-Fi环境下抓包 (以Charles为例) Mac和iPhone连接相同Wi-Fi 打开Charles,Help->Local IP Address 打开iPhone无线局域网设置, 选中连接的Wi-Fi, 配置代理,服务器输入步骤2中的ip地址,端口号默认8888 设置好之后,就可以在Charles中看到手机上的所有请求 Charles还有许多其他的功能,可以抓https请求,设

网页抓取小工具（IE法）

网页抓取小工具(IE法)-- 吴姐 http://club.excelhome.net/thread-1095707-1-1.html 用IE提取网页资料的好处在于:所见即所得,网页上能看到的信息一般都能获取. 本工具功能不多,主要是便于提取网页上展示的信息所在元素的代码.希望能对大家有点小帮助. 网页抓取小工具.rar (22.91 KB, 下载次数: 2426) 本工具使用方法: 1.在B1内输入网址,可以是已打开的网页,也可以是未打开的 2.A2和B2的内容不要更改,第二行的其他单元格可以