动漫电脑壁纸_爬虫

无意中发现一个好网站，上面有很多美丽的动漫壁纸。

图片太多，手动保存太慢，遂写此程序。

源代码：

import os #引入文件模块
import re #正则表达式
import urllib.request

#连接网页并返回源码
def open_url(url):
      try:
            req = urllib.request.Request(url)
            req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36")
            response = urllib.request.urlopen(req)
            # status_code = response.code
            html = response.read()
            return html
      except:
            print(url + " 404 网页丢失，请稍后再试!")
            return 404

def main():
    dongman_url = ‘https://www.dongmanxingkong.com/category/pic/wallpaper/page/1‘
    dongman_url0 = ‘https://www.dongmanxingkong.com/category/pic/wallpaper/page/‘
    add_urls = [] # 网页列表
    paper_urls = [] # 壁纸地址列表
    img_num = 1 # 图片序列号
    os.chdir(‘PC_paper‘) # 转移到图片防止目录
    for i in range(1,4): # 搜集网页
        dongman_url = dongman_url0 + str(i)
        dongman_html = open_url(dongman_url)
        dongman_html = dongman_html.decode(‘utf-8‘)
        # 正则表达式匹配
        add_url = re.findall(r‘class="post-title"><a href="([^"]+\.html)" title="【电脑壁纸】‘,dongman_html)
        print(len(add_url))# 输出当前网页
        add_urls.extend(add_url) # 将子网页添加到列表中
    print(add_urls) # 输出列表
    print(len(add_urls)) # 列表长度
    for i in add_urls: # 从网页列表中搜集图片源地址
        print(i)

        paper_html = open_url(i)
        paper_html = paper_html.decode(‘utf-8‘)
        paper_url = re.findall(r‘电脑壁纸 " src="([^"]+\.jpg)"‘,paper_html)
        paper_urls.extend(paper_url) #　将所有地址存放到列表中
        print(paper_url)

    print(paper_urls)
    print(‘共‘ + str(len(paper_urls)) + ‘张,现在开始下载图片，请勿关闭程序!‘)
    # 开始保存图片
    for i in paper_urls:
        file_name = str(img_num) + ‘.jpg‘
        img_html = open_url(i)
        with open(file_name, ‘wb‘) as f:
            f.write(img_html)
        img_num = img_num + 1

if __name__ == ‘__main__‘:
    main()

原文地址：https://www.cnblogs.com/jxxclj/p/9650381.html

时间： 2024-10-08 12:14:17

动漫电脑壁纸_爬虫的相关文章

wallpaper engine王思聪吃热狗数字动态时钟电脑壁纸下载

壁纸名称:冷高轮时间王思聪吃热狗数字时钟壁纸样式:梵高数字动态时钟,王思聪吃热狗数字动态时钟,手势数字动态时钟,大写数字动态时钟,中文汉字动态时钟,麻将数字动态时钟,扑克数字动态时钟电脑壁纸下载可在wallpaper engine或者upupoo上搜索全称“冷高轮时间‘ 电脑屏保可在冷高轮时间官网下载:lenggaolun.com(com前面是点不是句号) 手机APP可在android和ios各大应用市场搜索全称'冷高轮时间“下载原文地址:https://www.cnblogs.com/l

大写数字动态时钟电脑壁纸下载-windows

壁纸名称:冷高轮时间大写数字时钟壁纸样式:梵高数字动态时钟,王思聪吃热狗数字动态时钟,手势数字动态时钟,大写数字动态时钟,中文汉字动态时钟,麻将数字动态时钟,扑克数字动态时钟电脑壁纸下载可在wallpaper engine或者upupoo上搜索全称“冷高轮时间‘ 电脑屏保可在冷高轮时间官网下载:lenggaolun.com(com前面是点不是句号) 手机APP可在android和ios各大应用市场搜索全称'冷高轮时间“下载. 原文地址:https://www.cnblogs.com/leng

com.panie 项目开发随笔_爬虫初识（2017.2.7）

(一) 本章打算研究一下爬虫.我想用爬虫简单的爬取几篇文章,以及收集一下常用网站的信息. (二) 以开源项目 JAVA爬虫 WebCollector 为源码研究.在此基础上改为适合自己项目的代码. (三) WebCollector致力于维护一个稳定.可扩的爬虫内核,便于开发者进行灵活的二次开发.内核具有很强的扩展性,用户可以在内核基础上开发自己想要的爬虫.源码中集成了Jsoup,可进行精准的网页解析. 内核构架图: WebCollector的正文抽取API都被封装为ContentExtracto

KISSY(JS)炫动导航，缓动应用实例（^_^）

一个基于KISSY的简单的动画导航,效果还不错,有点像flash的效果.鼠标移到每一个连接上,背景滑块会迅速移到该链接下方,同时平滑改变大小,自适应链接尺寸,并伴随来回的轻微波动,动感相当不错,呵呵,废话不多说了,看demo吧. 效果查看: http://www.seejs.com/demos/examples/animNav/index.html 特别感谢评论中各位提出的由于在各个链接中快速移动导致的bug,现在已经做了简单的处理,效果应该好多了,呵呵... 1. [代码][JavaScrip

Pixiv日榜2020-4-5精选动漫插画壁纸设计参考

一键下载原文地址:https://www.cnblogs.com/ace-wu/p/12649986.html

NodeJS+Express+MongoDB 简单个人博客系统【Study笔记】

Blog 个人博客系统 iBlog是在学习NodeJs时候一个练手项目Demo 系统支持用户注册/登录,内容文章查看,评论,后台管理(定制显示的分类版块,进行文章内容添加)超级管理员还可进行用户管理等目前只是做了一个比较粗糙的版本,跑通主线模块及部分功能 //通过这个个人练手项目的完成,算是对NodeJs 结合Express 进行Web开发有了一定的认识和理解,路漫漫...还有很多需要去Do 系统还存在很多不稳定及大刀修改的地方[大虾勿喷勿笑] 比较适合刚接触NodeJs 这块的同学,可以当做

电脑如何制作表情包怎么制作gif动图

我们如果每一天都在使用电脑,电脑壁纸肯定也要时常更新,这样才会有新鲜感,但是电脑如何制作表情呢?使用工具:电脑操作方法:1.首先要先找好素材,自己想要什么样的动态壁纸,就找到相关的图片或者视频播放源,通过制作工具来录制视频,也可以直接添加图片制作动态图:2.然后如果找的素材是图片的话,可以选择后者直接添加,如果找的是视频,选择前者启动屏幕录制对视频中的内容进行录制即可:3.点击启动屏幕录制会出现一个录制框,然后打开准备好了的视频就可以开始录制了,在录制的过程中可以随时点击暂停:4.录制完成无须操

梵高数字时钟壁纸下载-电脑时钟壁纸

壁纸名称:冷高轮时间梵高数字时钟壁纸样式:梵高数字动态时钟,王思聪吃热狗数字动态时钟,手势数字动态时钟,大写数字动态时钟,中文汉字动态时钟,麻将数字动态时钟,扑克数字动态时钟电脑壁纸下载可在wallpaper engine或者upupoo上搜索全称“冷高轮时间‘ 电脑屏保可在冷高轮时间官网下载:lenggaolun.com(com前面是点不是句号) 手机APP可在android和ios各大应用市场搜索全称'冷高轮时间“下载. 原文地址:https://www.cnblogs.com/leng

中文汉字时钟电脑动态壁纸

壁纸名称:冷高轮时间中文汉字时钟壁纸样式:梵高数字动态时钟,王思聪吃热狗数字动态时钟,手势数字动态时钟,大写数字动态时钟,中文汉字动态时钟,麻将数字动态时钟,扑克数字动态时钟,男神数字动态时钟,女神数字动态时钟电脑壁纸下载可在wallpaper engine或者upupoo上搜索全称“冷高轮时间‘ 电脑屏保可在冷高轮时间官网下载:lenggaolun.com(com前面是点不是句号) 手机APP可在android和ios各大应用市场搜索全称'冷高轮时间“下载. 原文地址:https://ww