使用WebClient下载网页，用正则匹配需要的内容

WebClient是一个操作网页的类

webClient web=new WebClient（）；

web.DownloadString(网页的路径，可以是本地路径);--采用的本机默认的编码格式返回值为string

如果网页采用用的是utf8的话用 web.DownloadData(与DownloadString用法一样) 的返回值为byte[](字节数组)

一个简单的匹配图片下载的代码：

static void Main(string[] args)

{

//操作网页的一个类

WebClient web = new WebClient();

//<img
src="https://gss3.bdstatic.com/84oSdTum2Q5BphGlnYG/timg?wapp&quality=80&size=b65_65&subsize=20480&cut_x=0&cut_w=0&cut_y=0&cut_h=0&sec=1369815402&srctrace&di=9f6cdc0624f7b25832f34ad393db5063&wh_rate=null&src=http%3A%2F%2Fimgsrc.baidu.com%2Fforum%2Fpic%2Fitem%2Fe824b899a9014c084548ecd9087b02087bf4f45f.jpg"/>

byte[] buffer = web.DownloadData(@"https://tieba.baidu.com/f?kw=%E5%A5%BD%E7%9C%8B%E7%9A%84%E5%9B%BE%E7%89%87&fr=fenter&prequery=%E5%A5%BD%E7%9C%8B%E7%9A%84%E5%9B%BE%E7%89%87%E5%A4%A7%E5%85%A8%E5%B8%A6%E5%AD%97");

//将字节转换成字符串，该网页采用的是utf8编码格式

string html = Encoding.UTF8.GetString(buffer);

MatchCollection mc = Regex.Matches(html, @"<img.+?(?<priSrc>https.+?\.jpg).+?>");

int i = 0;

foreach (Match item in mc)

{

i++;

Console.WriteLine(item.Value);

string uri = item.Groups["priSrc"].Value;

string path = Path.Combine(@"C:\Users\Administrator\Desktop\images", +i+".jpg");

//用DownloadFile下载文件

web.DownloadFile(uri, path);

}

Console.ReadKey();

}

读取之后转化为字符串（自己转把，不写了）就能把网页拿过来搞事情了

时间： 2024-12-22 21:05:25

使用WebClient下载网页，用正则匹配需要的内容的相关文章

正则匹配括号中内容

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> </head> <body> <script> var reg = /\((.+?)\)/g; var reg2 = /\((.+?)\)/; var str = 'scale(1.5)

C#控制台基础正则表达式,regex,webclient下载博客园网页中的一张图片

1 网页图这网页就一张图片,新手入门,找个简单一些的. 2 代码 1 正则表达式,regex,webclient下载博客园网页中的一张图片 2 3 4 using System; 5 using System.Collections.Generic; 6 using System.IO; 7 using System.Linq; 8 using System.Net; 9 using System.Text; 10 using System.Text.RegularExpressions; 1

捧腹网短笑话正则匹配-如何剔除网页源码的制表符

以捧腹网的短笑话为例,我们可以通过requests方法提取出网页的源代码,然后通过正则匹配来得到相关的短笑话第一步,得到网页源码,使用requests的get方法,需要注意的是,网页默认编码是utf-8,我们需要指定编码格式为utf-8,才能正确显示出网页的文本信息 #-*- coding:utf-8 -*-import requestsimport re respon=requests.get('https://www.pengfu.com/xiaohua_1.html?qq-pf-to=p

web爬虫，scrapy模块标签选择器下载图片，以及正则匹配标签

标签选择器对象 HtmlXPathSelector()创建标签选择器对象,参数接收response回调的html对象需要导入模块:from scrapy.selector import HtmlXPathSelector select()标签选择器方法,是HtmlXPathSelector里的一个方法,参数接收选择器规则,返回列表元素是一个标签对象 extract()获取到选择器过滤后的内容,返回列表元素是内容选择器规则 //x 表示向下查找n层指定标签,如://div 表示查找所有div标签

php正则匹配用户名必须包含字母和数字且大于6位

php正则匹配用户名必须包含字母和数字且大于6位 UEditor 1.4.3版本中去掉本地自动保存功能右键菜单没有新建文本文档txt 常见HTTP错误代码大全 http常见状态码 eclipse内存溢出错误为什么井盖是圆的?--揭开面试题的神秘面目! Linux Centos 6.6搭建SFTP服务器密码强度检测 JS判断检测用户输入密码强度代码对程序员来说,提高薪水最好的建议是什么? CSS3仿淘宝右侧固定导航悬浮层 jQuery仿淘宝网登录拖动滑块验证码代码 jQuery单击div更

C# 网络编程之webBrowser获取网页url和下载网页中图片

该文章主要是通过C#网络编程的webBrowser获取网页中的url并简单的尝试下载网页中的图片,主要是为以后网络开发的基础学习.其中主要的通过应用程序结合网页知识.正则表达式实现浏览.获取url.下载图片三个功能.而且很清晰的解析了每一步都是以前一步为基础实现的. 一.界面设计界面设计如下图所示,添加控件如图,设置webBrowser1其Anchor属性为Top.Bottom.Left.Right,实现对话框缩放;设置groupBox1其Dock(定义要绑到容器控件的边框)为Buttom,实

c# 下载网页图片

也是比较老的东西了最近用到记录下以免以后忘了要下载图片首先要有图片地址要有图片地址就要先把网页下下来分析下URL 下载网页一般用两种方法 1,用 system.net.webclient using System.Net; using System.Windows.Forms; string url = "http://www.cnblogs.com"; string result = null; try { WebClient client = new WebClient()

Nginx 笔记与总结（7）Location：正则匹配

在 /usr/local/nginx/conf/nginx.conf 的默认 server 段中,保留默认的 location 信息(之前测试的 location 配置删除): location / { root html; index index.html index.htm; } 在 /var/www 下创建 image 目录: [[email protected] ~]# cd /var/www [[email protected] www]# mkdir image 使用 wget 或者

JavaWeb学习之转发和重定向、会话技术：cookie、session、验证码实例、URLConnection使用（下载网页）（4）

1.转发和重定向 HttpServletResponse response 转发: RequestDispatcher dispatcher = request.getRequestDispatcher("/secondServlet"); request.setAttribute("pwd","123");//这里设置的值在secondServlet中可以获取到 dispatcher.forward(request, response);//调

猜你喜欢

jdk和jre是什么?都有什么用?（转帖）

jdk和jre是什么?都有什么用?(转帖) 文章分类:Java编程大家肯定在安装JDK的时候会有选择是否安装单独的jre,一般都会一起安装,我也建议大家这样做.由于这样更能帮助大家弄清楚它们的差别: ...

MySQL Workbench不能启动

1.1.1 现象下载的MySQL Workbench ZIP包,解压缩后运行不了,查看windows事件查看器,信息如下: 1.1.2 原因根据事件查看器的提示,应该是.net的运行环境没有装,但 ...

用表格制作百度首页

前一天学习了<table>和一系列的小指令用来制作表格,然后老师布置了制作百度首页的任务,看上去像是很简单结果还是弄了一天的时间,好在最后知道了错误修改的还算美观. 制作很简单,就是小细节 ...

Windows程序设计（c语言）第1章 SDK入门

一.学习背景现在我们要学的是Windows32的编程,与DOS不同的是,实现的目标是一个具有你所需要的功能的"窗口".这个"窗口"时时刻刻都在与操作系统之间, ...

编程中无穷大的设定

如果问题中各数据的范围明确,那么无穷大的设定不是问题,在不明确的情况下,很多程序员都取0x7fffffff作为无穷大,因为这是32-bit int的最大值.如果这个无穷大只用于一般的比较(比如求最小值 ...

c++模板编程-typename与class关键字的区别

最近一直在研究c++模板编程,虽然有些困难,但希望能够坚持下去.今天,在书上看见一个讨论模板编程typename与class两个关键字的区别,觉得挺有意义的,就把它们给总结一下. 先看一个例子: te ...

uva 11728 - Alternate Task(数论)

题目链接:uva 11728 - Alternate Task 题目大意:给出S,求N,要求N所有的因子和为S. 解题思路:枚举因子i,所有整除i的数和加上i. #include <cstdio ...

从未如此惊艳！你好，SuperTextView

欢迎使用 SuperTextView,这篇文档将会向你展示如何使用这个控件来提高你构建项目的效率. SuperTextView 继承自 TextView,它能够大量的减少布局的复杂程度,并且使得一些常 ...

AnjularJS系列3 —— 数据的双向绑定

第三篇,双向的数据绑定数据绑定是AnguarJS的特性之一,避免书写大量的初始代码从而节约开发时间我们想象一下Model是你的应用中的简单事实. 你的Model是你用来读取或者更新的部分.数据绑定 ...

LeetCode:Valid Palindrome(need update)

Given a string, determine if it is a palindrome, considering only alphanumeric characters and ignori ...

假如当时我没醒来

假如当时我没有醒来,世界与我再也无关.生命太脆弱了,活着真好. 这个春节假期,回老家一周,然后又是一阵阵感慨.先是获知一个大伯得了癌症,再是和堂弟无意间聊天得知一个不幸的小女孩已经不再人世了.听到每个 ...

原生js实现ajax的方法

var Ajax={ get: function (url,fn){ var obj=new XMLHttpRequest(); // XMLHttpRequest对象用于在后台与服务器交换数据 ob ...

VMware中Red Hat Enterprise Linux 7 配置桥接模式局域网

在VMware中将虚拟机的网络连接设置为桥接模式. 在Red Hat中,找到应用程序--杂项--网络连接. 修改以太网下面的网络连接,在IPV4设置中,将方法改为"手动",添加地址 ...

[转][C#]压缩解压缩类 GZipStream

本文来自:https://msdn.microsoft.com/zh-cn/library/system.io.compression.gzipstream(v=vs.100).aspx using ...

用Eclipse新建一个web项目没有自动生成web.xml

我们首先打开Eclipse,如下: 我们可以看到在"WEB-INF"文件夹下没有web.xml文件. 这是是什么原因呢,我们来看看,我们首先来新建一个web工程,如下: ...

(原创)c#学习笔记03--变量和表达式03--变量02--变量的命名

3.3.2 变量的命名基本的变量命名规则如下: 变量名的第一个字符必须是字母.下划线(_)或@. 其后的字符可以是字母.下划线或数字. 另外,有一些关键字对于C#编译器而言有特定的含义,例如前面出 ...

MiS603开发板第三章多路分频器设计

作者:MiS603开发团队日期:20150911 公司:南京米联电子科技有限公司论坛:www.osrc.cn 网址:www.milinker.com 网店:http://osrc.taobao.c ...

使用aforg.net 捕获摄像头附源码

? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 ...

swoole异步同步redis

在swoole开发中我们需要学习很多的知识点 , 就像swoole开篇部分说的重新定义PHP,那么在swoole当中最关键的异步和同步问题就凸现出来: redis用于保存变量文件的一个工具,功能强大 ...

项目游戏开发日记 No.0x000004

还有两周就要交项目了, 我们的作品, 作为作业, 好吧, 其实它完成了接近50%, (only the first bate), 其实也是各种各种忙, 然后才赶出来的进度, 另外, 立项说明书, 需求 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.