c#正则表达式采集数据

protected void Page_Load(object sender, EventArgs e)
{

　　StringBuilder MyStringBuilder = new StringBuilder();

WebRequest request = WebRequest.Create("http://www.dahuatech.com/news.aspx?type=1002");

WebResponse response = request.GetResponse();

StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("utf-8"));

　　MatchCollection TitleMatchs = Regex.Matches(reader.ReadToEnd(), @"<img src=""images/5_02.jpg"" width=""2"" height=""3"">[\s]*<a href=""newsinfo.aspx[?]id=[\d]*&&type=1002"">([\s\S]*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Multiline);

　　foreach (Match NextMatch in TitleMatchs)

　　{

　　　　//s += "<br>" + NextMatch.Groups[1].Value + NextMatch.Groups[2].Value;

　　　　// tb1.Text += "\n" + NextMatch.Groups[1].Value+"\n" + NextMatch.Groups[2].Value;

　　　　tb1.Text += NextMatch.Groups[1].Value.Trim()+"\n";

　　}

c#正则表达式采集数据

时间： 2024-11-10 09:24:42

c#正则表达式采集数据的相关文章

C#+HtmlAgilityPack+XPath带你采集数据(以采集天气数据为例子)

转自原文C#+HtmlAgilityPack+XPath带你采集数据(以采集天气数据为例子) 阅读目录 1.HtmlAgilityPack简介 2.XPath技术介绍与使用 3.采集天气网站案例 4.资源第一次接触HtmlAgilityPack是在5年前,一些意外,让我从技术部门临时调到销售部门,负责建立一些流程和寻找潜在客户,最后在阿里巴巴找到了很多客户信息,非常全面,刚开始是手动复制到Excel,是真尼玛的累,虽然那个时候C#还很菜,也想能不能通过程序来批量获取(所以平时想法要多才好).几

如何使用JavaScript和正则表达式进行数据验证

利用客户端JavaScript的优势,JavaScript中的正则表达式可以简化数据验证的工作,下面与大家分享下如何使用JavaScript和正则表达式进行数据验证,感兴趣的朋友可以参考下哈数据验证是网络应用软件从客户端接受数据的重要步骤,毕竟,您需要在使用客户数据前确保其符合预期的格式.在网络应用程序中,您可以选择使用特定平台的工具,比如ASP.NET.JSP等等,或者您可以利用客户端JavaScript的优势,JavaScript中的正则表达式可以简化数据验证的工作. 正则表达式正则表达

基于PHP采集数据入库程序（二）

在上篇基于PHP采集数据入库程序(二) 中提到采集新闻信息页的列表数据,接下来讲讲关于采集新闻具体内容这是上篇博客的最终数据表截图: 接下来要做的操作就是从数据库中读取所需要采集的URL,进行页面抓取就行新建一个content表不过需要注意的一点是,不能再采用采集URL这种id递增的方法去采集,因为数据表中可能出现id断续,比如id=9,id=11,当采集到id=10的时候,URL是空白的,这样可能会导致采集到了空字段. 这里用到的一个技巧是数据库的查询语句,在我们采集完第一条数据的时候,

使用ScrapySharp快速从网页中采集数据

转自原文使用ScrapySharp快速从网页中采集数据 ScrapySharp是一个帮助我们快速实现网页数据采集的库,它主要提供了如下两个功能从Url获取Html数据提供CSS选择器的方式解析Html节点安装: ScrapySharp可以直接从Nuget上下载,直接从Package Console里面输入如下命令即可: PM> Install-Package ScrapySharp Html下载首先我们来看看它的Html下载功能,它是通过ScrapingBrowser类来实现的: va

Flume简介与使用（二）——Thrift Source采集数据

Flume简介与使用(二)——Thrift Source采集数据继上一篇安装Flume后,本篇将介绍如何使用Thrift Source采集数据. Thrift是Google开发的用于跨语言RPC通信,它拥有功能强大的软件堆栈和代码生成引擎,允许定义一个简单的IDL文件来生成不同语言的代码,服务器端和客户端通过共享这个IDL文件来构建来完成通信. Flume的Thrift Source是其实现的众多Source中的一个,Flume已经实现了服务器端,因此我们可以用任意自己熟悉的语言编写自己的Th

[PHP自动化－进阶]001.模拟登录并采集数据

引言:PHP可以通过libcurl实现模拟登录,提交数据,违法乱纪,烧杀抢虐等等事项. 简单说明一下"libcurl",补一下脑: libcurl目前支持http.https.ftp.gopher.telnet.dict.file和ldap协议. libcurl同时也支持 HTTPS认证.HTTP POST.HTTP PUT. FTP 上传(这个也能通过PHP的FTP扩展完成).HTTP 基于表单的上传.代理.cookies和用户名+密码的认证. 使用curl可以实现Get和Post请

基于PHP采集数据入库程序（一）

前几天有一朋友要我帮做一个采集新闻信息的程序,抽了点时间写了个PHP版本的,随笔记录下. 说到采集,无非就是远程获取信息->提取所需内容->分类存储->读取->展示也算是简单"小偷程序"的加强版吧下面是对应核心代码(别拿去做坏事哦^_^) 所要采集的内容是某游戏网站上的公告,如下图: 可先利用file_get_contents和简单正则获取基本页面信息整理下基本信息,采集入库: <?php include_once("conn.php&qu

linux使用UVC采集数据

V4L2是V4L的升级版本,linux下视频设备程序提供了一套接口规范. 常用的结构体在内核目录include/linux/videodev2.h中定义 struct v4l2_requestbuffers //申请帧缓冲,对应命令VIDIOC_REQBUFS struct v4l2_capability //视频设备的功能,对应命令VIDIOC_QUERYCAP struct v4l2_input //视频输入信息,对应命令VIDIOC_ENUMINPUT st

NodeJs+Request+Cheerio 采集数据

目的:采集网站文章. 两个依赖项: request :https://github.com/request/request cheerio:https://github.com/cheeriojs/cheerio package.json文件: { "name":"zqz", "version":"1.0.1", "private":false, "dependencies":{ &qu