提取网站图片

protected void sub_Click(object sender, EventArgs e)
{
int i = 0;
string url = this.url.Text;
Directory.CreateDirectory("D:/aspnetjia/"+url);
string result = GetWebRequest(url);
//this.content.InnerText = result;
MatchCollection results = Regex.Matches(result, @"<img\s[^>]*src=([""‘]*)(?<src>[^‘""]*)\1[^>]*>", RegexOptions.IgnoreCase);
string[] d = new string[results.Count];
foreach (Match m in results)
{
d[i] = m.Groups["src"].Value;
i++;
}
for (int j = 0; j < d.Length; j++)
{
string jieguo = "";
int jj = j + 1;
string jie = d[j].ToString();
//if (jie.Contains(url))
//{
// jie.Replace(url,"");
//}
if (jie.Contains("www.") || jie.Contains("http"))
{
jieguo = "<a href=‘"+jie+"‘><img src=‘"+jie+"‘></a>";
}
else
{
jieguo = "<a href=‘" + url + "/" + jie + "‘><img src=‘" + url + "/" + jie + "‘></a>";
}
Random rand = new Random();//定义一个随机数,为了防止你要上传得图片重名
string[] strSpil = jie.Split(‘.‘);//将此地址用.号进行分割(img/1.jpg)
string strEnd = strSpil[strSpil.Length - 1].ToLower();//得到后面的("jpg", "gif", "bmp", "png","jpeg","JPG","GIF","BMP","PNG","JPEG")

string strName = DateTime.Now.ToString("yyyymmmddhhss") + rand.Next(100, 9999).ToString();//得到不同得名字
string strPointEnd = strName+"."+strEnd;

System.Net.WebClient myWebClient = new System.Net.WebClient();
if (jie.Contains("http"))
{
myWebClient.DownloadFile(jie, "D:/aspnetjia/" +url+"/"+strPointEnd);
}
else
{
myWebClient.DownloadFile(url +"/"+jie, "D:/aspnetjia/"+url +"/"+strPointEnd);
}
//Response.Write("正在下载第"+j+"张...");
}
Response.Write("请查看你D盘下aspnetjia文件夹");
}
private string GetWebRequest(string url)
{
Uri uri = new Uri(url);
WebRequest myReq = WebRequest.Create(uri);
WebResponse result = myReq.GetResponse();
Stream receviceStream = result.GetResponseStream();
StreamReader readerOfStream = new StreamReader(receviceStream, System.Text.Encoding.GetEncoding("utf-8"));
string strHTML = readerOfStream.ReadToEnd();
readerOfStream.Close();
receviceStream.Close();
result.Close();
return strHTML;
}

转载自:http://www.aspnetjia.com

时间: 2024-08-14 04:27:51

提取网站图片的相关文章

6188 网站图片爬虫

Spider 本次使用的为python3.4 爬取www.6188.com上壁纸 第一步,我们先看网站分析,寻找规律: 我们要抓取的是网站所有的图片,通过对网站结构的分析,发现其中规律: 网站图片是按类区分的,每一个类别在主页(A)中有一个链接(B),该链接中有一个该类的列表(C),每一个类表中为图片list(D),ist中有图片的真实地址 ·大致结构图如下: 好了,网站结构了解了,循序渐进,一步步获取图片. 从主页开始分析其中包含的类别如图: 源码: 其中包含两大类,wallpaper和pho

使用Python下载妹子图网站图片

最近在学习Python的爬虫部分.看到有网友在分享使用爬虫爬取各种网站的图片的代码,也想自己写个玩玩.今天花时间分析了一下妹子图网站的结构和HTML代码,使用urllib2和BeautifulSoup写出了一个自动下载妹子图网站图片的脚本. 妹子图网址:http://www.mzitu.com 运行效果如下: 源代码如下,请各位大神指教: # -*- coding:utf8 -*- # Python:         2.7.8 # Platform:       Windows # Autho

80行Python代码实现自动爬取色情网站图片

用Python爬取色情网站的图片,技术宅的小玩具.在这里我将会向你详细介绍用Python下载一个色情网站图片的全部步骤,你会从中看到Python的简洁以及技术宅的无聊. 首先你应该应该有一个色情网站的网址,当然我不会给你的,自己找!!!我会告诉你其中的规律: http://www.*****.com/htm/piclist[1]/[2].htm 一个色情网站的图片区中,URL不同的只有[1][2]两处,通过观察你可以发现,[1]处表示图片种类(丝袜美腿.清纯唯美.****.and so on),

seo网站图片如何优化

各大搜索引擎对于图片的识别技术越来越成熟,但还是没有达到能100%识别图片内容的地步.网站中的图片优化急需一个完整的解决办法,下面我以太原雅辉装修公司网站中的近1000张图片优化经历来分享网站图片优化的实用技巧. 一.站内图片该有的属性一个都不能少 1.alt:用户是不会看这个属性的,但是对与搜索引擎来说却非常管用,现在搜索引擎还没有达到能100%准确识别图片内容的时候,所以alt属性依然不可忽视. 2.width.height:同样,用户也不会关心这个图片的宽高,只要看上去舒服就行.蜘蛛在爬取

C#获取网页的HTML码、下载网站图片、获取IP地址

1.根据URL请求获取页面HTML代码 /// <summary> /// 获取网页的HTML码 /// </summary> /// <param name="url">链接地址</param> /// <param name="encoding">编码类型</param> /// <returns></returns> public static string Get

Windows平台网站图片服务器架构的演进

摘要 在主流的Web站点中,图片往往是不可或缺的页面元素,尤其在大型网站中,几乎都将面临"海量图片资源"的存储.访问等相关技术问题.在针对图片服务器的架构扩展中,也会历经很多曲折甚至是血泪教训(尤其是早期规划不足,造成后期架构上很难兼容和扩展). 本文将以一个真实垂直门户网站的发展历程,向大家娓娓道来. 正文 构建在Windows平台之上的网站,往往会被业内众多架构师认为很"保守".很大部分原因,是由于微软技术体系的封闭和部分技术人员的短视造成的.由于长期缺乏开源支

调用opencv相关函数,从视频流中提取出图片序列

/************************ @HJ 2017/3/30 参考http://blog.sina.com.cn/s/blog_4b0020f301010qcz.html修改的代码 @主要调用opencv相关函数,从视频流中提取出图片序列 @需要注意的问题: cvReleaseImage(&pImg)释放内存出错的两种情况:具体可以参考http://www.cnblogs.com/grandyang/p/4615036.html 1)从摄像头获取的图片不能被修改和释放,所以如果

一般网站上传图片的大小是多少?网站图片上传格式大小建议 附带简单修图方法

一般网站上传图片的大小是多少呢?尚网汇智给您列一下网站图片上传格式大小建议: 首先,上传图片格式: 通常图片以JPG图片居多,JPG格式的图片较小,图片也比较柔和 不过特殊情况就要用特殊格式的图片了 如1:图片为动画形式,则可以使用GIF动画格式,存成JPG图片就不会动了 如2:图片为透明或半透明格式,则建议使用24位PNG格式图片,兼容性更好,边缘也显示得更好 然后,就是上传图片的大小问题了: 通常,尚网汇智开发网站时会在后台对各栏目需要上传图片的地方做对应标记(例:最佳尺寸:宽100像素 *

网站图片增强JS插件2.0(兼容IE&amp;FF)

网站图片增强JS插件2.0简单介绍:插件可以增强网站互动能力与外链建设,用户在欣赏图片的同时,把看好的图片直接制作成自己喜欢的样式后通过QQ等传播,增强外链建设,通过用户互动创造外链.(支持:放大缩小.加文字.闪图.叠图.加对话框等等,特别支持GIF动画.)使用方法:复制并粘贴下面的JS代码,放到您的网页的最末端,如果您的网站使用的模板,您也可以复制代码到您的模板,图片编辑功能将会体现在您每一张图片上.<!-- Prcture Editor BEGIN --><script langua