获取URL网页信息

        static string GetHtml(string url)
        {string strHTML = "";
            WebClient myWebClient = new WebClient();
            Stream myStream = myWebClient.OpenRead(url);
            StreamReader sr = new StreamReader(myStream, System.Text.Encoding.GetEncoding("utf-8"));
            strHTML = sr.ReadToEnd();
            myStream.Close();
            return strHTML;
        }

        static bool GetHtml(string url)
      {

            HttpWebRequest myHttpWebRequest = (HttpWebRequest)WebRequest.Create(url);
            myHttpWebRequest.Timeout = 20 * 1000; //连接超时
            myHttpWebRequest.Accept = "*/*";
            myHttpWebRequest.UserAgent = "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0;)";
            HttpWebResponse myHttpWebResponse = (HttpWebResponse)myHttpWebRequest.GetResponse();
            Stream stream = myHttpWebResponse.GetResponseStream();
            StreamReader sr =
               new StreamReader(stream, Encoding.GetEncoding("utf-8"));
            var html = sr.ReadToEnd();
                   }

获取当前Cookies保存后获取整站信息

static void Main(string[] args)
        {

            Console.WriteLine("确保挂载VPN后。。。回车键继续!");
            Console.ReadKey();

            string url = "http://www.sciencedirect.com/science/journal/00118486/61/6";

            string indata = "aa=zhuye";
            CookieContainer myCookieContainer =
                new CookieContainer();
            //新建一个cookiecontainer来存放cookie集合
            HttpWebRequest myHttpWebRequest =
                (HttpWebRequest)WebRequest.Create(url);
            //新建一个httpwebrequest
            myHttpWebRequest.ContentType = "application/x-www-form-urlencoded";
            myHttpWebRequest.ContentLength = indata.Length;
            myHttpWebRequest.Method = "post";
            myHttpWebRequest.CookieContainer = myCookieContainer;
            //设置httpwebrequest的cookiecontainer为
            //刚才建立的那个mycookiecontainer
            Stream myRequestStream = myHttpWebRequest.GetRequestStream();
            StreamWriter myStreamWriter = new StreamWriter(myRequestStream, Encoding.GetEncoding("gb2312"));
            myStreamWriter.Write(indata);
            //把数据写入httpwebrequest的request流
            myStreamWriter.Close();
            myRequestStream.Close();
            //关闭打开对象
            HttpWebResponse myHttpWebResponse =
                (HttpWebResponse)myHttpWebRequest.GetResponse();
            //新建一个httpwebresponse
            myHttpWebResponse.Cookies = myCookieContainer.GetCookies(myHttpWebRequest.RequestUri);

            Console.WriteLine("获取cookies成功!。。。关闭VPN后任意键继续");
            Console.ReadKey();

            var htmlData = SaveCook(myHttpWebRequest, prevUrl, myCookieContainer, myHttpWebResponse);

            }
        }
 public static string SaveCook(HttpWebRequest myHttpWebRequest, string url, CookieContainer myCookieContainer, HttpWebResponse myHttpWebResponse)
        {
            //拿到了cookie,再进行请求就能直接读取到登录后的内容了
            myHttpWebRequest = (HttpWebRequest)WebRequest.Create(url);
            myHttpWebRequest.CookieContainer = myCookieContainer;//*
                                                                 //刚才那个cookiecontainer已经存有了cookie,把它附加到

            myHttpWebResponse = (HttpWebResponse)myHttpWebRequest.GetResponse();
            myHttpWebResponse.Cookies =
                myCookieContainer.GetCookies(myHttpWebRequest.RequestUri);

            Stream myresponsestream = myHttpWebResponse.GetResponseStream();
            StreamReader mystreamreader =
               new StreamReader(myresponsestream, Encoding.GetEncoding("gb2312"));

            var html = mystreamreader.ReadToEnd();
            //把数据从httpwebresponse的response流中读出
            mystreamreader.Close();
            myresponsestream.Close();
            return html;

        }
时间: 2024-11-13 08:20:38

获取URL网页信息的相关文章

用javascript获取url网址信息

用javascript获取url网址信息 <script type="text/javascript">document.write("location.host="+location.host+"<br>");document.write("location.hostname="+location.hostname+"<br>");document.write(&quo

Request获取url各种信息的方法

1.Request获取url各种信息的方法 测试的url地址:http://www.test.com/testweb/default.aspx, 结果如下: Request.ApplicationPath: /testweb Request.CurrentExecutionFilePath: /testweb/default.aspx Request.FilePath: /testweb/default.aspx Request.Path: /testweb/default.aspx Reque

获取URL相关信息

import java.net.URL; import java.net.URLConnection; import java.net.ConnectException; import java.io.IOException; import java.util.Date; import java.net.HttpURLConnection; public class GetURLInfo{ public static void printInfo(URL url){ System.out.pri

web获取URL相关信息

http://www.xxx.com/project/path/user.do?param=1111 springMVC中返回如下 request.getRequestURL():返回http://www.xxx.com/project/path/user.do request.getRequestURI(): 返回/project/path/user.do request.getServletPath():  返回/path/user.do request.getQueryString():

C# HttpWebRequest 绝技 根据URL地址获取网页信息

如果要使用中间的方法的话,可以访问我的帮助类完全免费开源:C# HttpHelper,帮助类,真正的Httprequest请求时无视编码,无视证书,无视Cookie,网页抓取 1.第一招,根据URL地址获取网页信息 先来看一下代码 get方法 复制代码 publicstaticstring GetUrltoHtml(string Url,string type) { try { System.Net.WebRequest wReq = System.Net.WebRequest.Create(U

jsp Request获取url信息的各种方法比较

从Request对象中可以获取各种路径信息,以下例子: 假设请求的页面是index.jsp,项目是WebDemo,则在index.jsp中获取有关request对象的各种路径信息如下 String path = request.getContextPath(); String basePath = request.getScheme()+"://"+request.getServerName()+":"+request.getServerPort()+path+&q

小白学react之网页获取微信用户信息

通过上一篇<小白学react之EJS模版实战>我们学习了如何通过EJS模版生成我们高定制化的index.html文件. 本篇我们将会继续延续我们的alt-tutorial项目的实战计划,去获取微信扫码用户的信息,并将头像显示在我们页面的右上角上. 最终实战效果将如下所示. 首先根据我们的网站url生成二维码,比如我们可以通过浏览器的FeHelper来生成: 然后用户通过微信扫码: 最后用户确定授权后获取到用户的基本信息,并将头像显示在右上角: 1. 内网穿透准备 我们获取微信用户信息的过程中,

jQuery 获取 URL信息

jQuery获取URL信息有很多方法,但是使用这个插件就非常爽了. 托管地址在:http://github.com/allmarkedup/jQuery-URL-Parser // http: //localhost:19090/home/index?id=1 var source = $.url.attr("source"); // http://localhost:19090/home/index?id=1 var protocol = $.url.attr("proto

一个用php实现的获取URL信息的类

获取URL信息的类 使用这个类,你能获得URL的如下信息: - Host  - Path  - Statuscode (eg. 404,200, ...)  - HTTP Version  - Server  - Content Type  - Date  - The whole header string of the URL 复制代码 代码如下: <? /** * Class for getting information about URL's * @author    Sven Wage