WebRequest 获取网页乱码

问题：在用WebRequest获取网页源码时得到的源码是乱码。

原因：1，编码不对

解决办法：设置对应编码

WebRequest request = WebRequest.Create(Url);
WebResponse response = await request.GetResponseAsync();

Stream stream = response.GetResponseStream();
StreamReader reader = new StreamReader(stream, Encoding.GetEncoding(coding));//这里的coding是页面的编码，可以用Ie右键查看编码。
Result = reader.ReadToEnd();

reader.Dispose();
reader.Dispose();

2，页面进行压缩了

看看html的head,ContentEncoding是否是gzip如果是的话需要解压。//下面的代码是在winrt下的

　　　　　　WebRequest request = WebRequest.Create(Url);
                WebResponse response = await request.GetResponseAsync();
                Debug.WriteLine(((HttpWebResponse)response).StatusDescription);
                if (response.Headers.AllKeys.Contains("Content-Encoding") && response.Headers["Content-Encoding"].ToLower() == "gzip")//如果使用了GZip则先解压
                {
                    using (System.IO.Stream streamReceive = response.GetResponseStream())
                    {
                        using (var zipStream =
                            new System.IO.Compression.GZipStream(streamReceive, System.IO.Compression.CompressionMode.Decompress))
                        {
                            using (StreamReader sr = new System.IO.StreamReader(zipStream, Encoding.GetEncoding(coding)))
                            {
                                Result = sr.ReadToEnd();
                            }
                        }
                    }
                }

WebRequest 获取网页乱码

时间： 2024-10-11 17:40:18

WebRequest 获取网页乱码的相关文章

c#利用WebClient和WebRequest获取网页源代码的比较

前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取网页源代码 WebClient类 WebClient类位于System.Net命名空间下,WebClient类提供向URI标识的任何本地.Intranet或Internet资源发送数据以及从这些资源接收数据的公共方法. 源代码 ///引用命名空间using System.IO;using Syste

获取网页乱码

1.是用curl抓取的数据是用类似gzip压缩后的数据导致的乱码.乱码:curl www.1ting.com |more乱码:curl -H "Accept-Encoding: gzip"www.1ting.com | more不乱码:curl -H "Accept-Encoding: gzip"www.1ting.com | gunzip | more 不乱码:curl www.1616.net |more乱码:curl -H "Accept-Encod

java 如何获取网页的动态内容，并解析网页内容

(笔记) 获取网页的动态内容参考 https://pastebin.com/raw/FePkm2kp Maven: <dependency> <groupId>htmlunit</groupId> <artifactId>htmlunit</artifactId> <version>1.14</version></dependency> 实现: WebClie

IXMLHTTPRequest获取网页源码的心得

在万一老师的博客看到一种利用IXMLHTTPRequest来获取网页源码的方法,但有2个问题没解决,自己研究了下改进了方法. 1.如果网页进行301转跳将无法获取源码 2.如果网站是gb2312编码将获取的是乱码 /////以下方法使用的是Delphi xe2编写 uses MsXML,activex; function GETHTML (const URL : string):string; // XMLHTTP接口Var XMLHTTP:IServerXMLHTTPRequest; HTML

WebClient和WebRequest获取html代码

HTML: <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default.aspx.cs" Inherits="_Default" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtm

获取网页里的邮箱

private void button1_Click(object sender, EventArgs e) //点击获取网页邮箱 { if (textBox1.Text.Trim() != "") { HttpWebRequest wrst = (HttpWebRequest)WebRequest.Create(textBox1.Text); //创建对网页内容(源码)的访问请求(文本框1输入网址) HttpWebResponse wrpse = (HttpWebResponse)w

C# HttpWebRequest 绝技根据URL地址获取网页信息

如果要使用中间的方法的话,可以访问我的帮助类完全免费开源:C# HttpHelper,帮助类,真正的Httprequest请求时无视编码,无视证书,无视Cookie,网页抓取 1.第一招,根据URL地址获取网页信息先来看一下代码 get方法复制代码 publicstaticstring GetUrltoHtml(string Url,string type) { try { System.Net.WebRequest wReq = System.Net.WebRequest.Create(U

爬虫rewquests爬去网页乱码问题

requests在爬取网页时候时候中文显示乱码 import requests url = 'http://www.neihan8.com/wenzi/index_2.html' res = requests.get(url)res.encoding #获取res的编码格式res.headers #获取Content-Type内容res.apparent_encoding #获取网页正确的编码格式 html = res.text# 返回的结果是处理过的Unicode类型的数据 print(res

C#获取网页的HTML码、下载网站图片、获取IP地址

1.根据URL请求获取页面HTML代码 /// <summary> /// 获取网页的HTML码 /// </summary> /// <param name="url">链接地址</param> /// <param name="encoding">编码类型</param> /// <returns></returns> public static string Get

猜你喜欢

.NET中应用Ueditor(富文本编辑)的配置和使用

一.Ueditor的下载 1.百度编辑器下载地址:http://ueditor.baidu.com/website/download.html 2.下载完整源码包,解压到任意目录,解压后的源码目录结构 ...

我像素的理解

1.设备独立像素(device-independent pixels (dips))设备独立像素(也叫密度无关像素),可以认为是计算机坐标系统中得一个点,这个点代表一个可以由程序使用的虚拟像素(比如: ...

linux操作命令实验

实验内容:文件操作与用户操作实验实验设备(环境):电脑.Vmware WorkStation 实验步骤: 一.创建新用户bob 目的:练习useradd命令二.为新用户bob设置口令目的:练习p ...

Silverlight将Excel导入到SQLserver数据库

最近纠结于读取Excel模板数据,将数据导入SQLServer的Silverlight实现,本文将实现代码贴出,作为一个简单的例子,方便各位: 1.先设计前台界面新建Silverlight5.0应用程 ...

SunDay天气——开放源代码

前段时间也些小忙,一直没有时间去弄Github,所以源代码一直没有放出来. 本周末特抽了些时间出来,熟悉了下Github,并把源代码给弄了去.欢迎大牛重吐槽.指导...... 费话不多说,上图. 近期 ...

移动端touch实现下拉刷新

移动端实现下拉刷新第一部分:四个touch事件 1.touchstart:只要将手指放在了屏幕上(而不管是几只),都会触发touchstart事件. 2.touchmove: 当我们用手指在屏幕上滑 ...

margin 使图像水平垂直居中

<html> <head> <title>网页十二</title> <style> .checks1{ width:200px; heigh ...

我的ACM 之大一

当我开始写文章时,已经快12点了,为什么不睡觉?因为还有半小时有CF div2 . 趁着现在有空,有感而发,回顾我的ACM之大一.我第一次接触ACM是在叶老师的宣讲会上,那时就被忽悠了,我单纯地认为参 ...

关于ios的safari下，页面底部弹出登陆遮罩层，呼出软键盘时问题解决

前阵子遇到了一个问题,就是手机端页面弹出遮罩+底部登陆的弹出层. 一般情况下就直接给fixed固定定位了,然而做测试时发现了一个很大的问题 iOS的safari下,固定定位会跑到整个页面的最底部,而不 ...

[LeetCode][JavaScript]Reverse Linked List II

Reverse Linked List II Reverse a linked list from position m to n. Do it in-place and in one-pass. F ...

从企业信息化到信息化企业面临的挑战(2)

(2)--IT规划不科学不合理是致命硬伤作者:大江东去

相量变换的性质

相量线性性质正弦量的线性组合的相量等于各相量的同一线性组合相量变换是线性变换微分性质正弦量对时间的一阶导数等于该正弦量的相量变换乘虚数$ ...

【转】NPOI 单元格级别应用

NPOI 单元格级别应用A HSSFWorkbook hssfworkbook = new HSSFWorkbook();//初始化一个新的HSSFWorkbook实例 //#region 1.创建一 ...

stat()函数--------------获取文件信息

stat():用于获取文件的状态信息,使用时需要包含<sys/stat.h>头文件. 函数原型:int stat(const char *path, struct stat *buf): ...

Android开发者需要面对的8大挑战

移动开发变得越来越受欢迎,但移动开发者正面临着一系列挑战.本文将介绍的是Android开发者需要面对的8个不利因素,例如缺乏硬件标准化,以及软件碎片.为Android OS开发app,给予了开发人员极 ...

EditText电话号码格式化输入、删除案例

我们在输入电话号码的时候,一般都会切割一个较长的电话号码.这种话效果会好非常多..对EditText的监听能够轻松的实现这个需求.仅仅须要我们给相应的EditText加一个监听就OK了..贴一下我写的 ...

android常用组件之ScrollView

ScrollView在android中可以实现滚动视图,手机屏幕大小有限,当显示的内容较多时,滚动视图就派上用场了. 该实例主要是通过布局文件生成视图,只是演示ScrollView的使用,没有考虑整体 ...

Hibernate4.1.4配置二级缓存EHCache步骤

1.当然首先引入EHCache相关的jar包这些包不需要另外下载,在Hibernate官方网站下载Hibernate4.1.7的压缩包(如:hibernate-release-4.1.7.Final ...

文本处理命令--wc、sed

一.wc wc命令的功能为统计指定文件中的字节数.字数.行数,并将统计结果显示输出. 测试文件内容: (my_python_env)[[email protected] ~]# cat test hn ...

UEditor实战分享（二）定制

UEditor提供了三种版本:开发板.Mini版.UBuilder版,其中UBuilder版是支持用户定制功能,UBuilder主要为开发者定制一个最精简的编辑器,故在下载包中不包含开发源码.代码示例 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.