C#.NET常见问题(FAQ)-如何改变字符串编码

public string UTF8ToGB2312(string str)
??????? {
??????????? try
??????????? {???
??????????????? Encoding utf8 = Encoding.GetEncoding(65001);
??????????????? Encoding gb2312 = Encoding.GetEncoding("gb2312");//Encoding.Default ,936
??????????????? byte[] temp = utf8.GetBytes(str);
??????????????? byte[] temp1 = Encoding.Convert(utf8, gb2312, temp);
??????????????? string result = gb2312.GetString(temp1);
??????????????? return result;
??????????? }
??????????? catch? (Exception ex)//(UnsupportedEncodingException ex)
??????????? {
??????????????? MessageBox.Show(ex.ToString());
??????????????? return null;
??????????? }
??????? }
??????? public string GB2312ToUTF8(string str)
??????? {
??????????? try
??????????? {
??????????????? Encoding uft8 = Encoding.GetEncoding(65001);
??????????????? Encoding gb2312 = Encoding.GetEncoding("gb2312");
??????????????? byte[] temp = gb2312.GetBytes(str);
??????????????? MessageBox.Show("gb2312的编码的字节个数:" + temp.Length);
??????????????? for (int i = 0; i < temp.Length; i++)
??????????????? {
??????????????????? MessageBox.Show(Convert.ToUInt16(temp[i]).ToString());
??????????????? }???
??????????????? byte[] temp1 = Encoding.Convert(gb2312, uft8, temp);
??????????????? MessageBox.Show("uft8的编码的字节个数:" + temp1.Length);
??????????????? for (int i = 0; i < temp1.Length; i++)
??????????????? {
??????????????????? MessageBox.Show(Convert.ToUInt16(temp1[i]).ToString());
??????????????? }??????????????
??????????????? string result = uft8.GetString(temp1);
??????????????? return result;
??????????? }
??????????? catch? (Exception ex)//(UnsupportedEncodingException ex)
??????????? {
??????????????? MessageBox.Show(ex.ToString());
??????????????? return null;
??????????? }
??????? }

代码说明:

Encoding utf8 = Encoding.GetEncoding(65001);//使用code page

Encoding gb2312 = Encoding.GetEncoding("gb2312");//通过bodyname

获取字符编码字节序列:byte[] temp=utf8.GetBytes(str);

编码方式转换:byte[] temp1=Encoding.Convert(utf8, gb2312, temp);

获取编码的字符串:string str1=gb2312.GetString(temp1);

这样即完成了字符编码的转换。

Encoding.Default在 简体中文os中一般是gb2312格式。

?

?

更多教学视频和资料下载,欢迎关注以下信息:

我的优酷空间:

http://i.youku.com/acetaohai123

?

我的在线论坛:

http://csrobot.gz01.bdysite.com/

?

问题交流:

QQ:910358960

邮箱:[email protected]

?

?

时间: 2024-11-12 17:00:22

C#.NET常见问题(FAQ)-如何改变字符串编码的相关文章

【转载】不得不知道的Python字符串编码相关的知识

原文地址:http://www.cnblogs.com/Xjng/p/5093905.html 开发经常会遇到各种字符串编码的问题,例如报错SyntaxError: Non-ASCII character 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128),又例如显示乱码.由于之前不知道编码的原理,遇到这些情况,就只能不断的用各种编码decode和encode.....今天整理一个pyt

【转载】Perl中字符串编码的处理

在 Perl看来, 字符串只有两种形式. 一种是octets, 即8位序列, 也就是我们通常说的字节数组. 另一种utf8编码的字符串, perl管它叫string. 也就是说: Perl只熟悉两种编码: Ascii(octets)和utf8(string). utf8 flag在perl内部, 字符串结构由两部分组成: 数据和utf8 flag. 比如字符串"中国"在perl内部的存储是这样:utf8 flag 数据On 中国假如utf8 flag是On的话, perl就会把中国当成

Java 正确的做字符串编码转换

字符串的内部表示? 字符串在java中统一用unicode表示( 即utf-16 LE) , 对于 String s = "你好哦!"; 如果源码文件是GBK编码, 操作系统(windows)默认的环境编码为GBK,那么编译时,  JVM将 按照GBK编码将字节数组解析成字符,然后将字符转换为unicode格式的字节数组,作为内部存储. 当打印这个字符串时,JVM 根据操作系统本地的语言环境,将unicode转换为GBK,然后操作系统将GBK格式的内容显示出来. 当源码文件是UTF-8

PHP 字符串编码的转换

原文链接:http://mangguo.org/php-string-encoding-convert-and-detect/ GBK 和 UTF-8 编码的转换是一个非常恶心的事情,比如像 PHP 中的 json_encode 本身根本不支持 GBK 形式的编码.有两个库函数能够支持编码的转换,通常能够想到的就是 iconv 函数,使用起来也非常爽: iconv('GBK', 'UTF-8//IGNORE', '芒果小站'); // 将字符串由 GBK 编码转换为 UTF-8 编码 但 ico

php中字符串编码

php中抓取网页拼接url的时候经常需要进行编码,这时候就用到两个函数 mb_detect_encoding - 检测字符的编码. mb_convert_encoding - 转换字符的编码 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 <?php /* 使用当前的 detect_order 来检测字符编码 */ echo mb_detect_encoding($str); /* "auto" 将根据 mbstring.language 来扩展

分享万能java字符串编码转换工具类

代码下载地址:http://www.zuidaima.com/share/1795356301560832.htm 原文:分享万能java字符串编码转换工具类 package com.zuidaima.util; import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符,也叫作ISO646-US.Unicode字符集的基本拉丁块 */ publ

JavaScript中有对字符串编码的三个函数:escape,encodeURI,encodeURIComponent

JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decodeURIComponent . 下面简单介绍一下它们的区别 1 escape()函数 定义和用法 escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串. 语法 escape(string) 参数  描述  string  必需.要被转义或编码的字符串. 返回值 已编码的

JavaScript中有三个可以对字符串编码的函数,分别是: escape(),encodeURI(),encodeURIComponent()

JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:unescape,decodeURI,decodeURIComponent . 下面简单介绍一下它们的区别 1 escape()函数 定义和用法 escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串. 语法 escape(string) 参数  描述  string  必需.要被转义或编码的字符串. 返回值 已编码的

python字符串编码理解(转载)

(转载)字符编码和python使用encode,decode转换utf-8, gbk, gb2312 (http://www.cnblogs.com/jxzheng/p/5186490.html) ASCII码 标准ASCII码使用7位二进制数表示大写或小写字母,数字0到9标点符号以及在美式英语中使用的特殊控制字符. 在标准ASCII码中,最高位(b7)用作奇偶校验位,所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分寄校验和偶校验两种.奇校验规定:正确的代码一个字节中1的