中文字符串转换为utf-8编码

public static String toUtf8String(String s) {
		StringBuffer sb = new StringBuffer();
		for (int i = 0; i < s.length(); i++) {
			char c = s.charAt(i);
			if (c >= 0 && c <= 255) {
				sb.append(c);
			} else {
				byte[] b;
				try {
					b = Character.toString(c).getBytes("utf-8");
				} catch (Exception ex) {
					System.err.println(ex);
					b = new byte[0];
				}
				for (int j = 0; j < b.length; j++) {
					int k = b[j];
					if (k < 0)
						k += 256;
					sb.append("%" + Integer.toHexString(k).toUpperCase());
				}
			}
		}
		return sb.toString();
	}

时间: 2024-12-29 11:39:29

中文字符串转换为utf-8编码的相关文章

十六进制Unicode编码字符串与中文字符串的相互转换

图书馆客户端项目中遇到的一个问题,得到的URL 是这样的 String baseurl = "http://innopac.lib.xjtu.edu.cn/availlim/search~S1*chx?/X{u848B}{u4ECB}{u77F3}&searchscope=1&SORT=DZ/X{u848B}{u4ECB}{u77F3}&searchscope=1&SORT=DZ&extended=0&SUBKEY=%E8%92%8B%E4%BB%

c/c++ 中文字符串转Unicode和UTF8

1. 描述 在windows上做系统编程,少不了会遇到处理中文字符串的问题.而大多时候中文汉字都是以多字节编码的方式展现的.为了实现更好的兼容性或一些特殊的需求,(比如在网页上显示.)常需要将其转换成unicode或者utf8的格式. 2. 代码示例 2.1 中文字符串转Unicode /************************************************************************ *int CN2Unicode(char *input,wcha

javascript如何将字符串转换为数字

javascript如何将字符串转换为数字:在编码中有可能用到将字符串转换为数字,尤其是在涉及数字计算的环境,下面就简单介绍一下如何进行转换.1).parseInt()函数进行转换:此函数可以解析一个字符串,并返回一个整数.代码实例如下: parseInt("12px");//返回12 parseInt("0xA");//返回10 parseInt("2.3");//返回2 parseInt("blue");//返回NaN 更

浏览器端将语音转换为URL格式的字符串(base64 位编码)

我们可以在浏览器端,通过调用 JS 原生的 API,将语音转换为文字,实现语音输入的效果.思路是: 录制一段音频: 将音频转换为 URL 格式的字符串(base64 位编码): 调用讯飞开放接口,将 base64 位编码转换为文本. 这篇文章实现前两步,将音频转换为 URL 格式的字符串(base64 位编码). 这里将会用到于媒体录制相关的诸多 API,先将其列出: MediaDevices (MediaDevices 使用方法) MediaDevices 接口提供访问连接媒体输入的设备,如照

基础二(格式化字符串、运算符和编码)_day02

一.Python的输出 (1)纯输出一个字符串或数字 print("Hello World") #输出 Hello World print(34) #输出 34 (2)利用字符串连接符号(+)输出 name = input("请输入你的名字") #提示用户输入名字 print("您的名字是:"+name) 用字符串拼接就很麻烦了,所以就有了格式化字符串输出 (3)格式化字符串输出 1 #!/usr/bin/env python 2 # -*- c

CodeIgniter 如何解决URL含有中文字符串

codeIgniter默认的配置下是不允许URL中包含非ASCII字符的,如果URL中含非ASCII字符,那么CI会毫不客气的抛出错误.本文章向码农介绍CodeIgniter 如何解决URL含有中文字符串. 你 可能会说,那我把这个URL使用函数urlencode一下呢?不行.因为Web Server会在接收到一个被urlencode的URL后自动将其decode,然后在PHP里得到的这些字符串转换成他原来所代表的含义,并使用 Web Server自己的URL编码字符集(IIS6 中文版是GBK

【转载】Python使用中文正则表达式匹配指定中文字符串的方法示例

本文实例讲述了Python使用中文正则表达式匹配指定中文字符串的方法.分享给大家供大家参考,具体如下: 业务场景: 从中文字句中匹配出指定的中文子字符串 .这样的情况我在工作中遇到非常多, 特梳理总结如下. 难点: 处理GBK和utf8之类的字符编码, 同时正则匹配Pattern中包含汉字,要汉字正常发挥作用,必须非常谨慎.推荐最好统一为utf8编码,如果不是这种最优情况,也有酌情处理. 往往一个具有普适性的正则表达式会简化程序和代码的处理,使过程简洁和事半功倍,这往往是高手和菜鸟最显著的差别.

PHP 统计中文字符串的长度

中文网站一般会选择两种编码:gbk/gb2312或是utf-8. gbk编码下每个中文字符所占字节为2,例: $zhStr = ‘您好,中国!’; echo strlen($zhStr); // 输出:12 UTF-8编码下每个中文字符占3个字节. $zhStr = ‘您好,中国!’; echo strlen($zhStr); // 输出:18 那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的

php中文字符串截取方法实例总结

本文实例总结了php中文字符串截取方法,非常实用的技巧.具体方法分析如下: 1.使用mbstring扩展库的mb_substr截取就不会出现乱码了. 2.自己书写截取函数,但效率不如用mbstring扩展库来得高. 3.如果仅是为了输出截取的串,可用如下方式实现:substr($str, 0, 30).chr(0). substr()函数可以分割文字,但要分割的文字如果包括中文字符往往会遇到问题,这时可以用mb_substr()/mb_strcut这个函 数,mb_substr()/mb_str