python_判断字符串编码的方法

1. 安装chardet

在命令行中,进入Python27\Scripts目录,输入以下的命令:easy_install chardet

2. 操作

import chardet
f = open(‘file‘,‘r‘)
fencoding=chardet.detect(f.read())
print fencoding

fencoding输出格式 {‘confidence‘: 0.96630842899499614, ‘encoding‘: ‘GB2312‘} ,只能判断是否为某种编码的概率。比较准确的结果了。输入参数为str类型。

备注:

  • str利用decode方法根据str的编码将其解码为unicode字符串类型
  • str利用encode根据特定的编码将unicode字符串类型转换为特定的编码
时间: 2024-10-08 03:14:58

python_判断字符串编码的方法的相关文章

PHP判断字符串编码是否为utf8以及转换问题

今天说说编码乱码问题,当一个页面存在两种编码的时候,无论你乍么选择都会出现乱码,解决方法: 1.你据在网页编码是哪个. 2.首先判断字符串编码是否为utf8代码如下: PHP代码 function is_utf8($word) { if (preg_match("/^([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128

关于判断字符串长度的方法

关于判断字符串长度的方法 在一个中英文混合的字符串中,怎么判断它的长度,按英文占一个字节,汉字两个字节的标准比如“你好ni”,长度就是6        “abcd” 长度是4有什么好办法吗,介绍一下,谢谢 -(NSUInteger) unicodeLengthOfString: (NSString *) text {    NSUInteger asciiLength = 0; for (NSUInteger i = 0; i < text.length; i++) { unichar uc =

Python判断字符串编码以及编码的转换

判断字符串编码 使用 chardet 可以很方便的实现字符串/文件的编码检测.尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要 >>> import urllib >>> html = urllib.urlopen('http://www.chinaunix.net').read() >>> import chardet >>> chardet.detect(html) {

mssql sqlserver 判断字符串大小写的方法分享

摘要:下文讲述使用sql脚本的方法判断字符串为大小写的方法分享,如下所示 实验环境:sqlserver 2008 R2 实现思路: 将字符串转换为大写或小写然后转换为二进制编码, 然后和源字符串做对比. /* 例:字符串大小写判断方法分享 */ declare @str varchar(100) set @str ='www.maomao365.com' -------------------------------------------------------------- if conve

Javascript最简单的把html字符串编码的方法

html字符串是指’<div id=”a”>aklsdjfklsjdfl</div>’这样的带html特殊符号的字符串,我们通常要对他进行处理再输出以免输出成了真正的html元素,也就是把<变成<这样的html符号代码. 如果字符串很长,里面特殊符号很多,我们该怎么简单而高效的把他们全部转码呢?循环?正则表达式?都不用!且看: function bian(a){return new Option(a).innerHTML} 这就是全部了!使用方法: function b

C#中判断字符串相等的方法

可以使用如下方式: 1. String.Compare(str1, str2) == 0  或者  str1.CompareTo(str2) == 0 2. str1.Equals(str2)  或者 String.Equals(str1, str2) 这种方式的话,需要注意null的情况

Shell判断字符串包含关系的几种方法

现在每次分析网站日志的时候都需要判断百度蜘蛛是不是真实的蜘蛛,nslookup之后需要判断结果中是否包含“baidu”字符串 以下给出一些shell中判断字符串包含的方法,来源程序员问答网站 stackoverflow 以及segmentfault. 方法一:利用grep查找 1 strA="long string" 2 strB="string" 3 result=$(echo $strA | grep "${strB}") 4 if [[ &

php转换字符串编码 iconv与mb_convert_encoding的区别

PHP判断字符串编码函数mb_detect_encoding总结 iconv — Convert string to requested character encoding(PHP 4 >= 4.0.5, PHP 5) mb_convert_encoding — Convert character encoding(PHP 4 >= 4.0.6, PHP 5) iconv — 字符串按要求的字符编码来转换mb_convert_encoding — 转换字符的编码 这两个函数功能类似都是用来转

字符串--java中判断字符串是否为数字的方法的几种方法?

ava中判断字符串是否为数字的方法: 1.用JAVA自带的函数 public static boolean isNumeric(String str){ for (int i = 0; i < str.length(); i++){ System.out.println(str.charAt(i)); if (!Character.isDigit(str.charAt(i))){ return false; } } return true; } 2.用正则表达式 首先要import java.u