一、检测当前字符串编码并将编码改为utf-8
1 获取当前字符串的编码
$encode = mb_detect_encoding($str, array("ASCII",‘UTF-8‘,"GB2312","GBK",‘BIG5‘));
2 将字符编码改为utf-8
$str_encode = mb_convert_encoding($str, ‘UTF-8‘, $encode);
二、函数详解
1 mb_detect_encoding — 检测字符的编码
说明
string
mb_detect_encoding (
string $str [,
mixed $encoding_list = mb_detect_order() [,
bool $strict = false ]] )
检测字符串 str 的编码。
参数
str
待检查的字符串。
encoding_list
encoding_list 是一个字符编码列表。 编码顺序可以由数组或者逗号分隔的列表字符串指定。
如果省略了 encoding_list 将会使用 detect_order。
strict
strict 指定了是否严格地检测编码。 默认是 FALSE。
返回值
检测到的字符编码,或者无法检测指定字符串的编码时返回 FALSE。
2 mb_convert_encoding — 转换字符的编码
说明
string
mb_convert_encoding (
string $str ,
string $to_encoding [,
mixed $from_encoding = mb_internal_encoding() ] )
将 string 类型 str 的字符编码从可选的 from_encoding 转换到 to_encoding。
参数
str
要编码的 string。
to_encoding
str 要转换成的编码类型。
from_encoding
在转换前通过字符代码名称来指定。它可以是一个 array 也可以是逗号分隔的枚举列表。 如果没有提供 from_encoding,则会使用内部(internal)编码。
参见支持的编码。
返回值
编码后的 string。