PHP乱码问题,UTF-8乱码常见问题小结 linux-windows 文件编码乱码问题

一.HTML页面转UTF-8编码问题
1.在head后,title前加入一行:

<meta
http-equiv=‘Content-Type‘ content=‘text/html; charset=utf-8‘ />

顺序不能错,一定要在

显示的标题有可能是乱码!

2.html文件编码问题:

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,

如果是ANSI,需要将编码改成:UTF-8。
3.HTML文件头BOM问题:

将文件从其他的编码转换成UTF-8编码时,有时候会在文件的最开始加上一个BOM标签,
在个BOM标签可能会导致浏览器在显示中文的时候出现乱码。

删除这个BOM标签的方法:
1.可以用Dreamweaver打开文件,并重新保存,即可以去除BOM标签!

2.可以用EditPlus打开文件,并在菜单“首选项”->“文件”->"UTF-8标识",设置为:“总是删除签名”,

然后保存文件,即可以去除BOM标签!
4.WEB服务器UTF-8编码问题:
如果你按以上所列的步骤做了,还是有中文乱码问题,

请检查你的所使用的WEB服务器的编码问题
如果你使用的是Apache,请将配置文件里的:charset
设成:utf-8(这里仅列出方法,具体格式请参考apache的配置文件)
如果你使用的是Nginx,请将nginx.conf里的:charset 设成
utf-8,
具体找到 "charset gb2312;"或者类似的语句,改成:“charset utf-8;”。

二.PHP页面转UTF-8编码问题
1.在代码开始出加入一行:

header("Content-Type: text/html;charset=utf-8");

2.PHP文件编码问题

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,

如果是ANSI,需要将编码改成:UTF-8。
3.PHP文件头BOM问题:
PHP文件一定不可以有BOM标签

否则,会出现session不能使用的情况,并有类似的提示:
Warning: session_start()
[function.session-start]: Cannot send session cache limiter - headers already
sent
这是因为,在执行session_start() 的时候,整个页面不能有输出,但是当由于前PHP页面存在BOM标签,

PHP把这个BOM标签当成是输出了,所以就出错了!
所以PHP页面一定要删除BOM标签
删除这个BOM标签的方法:

1.可以用Dreamweaver打开文件,并重新保存,即可以去除BOM标签!

2.可以用EditPlus打开文件,并在菜单“首选项”->“文件”->"UTF-8标识",设置为:“总是删除签名”,

然后保存文件,即可以去除BOM标签!
4.PHP以附件形式保存文件的时候,UTF-8编码问题:

PHP以附件形式保存文件,文件名必须是GB2312编码,
否则,如果文件名中有中文的话,将是显示乱码:

如果你的PHP本身是UTF-8编码格式的文件,
需要将文件名变量由UTF-8转成GB2312:
iconv("UTF-8",
"GB2312", "$filename");

5.截断显示文章标题时,出现乱码或者“?”问号的问题:

一般文章标题很长的时候,会显示一部分标题,会对文章标题进行截断,
由于一个UTF-8编码格式的中文字符会占用3个字符宽度,

截取标题的时候,有时会只截取到一个中文字符的1个字符或2字符宽度,
没截取完整,将出现乱码或“?”问号的情况,

用下面的函数截取标题,就不会有问题:

复制代码
代码如下:

function get_brief_str($str, $max_length)

{
echo strlen($str) ."<br>";
if(strlen($str) > $max_length)

{
$check_num = 0;
for($i=0; $i < $max_length; $i++)
{
if
(ord($str[$i]) > 128)
$check_num++;
}

if($check_num % 3 == 0)

$str = substr($str, 0, $max_length)."...";
else if($check_num % 3 == 1)

$str = substr($str, 0, $max_length + 2)."...";
else if($check_num % 3 ==
2)
$str = substr($str, 0, $max_length + 1)."...";
}
return $str;

}

三.MYSQL数据库使用UTF-8编码的问题


1.用phpmyadmin创建数据库和数据表
创建数据库的时候,请将“整理”设置为:“utf8_general_ci”

或执行语句:

CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE
utf8_general_ci;
创建数据表的时候:如果是该字段是存放中文的话,则需要将“整理”设置为:“utf8_general_ci”,

如果该字段是存放英文或数字的话,默认就可以了。

相应的SQL语句,例如:

复制代码
代码如下:

CREATE TABLE `test` (
`id` INT NOT NULL
,
`name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,

PRIMARY KEY ( `id` )
) ENGINE = MYISAM ;

2.用PHP读写数据库

在连接数据库之后:

[hide]$connection = mysql_connect($host_name,
$host_user, $host_pass);

加入两行:

复制代码
代码如下:

mysql_query("set character set
‘utf8‘");//读库
mysql_query("set names ‘utf8‘");//写库

就可以正常的读写MYSQL数据库了。

四.JS相关的UTF-8编码问题

1.JS读Cookie的中文乱码问题

PHP写cookie的时候需要将中文字符进行escape编码,

否则JS读到cookie中的中文字符将是乱码。
但php本身没有escape函数,我们新写一个escape函数:

复制代码
代码如下:

function escape($str)
{

preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r);
$ar = $r[0];

foreach($ar as $k=>$v)
{
if(ord($v[0]) < 128)
$ar[$k] =
rawurlencode($v);
else
$ar[$k] =
"%u".bin2hex(iconv("UTF-8","UCS-2",$v));
}
return join("",$ar);
}

JS读cookie的时候,用unescape解码,

然后就解决cookie中有中文乱码的问题了。

2.外部JS文件UTF-8编码问题

当一个HTML页面或则PHP页面包含一个外部的JS文件时,

如果HTML页面或则PHP页面是UTF-8编码格式的文件,

外部的JS文件同样要转成UTF-8的文件,

否则将出现,没有包含不成功,调用函数时没有反应的情况。

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,

如果是ANSI,需要将编码改成:UTF-8。

五.FLASH相关的UTF-8编码问题


FLASH内部对所有字符串,默认都是以UTF-8处理
1.FLASH读文普通本文件(txt,html)

要将文本文件的编码存为UTF-8
点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,

如果是ANSI,需要将编码改成:UTF-8。
2.FLASH读XML文件
要将XML文件的编码存为UTF-8

点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,

如果是ANSI,需要将编码改成:UTF-8。
在XML第1行写:

3.FLASH读PHP返回数据

如果PHP编码本身是UTF-8的,直接echo就可以了

如果PHP编码本身是GB2312的,可以将PHP转存成UTF-8编码格式的文件,直接echo就可以了

如果PHP编码本身是GB2312的,而且不允许改文件的编码格式,
用下面的语句将字符串转换成UTF-8的编码格式
$new_str =
iconv("GB2312", "UTF-8", "$str");
再echo就可以了
4.FLASH读数据库(MYSQL)的数据

FLASH要通过PHP读取数据库中的数据
PHP本身的编码不重要,关键是如果数据库的编码是GB2312的话,

需要用下面的语句将字符串转换成UTF-8的编码格式
$new_str = iconv("GB2312", "UTF-8", "$str");

5.FLASH通过PHP写数据
一句话,FLASH传过来的字符串是UTF-8格式的,

要转换成相应的编码格式,再操作(写文件、写数据库、直接显示等等)
还是用iconv函数转换

6.FLASH使用本地编码(理论上不推荐使用)
如果想让FLASH不使用UTF-8编码,而是使用本地编码

对于中国大陆地区而言,本地编码是GB2312或GBK
AS程序内,可以添加以下代码:
System.useCodepage =
true;
那么FLASH内所有字符都是使用GB2312的编码了
所有导入到FLASH或者从FLASH导出的数据,都应该做相应的编码转换

因为使用本地编码,会造成使用繁体中文地区的用户产生乱码,所以不推荐使用

时间: 2024-11-07 13:05:22

PHP乱码问题,UTF-8乱码常见问题小结 linux-windows 文件编码乱码问题的相关文章

HTML文件、网站文件编码乱码解决方法

解决方法1:(设置页面编码) <html><head><meta charset="utf-8" /></head></html> 解决方法2:(利用记事本改变文件实质编码) 将源文件代码全部复制到记事本,然后“另存为1.html”,保存时需选择UTF-8编码. 解决方法3:(修改web.config文件) 在webconfig中加入<globalization requestEncoding="utf-8&q

C#文件上传编码乱码

又遇到文件编码乱码的事情,这回稍微有些头绪,但是还是花了很多时间去解决. 场景:上传csv文件,导入到数据库.上传文件的编码不定,需要转成unicode存储. 问题点:需要解决判断上传文件的编码. 关于编码,网上已有很多博客解释,只需查询关键字 unicode ansi bom 等 下面贴一个.net 官方的一些编码类型 地址:https://msdn.microsoft.com/zh-cn/library/windows/desktop/dd317756(v=vs.85).aspx 我这边主要

QT5常见问题二:程序显示中文乱码以及Linguist打开翻译文件乱码,该如何解决?

在使用Qt库进行程序开发的过程中,中文乱码问题是许多程序员都会遇到的问题,解决方法也有很多种.在Qt4的各个版本中,大家解决中文乱码的方法比较一致,也很有效!一:在Qt4中通常使用如下代码,便可以轻松解决中文乱码问题: QTextCodec *codec = QTextCodec::codecForName("GB2312"); QTextCodec::setCodecForLocale(codec); QTextCodec::setCodecForCStrings(codec); Q

java字符集编码乱码问题

博客分类: web javajspservlet 最近做网页这块时碰到了正文字符乱码问题.别看这小小的一个问题,对我来说却花费了好长一段时间.现在让我慢慢分析它吧(说实话.这些有部分是从网上找的,但都是自己亲自打出来的.这样对自己来说不仅理解了而且还加深了印象).  在java内部运算中.涉及到所有字符串都会被转化UTF-8编码来运算,然而.在被java转化之前,字符串是怎么样的字符集呢?其实java总是根据操作系统的默认编码字符集来决定字符串的初始编码的:而且java系统的输入输出都是采取操作

理清文件编码,告别中文乱码

理清文件编码,告别中文乱码 在工作中少不了碰到文件乱码的问题,面对这么多的中文汉字编码,真不知该选哪个好,不如彻底搞清楚,让乱码灰飞烟灭:以下介绍文本编码中常用到的几种:iso8859-1.GDK/GB2312.ANSI.unicode 以及UTF : iso8859-1 iso8859-1 通常叫做Latin-1,属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列.比如,字母a的编码为0x61=97. 很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符.但是,由于

编程解决Linux下解压zip乱码问题

JDK7 的ZipInputStream新添了一个构造方法,第二个参数可以指定字符集.这样一来我们就能用这个类写一个解压程序解决zip乱码问题了. 下面是代码: package cn.fh; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.nio.charset.Charset; import

python写入csv文件中文乱码解决方案

今天修改程序,需要写入csv文件,发现中文会乱码,后来查了下,可以设置文件写入属性后,就可以解决: import csvimport codecslist=['a101','b101']sumlist=[]for str in list: templist=[] templist.append('a') templist.append('b') templist.append('c') sumlist.append(templist)csvfile = file('csv_test.csv',

Linux Chrome Tab 标题 乱码

1. 刚装完ubuntu 14.04 英文版, 又装了google chrome 浏览器: 2. 打开chrome浏览器,发现tab也没的标题是乱码: 3. 而系统自带的firefox却没有这个问题,如图所示: 4. 原因是系统缺少相应的字体库支持,安装下面这些就OK sudo apt-get install ttf-wqy-microhei ttf-wqy-zenhei xfonts-wqy Linux Chrome Tab 标题 乱码,布布扣,bubuko.com

vim、gvim在windows下中文乱码的终极解决方案

测试成功,完美解决. 只需修改VIM目录下面的这个文件_vimrc. 加油吧,骚年.很强大的! set encoding=utf-8 set fileencodings=utf-8,chinese,latin-1 if has("win32") set fileencoding=chinese else set fileencoding=utf-8 endif "解决菜单乱码 source $VIMRUNTIME/delmenu.vim source $VIMRUNTIME/