html_entity_decode()、空格、  乱码问题

普通 ASCII 码空格为 32,但是浏览器会对普通空格进行自动归并,也就是如果你输入10个 0x20 的空格在HTML页面里面,可能会被合并成一个空格。

如果想要一致的呈现多个空格,就要用到  ,这个空格的编码为 160,为西欧ISO-8859-1编码标准。

为了让经过HTML编码的内容还原为原来的文本字符,可以使用 html_entity_decode() 方法,但这样问题就来了,通常HTML编码内容为UTF8格式的,
html_entity_decode()在浏览器UTF8编码环境下会把   转为一个黑色四方形状的乱码。只有切换为ISO-8859-1才能正确显示为空格。
所以在使用html_entity_decode()之前,需要先把   替换掉 str_replace(" ","",$str),这样就可以避免乱码问题。
时间: 2024-08-08 13:59:05

html_entity_decode()、空格、  乱码问题的相关文章

erlang的undefined macro 'MODULE',头一行编译通不过的问题

前言:对于erlang的编译有很多方式,rebar,makefile文件 还是对于单个文件的erlc编译等,但不管何种方式,一个模块的第一行就编译不过去,实在让人纠结... 1)问题上述: 在技术交流群里,有人提到头一行编译不过去, %%%------------------------------------------------------------------- %%% @author someone %%% @copyright (C) 2014, <COMPANY> %%% @d

安利一波PDF转换成Word的超简单教程

将PDF转换成Word的操作,大家在日常学习工作中都会接触到:一般这个时候,我们第一反应就是度娘好几款转换软件试一试.用过一轮后,你会发现效果好的转换器凤毛麟角,明明就几页的文档,却出现大量的空格.乱码.回车符,不得不进行繁琐的二次编辑.想想白花了那么多时间下载一堆软件,还没达到转换的目的,内心着实有点崩溃. 其实,PDF转换成Word的操作非常简单,小编这里有个方法,不用软件,在线即可完成! 首先,打开在线PDF转换平台:pdf365.cn: 然后点击"PDF转Word"图标,进入P

“懒癌”患者必备的PDF转Word工具

每个月你是不是总有那么二十九天不想上班:上班时懒得思考问题,太费脑筋:放假时就懒得下楼,懒得逛街.能坐着绝不站着,能躺着绝不坐着:手伸不到的地方,都是到不了的远方:聊天能发表情,绝不打字:胖友圈能点赞,绝不评论. 每天最大的坚持就是坚持拿着手机,没别的,就因为衣食住行都能在手机上解决.吃饭点外卖,出门有滴滴,衣服能网购,除非...... 什么!? 快递.外卖小哥只送到楼下? 滴滴师傅停在马路对面等你? Emmmm.......我可以取消订单吗? 如果你出现过以上症状,那么恭喜你,你已经成功染上一

菜鸟学Python训练营第一期练习题

菜鸟学Python训练营第一期练习题 1.比如自然数10以下能被3或者5整除的有,3,5,6和9,那么这些数字的和为23. 求能被3或者5整除的1000以内数字的和 1 multiple_of_threes=[] 2 for multiple_of_three in range(0,1001,3): 3 multiple_of_threes.append(multiple_of_three) 4 sum_of_threes=sum(multiple_of_threes) 5 print(mult

Jsoup处理html空格乱码问题

由于在html中空格只能用 表示,当运用Jsoup抓取html页面后,我们将html页面进行解析时,Java对html页面的代码不识别,输入到控制台时出现乱码,在网上查了很多资料都没有找到很好的解决办法,最后在一篇论坛中说到"运用字符串替换"可以进行解决,于是运用简单的字符串替换原理对此进行处理.对其替换处理后再对html文件进行解析.具体实现代码如下: //参数说明:oldFile为所需要替换的文件,即为原文件: newFile为替换后新的文件 :oldString为所需要替换的字符

eclipse基本设置----中文乱码、行数显示、缩进方式、行末空格和空行自动删除、常用注解

一.中文乱码 window系统下,Eclipse中导入新的项目的时候,可能会遇到中文乱码的问题. 解决方案:将系统默认的格式为GBK改成UTF-8.以下是具体解决方法,可以根据需要选择不同的方法. 1.设置整个工作空间的编码,此操作会影响整个工作空间的项目. 设置步骤:菜单栏window --  Preferences -- General -- Workspace --Text file encoding--Other --UTF-8,保存配置(Apply and Close). 2.设置项目

解决CsvWriter:中文乱码、末尾行多一行空格(/r)、非第一列空字符串&quot;&quot;显示null问题

一:主要内容 解决CsvWriter存csv,csv文件打开后中文乱码问题 解决CsvWriter存csv,csv文件最后一行总是多一行空行的问题 解决CsvWriter存csv,csv文件不是第一列的时候,想存入""即空字符串无法存入显示null的问题 二:解决问题前:需要做的事情 因为网上的CsvWrite的jar包导入到我们的工程中是class文件,针对上面的问题是无法修改源码的,但是我们又想用这个工具来操作csv,所以可以在自己的工程中首先pom引用这个jar包 <dep

Java 解决采集UTF-8网页空格变成问号乱码

http://blog.csdn.net/bob007/article/details/27098875 使用此方法转换后,在列表中看到的正常,但是在详情页的文本框中查看到的就是 了,只好过滤掉所有的空格 html = html.replaceAll(UTFSpace, " ");改为html = html.replaceAll(UTFSpace, ""); --------------以下复制而来------------- 昨天发现,用 HtmlDecode()

解决oracle中sqlplus工具输错字符乱码,空格乱码的问题

这里用到的工具就是rlwrap 可以在此链接进行了解http://utopia.knoware.nl/~hlub/uck/rlwrap/ wget http://utopia.knoware.nl/~hlub/uck/rlwrap/rlwrap-0.42.tar.gz yum install -y readline readline-devel  这是所依赖的 tar xf rlwrap-0.42.tar.gz cd rlwrap-0.42 当然在编译之前可以查看一下readme和install