php实现转换html格式为文本格式的方法

有时候需要转换html格式的字符串为文本,但又需要保持一定的格式,比如要求段落变成的分段格式就可以用下面这个函数

function html2text($str){

 $str = preg_replace("/<style .*?<\\/style>/is", "", $str);

 $str = preg_replace("/<script .*?<\\/script>/is", "", $str);

 $str = preg_replace("/<br \\s*\\/>/i", ">>>>", $str);

 $str = preg_replace("/<\\/?p>/i", ">>>>", $str);

 $str = preg_replace("/<\\/?td>/i", "", $str);

 $str = preg_replace("/<\\/?div>/i", ">>>>", $str);

 $str = preg_replace("/<\\/?blockquote>/i", "", $str);

 $str = preg_replace("/<\\/?li>/i", ">>>>", $str);

 $str = preg_replace("/ /i", " ", $str);

 $str = preg_replace("/ /i", " ", $str);

 $str = preg_replace("/&/i", "&", $str);

 $str = preg_replace("/&/i", "&", $str);

 $str = preg_replace("/</i", "<", $str);

 $str = preg_replace("/</i", "<", $str);

 $str = preg_replace("/“/i", ‘"‘, $str);

 $str = preg_replace("/&ldquo/i", ‘"‘, $str);

 $str = preg_replace("/‘/i", "‘", $str);

 $str = preg_replace("/&lsquo/i", "‘", $str);

 $str = preg_replace("/‘/i", "‘", $str);

 $str = preg_replace("/&rsquo/i", "‘", $str);

 $str = preg_replace("/>/i", ">", $str);

 $str = preg_replace("/>/i", ">", $str);

 $str = preg_replace("/”/i", ‘"‘, $str);

 $str = preg_replace("/&rdquo/i", ‘"‘, $str);

 $str = strip_tags($str);

 $str = html_entity_decode($str, ENT_QUOTES, "utf-8");

 $str = preg_replace("/&#.*?;/i", "", $str);

 return $str;

}

时间: 2024-10-13 02:36:17

php实现转换html格式为文本格式的方法的相关文章

Ajax属性和函数以及 返回值之XML格式和文本格式(二)

(一) 客户端请求文本之json格式:接收到json格式,再有js解析(具体先eval成对象,然后.即可) var text = this.responseText; var book = eval('('+ text +')'); document.getElementById('btitle').value = book.title; document.getElementById('bintro').value = book.intro; //其中btitle和bintro是客户端网页中的

POI对EXCEL的操作【重点:如何设置CELL格式为文本格式】

实际开发过程中通常用到的就是从数据库导出EXCEL表格了,JXL可以这样做,其实POI也可以(关于JXL与POI的异同可访问我之前总结的文章),之前写过POI对七种文档(当然也包括EXCEL)的内容读取操作的文章,这次要写的就非常重要了,就是开发中经常会用到的POI读取数据库导出EXCEL的操作,所谓导出EXCEL也就是生成带数据内容的新的EXCEL文件 目前的POI版本是3.7 下载地址:http://poi.apache.org/download.html#POI-3.7 必须包只有一个:p

能够转换PDF与Word文本格式的软件

现在我们的生活,都离不开各式各样的转换格式的软件了.没有人能反对不?假如你在网上找到了一篇文章,是Word.txt的还好些,可以直接复制粘贴自己想要的地方.但是如果是PDF格式的文件的话,就不行了.PDF格式的文件是不能直接复制的,下载下来还不算,你还需要转换格式,这样才能真正为自己所用.当然不包括那些仅仅只想看下子的人. 传统的PDF转换成Word转换器软件缺乏优秀的转换质量,对于较为复杂的PDF文件内容,这部分PDF转换器很容易出现识别错误,由此造成一系列的转换之后的问题,包括转换之后文字乱

excel日期格式转换为文本格式

今天测试读取excel并修改数据库数据的时候遇到几个小问题. 1.空指针,读写io异常蛮多的,获取不到的数据就是null 2.读取文件位置,开始找不到文件 3.读取日期格式结果是一个数值,因此需要转化为文本,方法如下: 首先,函数TEXT(单元格,'format') ,比如=TEXT(A2,'yyy-mm-dd'),然后enter,然后拉到整列. 然后,选中复制,选择性粘贴,选择数值. 刚做完就读取,空指针,于是处理内容为空的数据.

整型数据的二进制格式和文本格式的传输方式

 1.将1个整型数据输入一个缓冲区char *buffer,实现跨平台传输,以二进制方式和文本方式分别实现写缓冲区和读缓冲区 ---->在网络中传输是大端模式,而在本机上可能是小端模式,这个需要先判断 #include <stdio.h> #include <stdlib.h> #include <string.h> char buf1[1024]; char buf2[1024]; int ascii_write_to(int); int binary_wr

CSS 文本格式:对齐方式、文本修饰、文本转换、文本缩进

CSS 文本格式 文本颜色 颜色属性被用来设置文字的颜色. 颜色是通过CSS最经常的指定: 十六进制值 - 如: #FF0000 一个RGB值 - 如: RGB(255,0,0) 颜色的名称 - 如: red 参阅 CSS 颜色值 查看完整的颜色值. 一个网页的背景颜色是指在主体内的选择: 实例 body{color:red;}h1{color:#00ff00;}h2{color:rgb(255,0,0);} 对于W3C标准的CSS:如果你定义了颜色属性,你还必须定义背景色属性. 文本的对齐方式

如何把Excel中的某列数值如何转换成文本格式,且兼容性最好?

假设要把下方A列数值变成文本格式.有多种方法,其中下方的方法兼容性最好: 第一步:选择 A 列,然后,运行菜单 数据/分列... 命令,如下图: 第二步:默认 下一步: 第三步:默认 下一步: 第四步:列数据格式/文本 ,点击 完成. 第五部:完成的如下图,A列所示:每个数字左上方有个 绿色小三角,表明是 文本 格式,兼容性最好.

linux文本格式转换

问题:在linux环境下面执行SH的可执行文件. -bash: ./start.sh: /bin/sh^M: bad interpreter: No such file or directory 解决办法: 1.查看该文件  vim start.sh   不是编辑模式直接输入:set ff     查看弹出的界面  fileformat=dos  说明文本格式不对 直接set ff  = unix   就可以了 原文地址:https://www.cnblogs.com/byao-8816/p/9

Linxu中和Windows中的文本格式

在Linux中新建的文本文件换行符是$ Windows中新建的文本换行符是^M$ 在Windows中编辑由Linux中创建的文本,新添加的内容仍然会以Linux的$的格式换行 将Windows下编辑的文本转换成Linux中的文本格式可以使用命令:dos2unix 文件名