去除HTML标记

        ///   <summary>
        ///    去除HTML标记
        ///   </summary>
        ///   <param    name="NoHTML">包括HTML的源码   </param>
        ///   <returns>已经去除后的文字</returns>
        public static string NoHTML(string Htmlstring)
        {
            //删除脚本
            Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);
            //删除HTML
            Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase);

            Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", "   ", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
            Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase);

            Htmlstring.Replace("<", "");
            Htmlstring.Replace(">", "");
            Htmlstring.Replace("\r\n", "");
            Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim();

            return Htmlstring;
        }

  

时间: 2024-10-11 20:43:55

去除HTML标记的相关文章

去除html标记和替换script标记

1: /// <summary> 2: /// 去除HTML标记 3: /// </summary> 4: /// <param name="NoHTML">包括HTML的源码 </param> 5: /// <returns>已经去除后的文字</returns> 6: public static string RemoveHTML(string Htmlstring) 7: { 8: if (string.IsN

php 去除html标记--strip_tags与htmlspecialchars的区别详解

php 去除html标记--strip_tags与htmlspecialchars的区别详解 作者: 字体:[增加 减小] 类型:转载 时间:2013-06-26 本篇文章是对php中去除html标记以及strip_tags与htmlspecialchars的区别进行了详细的分析介绍,需要的朋友参考下 strip_tags  去掉 HTML 及 PHP 的标记. 语法: string strip_tags(string str); 传回值: 字串 函式种类: 资料处理 内容说明  本函式可去掉字

去除HTMl标记的办法

public string NoHTML(string Htmlstring) //去除HTML标记    {        //删除脚本        Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase);        //删除HTML        Htmlstring = Regex.R

项目管理模式之如何去除SVN标记

当项目不需要SVN标志的时候,我们一般怎么办哪??可能很多人设置Windows显示隐藏文件,然后将项目中的所有.svn文件删除,这种方法是既费劲儿又蛋疼的方法. 下面,从网上找了个非常简单的方法,重新编辑后当为我自己的原创,希望原作者不要怪罪. 第一步:建立一个名字叫做remove-svn-folders.reg的文本(先建立txt文件,然后粘贴内容后再修改文件名字),记得后缀要叫.reg.文本的内容为: Windows Registry Editor Version 5.00 [HKEY_LO

php自带函数去除html标记

strip_tags 去掉 HTML 及 PHP 的标记. 语法: string strip_tags(string str); 传回值: 字串 函式种类: 资料处理 内容说明 本函式可去掉字串中包含的任何 HTML 及 PHP 的标记字串.若是字串的 HTML 及 PHP 标签原来就有错,例如少了大于的符号,则也会传回错 strip_tags 去掉 HTML 及 PHP 的标记. 语法: string strip_tags(string str); 传回值: 字串 函式种类: 资料处理 内容说

js去除html标记

function removeHmtlTag(str){ return str.replace(/<[^>]+>/g, "");//去掉所有的html标记 }

ASP.NET 去除所有HTML标记的方法

using System.Text.RegularExpressions ///   <summary>     ///    去除HTML标记     ///   </summary>     ///   <param    name="NoHTML">包括HTML的源码   </param>     ///   <returns>已经去除后的文字</returns>     public   static   

[转]正则表达式,去除所有HTML标签

protected string str = "<table><tr><td>sdasasdsdd</td></tr></table><br><p>sds</p><img id='img1' src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50' alt=''>aaassss<br>

Vim 删除 BOM 标记的方法

检测当前文件是否有 BOM 标记: :set bomb? 去除 BOM 标记: :set nobomb :w 参考链接: https://wincent.com/wiki/Remove_BOM_marker_from_file_with_Vim