iOS HTML标签字符实体,转译字符串归类大全 【转载】

为什么要用转义字符串?

HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用。这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢?

这就要说到HTML转义字符串(Escape Sequence)了。

转义字符串(Escape Sequence)也称字符实体(Character Entity)。在HTML中,定义转义字符串的原因有两个:

第一个原因是像“<”和“>”这类符号已经用来表示HTML标签,因此就不能直接当作文本中的符号来使用。为了在HTML文档中使用这些符号,就需要定义它的转义字符串。当解释程序遇到这类字符串时就把它解释为真实的字符。在输入转义字符串时,要严格遵守字母大小写的规则

第二个原因是,有些字符在ASCII字符集中没有定义,因此需要使用转义字符串来表示。

转义字符串的组成

转义字符串(Escape Sequence),即字符实体(Character Entity)分成三部分:

第一部分是一个&符号,英文叫ampersand;

第二部分是实体(Entity)名字或者是#加上实体(Entity)编号;

第三部分是一个分号。

比如,要显示小于号(<),就可以写 &lt; 或者 < 。

用实体(Entity)名字的好处是比较好理解,一看lt,大概就猜出是less than的意思,但是其劣势在于并不是所有的浏览器都支持最新的Entity名字。而实体(Entity)编号,各种浏览器都能处理。

提示:实体名称(Entity)是区分大小写的

备注:同一个符号,可以用“实体名称”和“实体编号”两种方式引用,“实体名称”的优势在于便于记忆,但不能保证所有的浏览器都能顺利识别它,而“实体编号”则没有这种担忧,但它实在不方便记忆。

如何显示空格?

通常情况下,HTML会自动截去多余的空格。不管你加多少空格,都被看做一个空格。比如你在两个字之间加了10个空格,HTML会截去9个空格,只保留一个。为了在网页中增加空格,你可以使用&nbsp;表示空格。


HTML特殊转义字符列表

最常用的字符实体
Character Entities

显示 说明 实体名称 实体编号
  半方大的空白 &ensp;
  全方大的空白 &emsp;
  不断行的空格 &nbsp;  
< 小于 &lt; <
> 大于 &gt; >
& &符号 &amp; &
" 双引号 &quot; "
? 版权 &copy; ©
? 已注册商标 &reg; ®
? 商标(美国) ?
× 乘号 &times; ×
÷ 除号 &divide; ÷

ISO 8859-1 (Latin-1)字符集

HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。

备注:为了方便起见,以下表格中,“实体名称”简称为“名称”,“实体编号”简称为“编号”

显示 名称 编号 显示 名称 编号 显示 名称 编号 显示 名称 编号 显示 名称 编号
  &nbsp;   ? &iexcl; ¡ &cent; ¢ &pound; £ ¤ &curren; ¤
&yen; ¥ | &brvbar; ¦ § &sect; § ¨ &uml; ¨ ? &copy; ©
a &ordf; ª ? &laquo; « ? &not; ¬   &shy; ­ ? &reg; ®
ˉ &macr; ¯ ° &deg; ° ± &plusmn; ± 2 &sup2; ² 3 &sup3; ³
&acute; ´ μ &micro; µ ? &para; · &middot; · ? &cedil; ¸
1 &sup1; ¹ o &ordm; º ? &raquo; » ? &frac14; ¼ ? &frac12; ½
? &frac34; ¾ ? &iquest; ¿ à &Agrave; À á &Aacute; Á ? &Acirc; Â
? &Atilde; Ã ? &Auml; Ä ? &Aring; Å ? &AElig; Æ ? &Ccedil; Ç
è &Egrave; È é &Eacute; É ê &Ecirc; Ê ? &Euml; Ë ì &Igrave; Ì
í &Iacute; Í ? &Icirc; Î ? &Iuml; Ï D &ETH; Ð ? &Ntilde; Ñ
ò &Ograve; Ò ó &Oacute; Ó ? &Ocirc; Ô ? &Otilde; Õ ? &Ouml; Ö
× &times; × ? &Oslash; Ø ù &Ugrave; Ù ú &Uacute; Ú ? &Ucirc; Û
ü &Uuml; Ü Y &Yacute; Ý T &THORN; Þ ? &szlig; ß à &agrave; à
á &aacute; á a &acirc; â ? &atilde; ã ? &auml; ä ? &aring; å
? &aelig; æ ? &ccedil; ç è &egrave; è é &eacute; é ê &ecirc; ê
? &euml; ë ì &igrave; ì í &iacute; í ? &icirc; î ? &iuml; ï
e &eth; ð ? &ntilde; ñ ò &ograve; ò ó &oacute; ó ? &ocirc; ô
? &otilde; õ ? &ouml; ö ÷ &divide; ÷ ? &oslash; ø ù &ugrave; ù
ú &uacute; ú ? &ucirc; û ü &uuml; ü y &yacute; ý t &thorn; þ
? &yuml; ÿ

数学和希腊字母标志
symbols, mathematical symbols, and Greek letters

显示 名称 编号 显示 名称 编号 显示 名称 编号 显示 名称 编号 显示 名称 编号
? &fnof; ƒ Α &Alpha; Α Β &Beta; Β Γ &Gamma; Γ Δ &Delta; Δ
Ε &Epsilon; Ε Ζ &Zeta; Ζ Η &Eta; Η Θ &Theta; Θ Ι &Iota; Ι
Κ &Kappa; Κ Λ &Lambda; Λ Μ &Mu; Μ Ν &Nu; Ν Ξ &Xi; Ξ
Ο &Omicron; Ο Π &Pi; Π Ρ &Rho; Ρ Σ &Sigma; Σ Τ &Tau; Τ
Υ &Upsilon; Υ Φ &Phi; Φ Χ &Chi; Χ Ψ &Psi; Ψ Ω &Omega; Ω
α &alpha; α β &beta; β γ &gamma; γ δ &delta; δ ε &epsilon; ε
ζ &zeta; ζ η &eta; η θ &theta; θ ι &iota; ι κ &kappa; κ
λ &lambda; λ μ &mu; μ ν &nu; ν ξ &xi; ξ ο &omicron; ο
π &pi; π ρ &rho; ρ ? &sigmaf; ς σ &sigma; σ τ &tau; τ
υ &upsilon; υ φ &phi; φ χ &chi; χ ψ &psi; ψ ω &omega; ω
? &thetasym; ϑ ? &upsih; ϒ ? &piv; ϖ ? &bull; &hellip;
&prime; &Prime; &oline; ? &frasl; ? &weierp;
? &image; ? &real; ? &trade; ? &alefsym; &larr;
&uarr; &rarr; &darr; ? &harr; ? &crarr;
? &lArr; ? &uArr; ? &rArr; ? &dArr; ? &hArr;
? &forall; ? &part; ? &exist; ? &empty; ? &nabla;
&isin; ? &notin; ? &ni; &prod; &sum;
? &minus; ? &lowast; &radic; &prop; &infin;
&ang; &and; &or; &cap; &cup;
&int; &there4; &sim; &cong; &asymp;
&ne; &equiv; &le; &ge; ? &sub;
? &sup; ? &nsub; ? &sube; ? &supe; &oplus;
? &otimes; &perp; ? &sdot; ? &lceil; ? &rceil;
? &lfloor; ? &rfloor; ? &lang; ? &rang; ? &loz;
? &spades; ? &clubs; ? &hearts; ? &diams;

重要的国际标记
markup-significant and internationalization characters

显示 名称 编号 显示 名称 编号 显示 名称 编号 显示 名称 编号 显示 名称 编号
" &quot; " & &amp; & < &lt; < > &gt; > ? &OElig; Œ
? &oelig; œ ? &Scaron; Š ? &scaron; š ? &Yuml; Ÿ ? &circ; ˆ
? &tilde; ˜ ? &ensp; ? &emsp; ? &thinsp; ? &zwnj;
? &zwj; ? &lrm; ? &rlm; &ndash; &mdash;
&lsquo; &rsquo; ? &sbquo; &ldquo; &rdquo;
? &bdquo; ? &dagger; ? &Dagger; &permil; ? &lsaquo;
? &rsaquo; &euro;

JavaScript转义符

转义序列 字符
\b 退格
\f 走纸换页
\n 换行
\r 回车
\t 横向跳格 (Ctrl-I)
\‘ 单引号
\" 双引号
\\ 反斜杠

编程的时候要注意特殊字符的问题,很多运行时出现的问题都是因为特殊字符的出现而引起的。

注意,由于反斜杠本身用作转义符,因此不能直接在脚本中键入一个反斜杠。如果要产生一个反斜杠,必须一起键入两个反斜杠 (\\)。


编码转换(to Unicode)

(程序代码来源于网络)

Js版

<script>
     test = "你好abc"
     str = ""
     for( i=0;    i<test.length; i++ )
     {
      temp = test.charCodeAt(i).toString(16);
      str    += "\\u"+ new Array(5-String(temp).length).join("0") +temp;
     }
     document.write (str)
</script>

vbs版

Function Unicode(str1)
     Dim str,temp
     str = ""
     For i=1    to len(str1)
      temp = Hex(AscW(Mid(str1,i,1)))
      If len(temp) < 5 Then    temp = right("0000" & temp, 4)
      str = str & "\u" & temp
     Next
     Unicode = str
End Function
Function htmlentities(str)
     For i = 1 to Len(str)
         char = mid(str, i, 1)
         If Ascw(char) > 128 then
             htmlentities = htmlentities & "&#" & Ascw(char) & ";"
         Else
             htmlentities = htmlentities & char
         End if
     Next
End Function

coldfusion版

function nochaoscode(str)
{
     var new_str = “”;
     for(i=1; i lte len(str);i=i+1){
         if(asc(mid(str,i,1)) lt 128){
             new_str = new_str & mid(str,i,1);
         }else{
             new_str = new_str & “&##” & asc(mid(str,i,1));
         }
     }
     return new_str;
}


附:

在php中我们可以用mbstring的mb_convert_encoding函数实现这个正向及反向的转化。 如:

mb_convert_encoding ("你好", "HTML-ENTITIES", "gb2312"); //输出:你好

mb_convert_encoding ("你好", "gb2312", "HTML-ENTITIES"); //输出:你好

如果需要对整个页面转化,则只需要在php文件的头部加上这三行代码:

mb_internal_encoding("gb2312"); // 这里的gb2312是你网站原来的编码

mb_http_output("HTML-ENTITIES");

ob_start(‘mb_output_handler‘);

以上内容 声明:转载来自:http://www.cnblogs.com/lf6112/p/4952001.html

HTML的标签的过滤,欢迎指正~~~~

 1 #import <Foundation/Foundation.h>
 2
 3 @interface filterHTML : NSObject
 4 //过滤
 5 /**
 6  * 过滤标签
 7  */
 8 +(NSString *)filterHTML:(NSString *)str;
 9 +(NSString *)filterHTMLImage:(NSString *)str;
10 /**
11  * 替换部分标签
12  */
13 + (NSString *)filterHTMLTag:(NSString *)str;
14
15
16 @end

过滤HTML标签的头文件

 1 #import "filterHTML.h"
 2
 3 @implementation filterHTML
 4
 5 /**
 6  * 过滤标签
 7  */
 8 +(NSString *)filterHTML:(NSString *)str
 9 {
10     NSScanner * scanner = [NSScanner scannerWithString:str];
11     NSString * text = nil;
12     while([scanner isAtEnd]==NO)
13     {
14         //找到标签的起始位置
15         [scanner scanUpToString:@"<" intoString:nil];
16         //找到标签的结束位置
17         [scanner scanUpToString:@">" intoString:&text];
18         //替换字符
19         str  =  [str  stringByReplacingOccurrencesOfString:[NSString stringWithFormat:@"%@>",text] withString:@""];
20     }
21     return str;
22 }
23 +(NSString *)filterHTMLImage:(NSString *)str{
24     NSScanner * scanner = [NSScanner scannerWithString:str];
25     NSString * text = nil;
26     while([scanner isAtEnd]==NO)
27     {
28         //找到标签的起始位置
29         [scanner scanUpToString:@"<img" intoString:nil];
30         //找到标签的结束位置
31         [scanner scanUpToString:@">" intoString:&text];
32         //替换字符
33         str  =  [str  stringByReplacingOccurrencesOfString:[NSString stringWithFormat:@"%@>",text] withString:@"【图片】"];
34     }
35     return str;
36 }
37
38 + (NSString *)filterHTMLTag:(NSString *)str {
39     //替换字符
40     str  =  [str  stringByReplacingOccurrencesOfString:@"&mdash;" withString:@"-"];
41     str  =  [str  stringByReplacingOccurrencesOfString:@"&ldquo;" withString:@"\""];
42     str  =  [str  stringByReplacingOccurrencesOfString:@"&rdquo;" withString:@"\""];
43     str  =  [str  stringByReplacingOccurrencesOfString:@"&nbsp;" withString:@" "];
44     str  =  [str  stringByReplacingOccurrencesOfString:@"&rsquo;" withString:@"’"];
45     str  =  [str  stringByReplacingOccurrencesOfString:@"&lsquo;" withString:@"‘"];
46     str  =  [str  stringByReplacingOccurrencesOfString:@"&middot;" withString:@"·"];
47     str  =  [str  stringByReplacingOccurrencesOfString:@"&quot;" withString:@"\""];
48     str  =  [str  stringByReplacingOccurrencesOfString:@"&amp;" withString:@"&"];
49     str  =  [str  stringByReplacingOccurrencesOfString:@"<strong>" withString:@""];
50     str  =  [str  stringByReplacingOccurrencesOfString:@"</strong>" withString:@""];
51     str  =  [str  stringByReplacingOccurrencesOfString:@"\n" withString:@" "];
52     return str;
53
54 }
55 @end

过滤HTML标签的实现文件

时间: 2024-08-10 21:22:43

iOS HTML标签字符实体,转译字符串归类大全 【转载】的相关文章

web前端入门到实战:HTML字符实体,转义字符串

为什么要用转义字符串? HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用.这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢? 这就要说到HTML转义字符串(Escape Sequence)了. 转义字符串(Escape Sequence)也称字符实体(Character Entity).在HTML中,定义转义字符串的原因有两个: 第一个原因是像"<"和">

HTML字符实体和转义字符串大全

转义字符串的组成 转义字符串(Escape Sequence),即字符实体(Character Entity)分成三部分:第一部分是一个&符号,英文叫ampersand:第二部分是实体(Entity)名字或者是#加上实体(Entity)编号:第三部分是一个分号. 比如,要显示小于号(<),就可以写 < 或者 < . 用实体(Entity)名字的好处是比较好理解,一看lt,大概就猜出是less than的意思,但是其劣势在于并不是所有的浏览器都支持最新的Entity名字.而实体(E

HTML连载11-HTML中被废弃的标签&amp;字符实体

?一.为什么会有被废弃的标签 答:HTML中以前存在一部分不是用来添加语义的标签,而与我们HTML标签是用来添加语义的,这与我们的定义不相符. 例如: 1.标签<br>:换行 2.标签<hr>:加一条横线换行 3.标签<b>:加粗文字(bold) 4.标签<i>:斜体文字(italic) 5.标签<u>:文字加下划线(underlined) 6.标签<s>:划除文字(strikethrough) (word不就是这样吗?) <h

HTML字符实体(Character Entities),转义字符串(Escape Sequence) 转

为什么要用转义字符串? HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用.这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢? 这就要说到HTML转义字符串(Escape Sequence)了. 转义字符串(Escape Sequence)也称字符实体(Character Entity).在HTML中,定义转义字符串的原因有两个: 第一个原因是像“<”和“>”这类符号已经用来表示HTM

HTML字符实体(Character Entities),转义字符串(Escape Sequence)

HTML字符实体(Character Entities),转义字符串(Escape Sequence) 为什么要用转义字符串? HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用.这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢? 这就要说到HTML转义字符串(Escape Sequence)了. 转义字符串(Escape Sequence)也称字符实体(Character Entity).在HT

java转换 HTML字符实体,java特殊字符转义字符串

为什么要用转义字符串? HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用.这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢? 这就要说到HTML转义字符串(Escape Sequence)了. 转义字符串(Escape Sequence)也称字符实体(Character Entity).在HTML中,定义转义字符串的原因有两个:第一个原因是像“<”和“>”这类符号已经用来表示HTML

HTML字符实体(Character Entities)与 转义字符串(Escape Sequence)(转)

为什么要用转义字符串?HTML中<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用.这些符号是不显示在我们最终看到的网页里的,那如果我们希望在网页中显示这些符号,该怎么办呢? 这就要说到HTML转义字符串(Escape Sequence)了. 转义字符串(Escape Sequence)也称字符实体(Character Entity).在HTML中,定义转义字符串的原因有两个:第一个原因是像“<”和“>”这类符号已经用来表示HTML标

web前端入门到实战:HTML字符实体与文本格式化标签

HTML 字符实体/HTML 中的预留字符必须被替换为字符实体,一些在键盘上找不到的字符也可以使用字符实体来替换. 在 HTML 中,某些字符是预留的.您不能使用包含这些字符的文本.在 HTML 中不能使用小于号(<)和大于号(>),这是因为浏览器会误认为它们是标签.如果希望正确地显示预留字符,我们必须在 HTML 源代码中使用字符实体(character entities). 字符实体类似这样: 1 &entity_name; 2 或 3 &#entity_number; 4

【转义字符】HTML 字符实体&amp;lt; &amp;gt: &amp;amp;等

在开发中遇到javascript从后台获取的url 会被转义,如:http://localhost:8080/Home/Index?a=14&b=15&c=123,想把它转成http://localhost:8080/Home/Index?a=14&b=15&c=123 网上找了半天的解决方案: 转义分为escapeHTML和unescapeHTML,先看两个函数的实现. js代码: 1 /** 2 * @function escapeHTML 转义html脚本 <