采用 Unicode 标点属性方式的正则表达式，可以去掉所有的标点符号，

public class Test {

public static void main(String[] args) {
String str = "!!！？？!!!!%*）%￥！KTV去符号标号！！当然,，。!!..**半角";
System.out.println(str);
String str1 = str.replaceAll("[\\pP\\p{Punct}]", "");
System.out.println("str1:" + str1);

String str2 = str.replaceAll("[//pP]", "");
System.out.println("str2:" + str2);

String str3 = str.replaceAll("[//p{P}]", "");
System.out.println("str3:" + str3);
}
}

采用 Unicode 标点属性方式的正则表达式，可以去掉所有的标点符号，


包括全角、半角、横排、竖排等的标点符号。
注意一下，如果在 JDK 5 或以下的环境中，全角单引号对、双引号对
无法替换掉，这是 JDK 5 及以下版本缺失的，在 JDK 6 中由于加入了
Pi 和 Pf 两个 Unicode 子属性，因此就能替换掉。
在 JDK 6 以下的版本中可以这样：

Java code

1	`str = str.replaceAll("[\\pP‘’“”]",` `"");`

即手工加上去。

Unicode 编码并不只是为某个字符简单定义了一个编码，而且还将其进行了归类。


\pP 其中的小写 p 是 property 的意思，表示 Unicode 属性，用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一：标点字符。
其他六个是
L：字母；
M：标记符号（一般不会单独出现）；
Z：分隔符（比如空格、换行等）；
S：符号（比如数学符号、货币符号等）；
N：数字（比如阿拉伯数字、罗马数字等）；
C：其他字符
上面这七个是属性，七个属性下还有若干个子属性，用于更进一步地进行细分。
Java 中用于 Unicode 的正则表达式数据都是由 Unicode 组织提供的。
Unicode 正则表达式标准（可以找到所有的子属性）
http://www.unicode.org/reports/tr18/
各 Unicode 字符属性的定义，可以用一看看某个字符具有什么属性。
http://www.unicode.org/Public/UNIDATA/UnicodeData.txt
这个文本文档一行是一个字符，第一列是 Unicode 编码，第二列是字符名，第三列是 Unicode 属性，

以及其他一些字符信息。

时间： 2024-11-06 07:23:19

采用 Unicode 标点属性方式的正则表达式，可以去掉所有的标点符号，的相关文章

Java与编码问题串讲之二–如何理解java采用Unicode编码

Java开发者必须牢记:在Java中字符仅以一种形式存在,那就是Unicode(不选择任何特定的编码,直接使用他们在字符集中的编号,这是统一的唯一方法).由于java采用unicode编码,char 在java中占2个字节.2个字节(16位)来表示一个字符. 这里的Java中是指在JVM中.在内存中.在代码里声明的每一个char.String类型的变量中. 例如: 1 2 3 4 5 6 7 System.out.println(System.getProperty("file.encoding

[转]Net 下采用GET/POST/SOAP方式动态调用WebService C#实现

本文转自:http://www.cnblogs.com/splendidme/archive/2011/10/05/2199501.html 一直以来,我们都为动态调用WebService方法而烦恼.在.Net环境下,最常用的方法就是采用代理类来调用WebService,可以通过改变代理类的Url属性来实现动态调用,但当xmlns改变时就会出错,似乎要重新绑定Webservice并重新编译后才能再次运行.我无意中通过百度搜索找了一个采用GET/POST/SOAP方式动态调用WebService的

Spring定时器技术终结者——采用Scheduled注释的方式实现Spring定时器

在Spring中有两种方式可以实现定时器的功能,分别是Scheduled注释方式和XML配置方式,本博客将介绍如何在Spring中使用Scheduled注释方式的方式实现定时器的功能,代码及相应的解释如下: 代码1-Spring配置文件(applicationContext.xml文件): <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframe

(转载)Net 下采用GET/POST/SOAP方式动态调用WebService C#实现

转自http://www.cnblogs.com/splendidme/archive/2011/10/05/2199501.html 一直以来,我们都为动态调用WebService方法而烦恼.在.Net环境下,最常用的方法就是采用代理类来调用WebService,可以通过改变代理类的Url属性来实现动态调用,但当xmlns改变时就会出错,似乎要重新绑定Webservice并重新编译后才能再次运行.我无意中通过百度搜索找了一个采用GET/POST/SOAP方式动态调用WebService的简易灵

采用MySQL_upgrade升级授权表方式升级

1.7.1 采用MySQL_upgrade升级授权表方式升级(1) 这种升级方式比较省事,通过MySQL_upgrade命令即可完成.下面来演示一下整个升级过程. 1)修改my.cnf配置文件,因为MySQL5.1里的参数在5.5版本里已经不识别了. #skip-locking 在5.5里已经不识别了,改成 skip-external-locking #log-long-format 在5.5里已经不识别了,改成 log-short-format #log_slow_queries 在5.

如何采用绝对坐标的方式动画方式移动view和如何点击view的时候获取它的cachebitmap并移动

Layout: <?xml version="1.0" encoding="UTF-8"?> <com.example.android_test.MyDragLayer xmlns:android="http://schemas.android.com/apk/res/android" android:id="@+id/rootView" android:layout_width="fill_par

07_android入门_采用HttpClient的POST方式、GET方式分别实现登陆案例

1.简介 HttpClient 是 Apache Jakarta Common 下的子项目,可以用来提供高效的.最新的.功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议. 2.功能介绍以下列出的是 HttpClient 提供的主要的功能,要知道更多详细的功能可以参见 HttpClient 的主页. (1)实现了所有 HTTP 的方法(GET,POST,PUT,HEAD 等) (2)支持自动转向 (3)支持 HTTPS 协议 (4)支持代理服务器等 3

采用Post请求的方式提交参数并导出excel

一般情况下,我们都是采用get请求的方式导出excel.例如采用如下方式: var exportUrl = '/xxx;'; window.open(exportUrl); 导出excel所需的逻辑参数拼接到url上即可. 但是,如果我们需要提交大量的参数到后台才能导出excel, 亦或者我们提交的参数中有中文,get提交乱码了,那么就可能想使用post提交的方式来导出excel.因为post提交支持更多的参数,从而能解决get提交对url长度的限制问题. 然而,一般的post提交表单,意味着主

Cocoa 框架为什么采用两阶段的方式来创建对象？

对于之前一直使用C#语言的我来说,刚开始接触Objective-c来创建对象时很迷惑,为何创建对象一般情况下需要通过发送两个消息(调用两个方法)才能创建一个类实例对象(例如[[UIButton alloc] init])?相信使用Java的也会有这样的感受,给个类型调用一下初始化方法不就完了吗?真是麻烦!虽然Objective-c中也有采用new一步到位的(例如:[UIButton new]),但是这种用法貌似不是很常见.水果公司这么做肯定是有道理的.下面我们先讨论一下采用直接创建的方式有何利弊