当我们从一个文件,比如excel中,读取数据时,由于编码等各种问题,有时会导致我们读出来的字符串中包含着一些奇怪的字符,比如?>等等。
可以通过正则表达式来去掉这些奇怪的字符:
s = s.replaceAll("[^\u4e00-\u9fa5a-zA-Z0-9]", "");
其中,\u4e00-\u9fa5表示中文。
版权声明:本文为博主原创文章,未经博主允许不得转载。
时间: 2024-11-07 01:45:11
当我们从一个文件,比如excel中,读取数据时,由于编码等各种问题,有时会导致我们读出来的字符串中包含着一些奇怪的字符,比如?>等等。
可以通过正则表达式来去掉这些奇怪的字符:
s = s.replaceAll("[^\u4e00-\u9fa5a-zA-Z0-9]", "");
其中,\u4e00-\u9fa5表示中文。
版权声明:本文为博主原创文章,未经博主允许不得转载。