java字符串提取汉字

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class test{
public static void main(String[] args) {
String str = "123abc中文cde123abc提取123ab我ABC汉DEF和我们678,854中华人民共和国,美国";
Pattern p = null;
Matcher m = null;
String value = null;
p = Pattern.compile("([\u4e00-\u9fa5]+)");
m = p.matcher(str);
while (m.find()) {
value = m.group(0);
System.out.println(value);
}
}
}

留着以后用到的

时间: 2024-10-22 02:17:37

java字符串提取汉字的相关文章

php正则字符串提取汉字

/*$str 为输入.输出字符串变量*/ preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str, $matches); $str = join('', $matches[0]); 原文地址:https://www.cnblogs.com/qingsong/p/9250968.html

4月02日 提取汉字首字母,并大写的类

  public class GetStringSpell    {        /// <summary>          /// 提取汉字首字母          /// </summary>          /// <param name="strText">需要转换的字</param>          /// <returns>转换结果</returns>          public strin

JAVA字符串类

一.字符串类String1.String是一个类,位于java.lang包中2.创建一个字符串对象的2种方式: String 变量名="值"; String 对象名=new String("值");3.字符串的常用方法 3.1 字符串长度--length() 3.2 判断值是否相等 equals() 3.3 判断字符串对象地址是否相同 == 3.4 忽略 大小写 判断 equalsIgnoreCase() 3.5 大小写转换 toLowerCase()--小写 to

Java 字符串操作的总结1(转载)

一.Java字符串类基本概念 在JAVA语言中,字符串数据实际上由String类所实现的.Java字符串类分为两类:一类是在程序中不会被改变长度的不变字符串:二类是在程序中会被改变长度的可变字符串.Java环境为了存储和维护这两类字符串提供了 String和StringBuffer两个类.  一.创建字符串 例: Stringstr=new("This is a String"); 或者 Stringstr="This is a String"; 二.得到字符串对象

统计字符串中汉字的个数

字符串可以包括数字.字母.汉字或者其他字符.使用Charater类的isDigit()方法可以判断字符串中的某个字符是否为数字, 使用Character类的isLetter()方法可以判断字符串中的某个字符是否为字母. 本案例将介绍用"正则表达式"来判断字符串中的某个字符是否为汉字,并统计该字符串中汉字的数量. 关键技术: Java中提供Pattern用于正则表达式的编译方式,该类的静态方法matches()可以执行正则表达式的匹配.该方法的声明如下: public static bo

PHP汉字转拼音的两种方法+PHP提取汉字(中文)方法

方法一:根据ASCII码转换,GB2312库对多音字也无能为力. GB2312标准共收录6763个汉字,不在范围内的汉字是无法转换,如:中国前总理朱镕基的"镕"字. GB2312中对所收汉字进行了"分区"处理,每区含有94个汉字/符号.这种表示方式也称为区位码.01-09区为特殊符号.16-55区为一级汉字,按拼音排序.(3755个)56-87区为二级汉字,按部首/笔画排序.(3008个)10-15区及88-94区则未有编码.占用的码位是72*94=6768.其中有

Java获取中文汉字的拼音

Java获取中文汉字的拼音 参考地址:https://www.cnblogs.com/langtianya/p/7098089.html 示例代码: 1 package com.tgram.sboot.util; 2 3 import net.sourceforge.pinyin4j.PinyinHelper; 4 import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; 5 import net.sourceforge.pinyin

获取整条字符串所有汉字拼音首字母的函数

不错的函数 拿来用用 function pinyin_long($zh){ //获取整条字符串所有汉字拼音首字母 $zh=gainChinese($zh,100);//提取中文 $ret = ""; $s1 = iconv("UTF-8","gb2312", $zh); $s2 = iconv("gb2312","UTF-8", $s1); if($s2 == $zh){$zh = $s1;} for($i

Java字符串学习笔记

通过看jdk源码发现Java字符串中有如下关系: 接口中的方法默认都是抽象的可以写也可以不写. public interface CharSequence { int length(); char charAt(int index); CharSequence subSequence(int start, int end); public String toString(); } 其他的都是该接口的实现类且是最终类,不能被继承. public final class String impleme