汉字自己主动注音程序

汉字注音

在平时应用中,可能会有这种需求:要给一些中文进行自己主动注音。这个程序就是依据这个需求实现的。

思想

汉字注音程序的思想主要是依赖一些已有的经常使用词的注音词表。对于给定的须要注音的汉字串text,首先对text进行分词。

这里的分词方法採用了正向最大匹配和逆向最大匹配想结合的方法。然后依据注音词表中每一个词是某个音的概率,得到一个最大可能的注音结果。

思想非常easy,实现后发现结果还不错。为了应用方便,我将程序打了jar包。PYLabeler_v1.0.jar.

调用方法

import com.ict.cl.PinyinLabeler;

public class Laber {
	public static void main(String [] args){
		String text = "參加会议";
		System.out.println(text+"-->"+PinyinLabeler.getPinyin(text));
	}
}

參加会议-->can jia hui yi

灰常简单,欢迎使用。

假设想了解代码,能够来这里看https://github.com/talentlei/PinYinLabeler

时间: 2024-08-02 02:49:30

汉字自己主动注音程序的相关文章

汉字自动注音程序

汉字注音 在平时应用中,可能会有这样的需求:要给一些中文进行自动注音.这个程序就是根据这个需求实现的. 思想 汉字注音程序的思想主要是依赖一些已有的常用词的注音词表.对于给定的需要注音的汉字串text,首先对text进行分词.这里的分词方法采用了正向最大匹配和逆向最大匹配想结合的方法.然后根据注音词表中每个词是某个音的概率,得到一个最大可能的注音结果. 思想很简单,实现后发现结果还不错.为了应用方便,我将程序打了jar包,PYLabeler_v1.0.jar. 调用方法 import com.i

C# 汉字转拼音 将中文转换成拼音

//建立一个公共类,用于转换汉字 public class ChnToPh { //定义拼音区编码数组 private static int[] getValue = new int[] { -20319,-20317,-20304,-20295,-20292,-20283,-20265,-20257,-20242,-20230,-20051,-20036, -20032,-20026,-20002,-19990,-19986,-19982,-19976,-19805,-19784,-19775

程序员如何让自己变得不可替代 | 快课网

今天看到一个有趣的问题,不禁想起这样一个问题:程序员如何让自己变得不可替代? 提问:西游记中为了节约成本,唐太宗需要在这个团队里裁掉一名队员,该裁掉哪一位,为什么? 故事背景:为了完成西天取经任务,组成取经团队,成员有唐僧.孙悟空.猪八戒.沙和尚.白龙马.其中唐僧是项目经理.孙悟空是技术核心.猪八戒和沙和尚是普通团员.白龙马是老板座驾.这个团队的高层领导是观音.团队的组成很有意思: 1.唐僧作为项目经理PM,有很坚韧的品性和极高的原则性,不达目的不罢休,又很得上司支持和赏识(直接得到唐太宗的任命

网页主动探测工具使用

单位的项目是IBatis做的,每个查询的SQL里面都有很多判断 上次优化SQL之后,其中的一个分支报错,但是作为dba,不可能排查每一个分支. 所以,干脆用爬虫爬过所有的网页,主动探测程序的异常. 这样有两个好处  1.可以主动查看网页是否异常 (500错误,404错误)  2.可以筛查速度较慢的网页,从这个方向也可以定位慢SQL吧.(也有服务器资源不足,造成网络超时的情况)  前提,  必须是互联网公司,大多数网页不用登录也可以浏览  首先,建表  CREATE SEQUENCE seq_pr

汉字转数字

import java.util.Scanner; import java.util.List; import java.util.ArrayList; import java.util.Map; import java.util.HashMap; /* 汉字转数字的程序.输入:八亿零二十万零一百零一 输出:800200101 汉字有效字符为:零一二(两)三四五六七八九十百千万亿 */ public class HanToNumber{ public static void main(Strin

[转]一个普通IT人的十年回顾---金旭亮

金旭亮老师十年体会,很有收获.转自网络. 金旭亮于1989年与超级解霸的开发者梁肇新同时迈入广西大学的校门,却走了一条与其不同的路. 1994年起开始自学计算机专业本科课程,并开始编程,从未间断,迄今已逾10年,仍对软件痴心不改.2002年北京理工大学计算机应用技术专业研究生毕业,后留校任教,主讲程序设计系列课程.2003年在CSDN论坛发表自传——<一个普通IT人的十年回顾>,细诉自己的坎坷学习经历,言辞激昂澎拜,感染了无数学子之心.发表后一石激起千层浪,先后收到近千封国内外邮件,对作者经历

BabelMap 7.0 汉化版(2014年6月24日更新)

软件简介 BabelMap 是一个免费的字体映射表工具,可辅助使用<汉字速查>程序. 该软件可使用系统上安装的所有字体浏览 Unicode 中的十万个字符,还带有拼音及部首检字法,适合文献工作者输入古.难.僻字,少数民族文字等各国语言文字.提供的注音信息可用于查找难字.僻字的读音. BabelMap 也是一个有趣的字体浏览工具(估计你想不到系统的字体里还有这么多奇怪而有趣的符号),可用于对比浏览系统上安装的字体(也可挂接未安装到系统的字体)的样式,通过其自带的字体分析工具,还可分析某个特定的字

《软件调试艺术》读后感四

1.条件断点 仅仅有符合某种条件时才在断点处停止. 类似于监视点的工作方式,每当该变量的值发生变化时,监视点都会中断.条件断点仅仅会在怀疑有问题的代码处当变量呈现该怀疑值时才中断. 设置条件断点:breakbreak-args if (conditon)如:break if (i==700) condition 6999 条件能够是: 1.         相等.逻辑和不想等运算符(<,<=,==,!=.,>.>=.&&,||等)如break 180 if stri

开发DataSnapserver

?? 在上次的文章中讨论了怎样把传统的Delphi 主从架构应用程序逐渐转换为DataSnap JSONserver.在本篇文章中让我们正式讨论怎样使用Delphi XE开发DataSnap/RESTserver.因为这当中牵涉到许多的技术,因此我们将花数篇的篇幅来讨论. 如今就让我们从DataSnap/RESTserver開始. Delphi XE版的DataSnap同意开发者同一时候在DataSnapserver中实作RESTful架构的server,如此一来DataSnapserver不但