python处理汉字转拼音pypinyin

主要是pypinyin 包,官网:  http://pypinyin.readthedocs.io/zh_CN/master/index.html

jieba包,主要是用来分词的,我之前的博文有介绍:http://www.cnblogs.com/dahu-daqing/p/7491343.html

官网:    https://github.com/fxsjy/jieba/blob/master/README.md

就不细讲了,软件包都是中国人写的,官网也都是中文,看上去无压力。

放一下我的练习实例:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Time    : 17-12-12 下午4:09
# Author  : dahu
# File    : t1pinyin.py
# Software: PyCharm

from pypinyin import lazy_pinyin,pinyin
from pypinyin.style import register
import sys
reload(sys)
sys.setdefaultencoding(‘utf-8‘)
@register(‘kiss‘)
def kiss(pinyin, **kwargs):
    return ‘>{0}<‘.format(pinyin)
print ‘自定义格式\t\t‘,lazy_pinyin(u‘么么‘,style=‘kiss‘)
print ‘字符前加u\t\t‘,lazy_pinyin(u‘呵呵‘)
a=‘我的‘
print ‘变量的unicode形式\t\t‘,lazy_pinyin(unicode(a))
print ‘默认的输出格式\t\t‘,pinyin(unicode(a))

结果:

/usr/bin/python2.7 /home/dahu/myfile/my_git/core-scrapy-learning/weiboresou/weiboresou/t1pinyin.py
自定义格式        [‘>me<‘, ‘>me<‘]
字符前加u        [u‘he‘, u‘he‘]
变量的unicode形式        [u‘wo‘, u‘de‘]
默认的输出格式        [[u‘w\u01d2‘], [u‘de‘]]

Process finished with exit code 0
时间: 2024-10-27 02:33:41

python处理汉字转拼音pypinyin的相关文章

09.python汉字转拼音,五笔

python实现将汉字转换成汉语拼音的库_python_脚本之家 - http://www.jb51.net/article/65496.htm python实现中文转拼音-keyxl-ChinaUnix博客 - http://blog.chinaunix.net/uid-26638338-id-3830276.html 中文拼音五笔转换带声调 - 在线工具 - http://tool.lu/py5bconvert/ pinyin4py 1.0.dev : Python Package Inde

python把汉字转换成拼音实现程序

python把汉字转换成拼音实现程序 文章一个简洁干的汉字转拼音 程序,复制下载就可以直接使用,有需要的同学可以参考一下下. #coding:utf-8 #基于python2.6 table = 'a,-20319;ai,-20317;an,-20304;ang,-20295;ao,-20292;ba,-20283;bai,-20265;ban,-20257;bang,-20242;bao,-20230;bei,-20051;ben,-20036;beng,-20032;bi,-20026;bi

python:将汉字转换为拼音

找了两个库,都是基于键值的对拼音的简单查找,不支持多音字: https://github.com/cleverdeng/pinyin.py https://github.com/anjuke/pinyin4py 也可以自己写一个简单的转换器,上面的两个项目中都有汉字和拼音的对照表. http://www.oschina.net/code/snippet_862384_25415 中的代码中也有对招表. 多音字的识别,目测可以参考结巴分词的实现原理: https://github.com/fxsj

JS版汉字与拼音互转终极方案,附简单的JS拼音输入法

原文:http://www.cnblogs.com/liuxianan/p/pinyinjs.html 前言 网上关于JS实现汉字和拼音互转的文章很多,但是比较杂乱,都是互相抄来抄去,而且有的不支持多音字,有的不支持声调,有的字典文件太大,还比如有时候我仅仅是需要获取汉字拼音首字母却要引入200kb的字典文件,无法根据实际需要满足需求. 综上,我精心整理并修改了网上几种常见的字典文件并简单封装了一下可以直接拿来用的工具库. 这篇文章差不多一个月前就写好了大部分了,但是就差拼音输入法这一块一直没时

C#汉字转拼音(支持多音字)

阅读目录 首先在nuget引用对应的包 简单的demo 汉字转拼音类封装 源码分享 之前由于项目需要,中间需要一个汉字转拼音和首拼的功能来做查询,感觉这种功能基本已经成熟化了,于是查找了相关的代码,首先引入眼帘的是下面两篇文章 1.C# 汉字转拼音(支持GB2312字符集中所有汉字) 2.[干货]JS版汉字与拼音互转终极方案,附简单的JS拼音输入法 感谢两位博主,写的比较全也很详细,都有提供源码,大家可以参考下. 由于考虑到接口的需要,于是参考了 第一篇,文章中作者的源码基本能满足汉字转拼音的需

swift 汉字转拼音

需要扩展一个String类的方法 extension String { func transformToPinYin() -> String { let mutableString = NSMutableString(string: self) //把汉字转为拼音 CFStringTransform(mutableString, nil, kCFStringTransformToLatin, false) //去掉拼音的音标 CFStringTransform(mutableString, ni

iOS获取汉字的拼音

在iOS开发中经常涉及到汉字的排序,最常见的就是需要根据首字母的字符顺序排列,比如常见的通讯录等.总结出来,大致可以分为两种方法,其中参考文献[1]中提供的方法十分复杂,并且代码量很大,不建议采用.另一种方法是直接采用Core Foundation中提供的方法,十分简单,封装好的代码如下: 1 - (NSString *)transform:(NSString *)chinese{ 2 //将NSString装换成NSMutableString 3 NSMutableString *pinyin

Microsoft Visual Studio International Pack 1.0 SR1--关于汉字转拼音

Microsoft Visual Studio International Pack 1.0 SR1————微软的一个类库 地址:http://www.microsoft.com/zh-cn/download/details.aspx?id=15251 Visual Studio International Pack 包含一组类库,该类库扩展了.NET Framework对全球化软件开发的支持.使用该类库提供的类,.NET 开发人员可以更方便的创建支持多文化多语言的软件应用.SR1 包含对 Ja

java实现将汉字转为拼音

有时候为了方便操作程序的开发,需要将汉字转为拼音等操作.下面这个是自己结合网上的资料,加上自己在公司项目中的亲自实践.完整的实现了将汉字转为拼音的操作.这个Demo只是负责将其转换,在main方法中测试,在实际需要中,只需要调用这个类中的方法即可.本人也是在学习中总结,欢迎各位大神拍砖指教,本人邮箱:[email protected].转载本博客时请在文章明显位置标明文章出处(itRed的博客:http://www.cnblogs.com/itred). 首先贴出测试结果: 测试参数: 汉字转换