Python 汉字转拼音库 pypinyin

一、初衷:

  一些开源软件的配置文件中识别区分的部分用英文,那么我们在批量生成配置文件的时候,可以从CMDB导入汉字(idc_name),

然后将它转换成拼音,再或者拼接上IP地址,以便更准确的识别。例如:Smokeping的Targets配置文件,如下:

+telcom
menu = 中国电信
title = telcom

++yunfuxinxingshuangxian-01-61
menu = 云浮新兴双线-01
title = 61.11.11.11
host = 61.11.11.11

二、方法:

  我们可以调用Python的pypinyin库,来解决汉字转成拼音的问题。

>>> import pypinyin
>>> from pypinyin import pinyin, lazy_pinyin
>>> lazy_pinyin(u‘云浮新兴双线-01‘)
[u‘yun‘, u‘fu‘, u‘xin‘, u‘xing‘, u‘shuang‘, u‘xian‘, u‘-01‘]
>>> ‘‘.join(lazy_pinyin(u‘云浮新兴双线-01‘))
u‘yunfuxinxingshuangxian-01‘
>>> ‘‘.join(lazy_pinyin(u‘云浮新兴双线-01‘))+‘-‘+‘61.11.11.11‘.split(‘.‘)[0]
u‘yunfuxinxingshuangxian-01-61‘

  另外:你将汉字转成了拼音写入配置文件,可能还需要拼音转成汉字,用来显示报表等。

那么你可以读取配置文件,取相应的menu(汉字部分)。这里仅提供一种解决思路,具体看实际需求。

grep -n1 yunfuxinxingshuangxian /etc/smokeping/config.d/Targets |grep menu|awk ‘{print $NF}

附:汉字拼音转换工具(Python版)官方网址:http://pypinyin.readthedocs.org/en/master/

时间: 2024-10-05 02:54:51

Python 汉字转拼音库 pypinyin的相关文章

Java汉字转拼音库,Pinyin4j

pinyin4j是一个支持将简体和繁体中文转换到成拼音的Java开源类库,作者是Li Min ([email protected]).以下是一些具体的介绍和使用方式.         1.pinyin4j的官方下载地址http://sourceforge.net/projects/pinyin4j/files/ 2.下载解压后的目录结构及说明如下 (1)    doc : pinyin4j的api文档 (2)    lib : pinyin4j的jar包 (3)    src : pinyin4

Python 汉字转拼音

本文参考: Python中文转拼音代码(支持全拼和首字母缩写) 中文中不可以有"()" # -*- coding: utf-8 -*- __version__ = '0.9' __all__ = ["PinYin"] import os.path class PinYin(object): def __init__(self): self.word_dict = {} def load_word(self, dict_file): self.dict_file =

python 汉字与拼音的转换--pypinyin

1. 安装pypinyin module $ pip install pypinyin 2. 使用方法 >>> from pypinyin import pinyin, lazy_pinyin >>> import pypinyin >>> pinyin(u'中心') [[u'zh\u014dng'], [u'x\u012bn']] # 启用多音字模式 >>> pinyin(u'中心', heteronym=True) [[u'zh\

09.python汉字转拼音,五笔

python实现将汉字转换成汉语拼音的库_python_脚本之家 - http://www.jb51.net/article/65496.htm python实现中文转拼音-keyxl-ChinaUnix博客 - http://blog.chinaunix.net/uid-26638338-id-3830276.html 中文拼音五笔转换带声调 - 在线工具 - http://tool.lu/py5bconvert/ pinyin4py 1.0.dev : Python Package Inde

Python汉字转换成拼音

最近在使用Python做项目时,需要将汉字转化成对应的拼音.在Github上找到了一个现成的程序. Python汉字转拼音 使用实例如下: from pinyin import PinYin test = PinYin() test.load_word() print test.hanzi2pinyin(string='钓鱼岛是中国的') print test.hanzi2pinyin_split(string='钓鱼岛是中国的', split="-") 输出: ['diao', 'y

【推荐】iOS汉字转拼音第三方库

PinYin4Objc是一个在git汉字转拼音的开源库,支持简体和繁体中文.效率POAPinyin等其他库要高,转换库也完整下面简单介绍 实现原理 使用unicode_to_hanyu_pinyin.txt存储汉字编码相对应的拼音,以字典加载到内存中 NSString *resourceName =[[NSBundle mainBundle] pathForResource:@"unicode_to_hanyu_pinyin" ofType:@"txt"]; NSS

python:将汉字转换为拼音

找了两个库,都是基于键值的对拼音的简单查找,不支持多音字: https://github.com/cleverdeng/pinyin.py https://github.com/anjuke/pinyin4py 也可以自己写一个简单的转换器,上面的两个项目中都有汉字和拼音的对照表. http://www.oschina.net/code/snippet_862384_25415 中的代码中也有对招表. 多音字的识别,目测可以参考结巴分词的实现原理: https://github.com/fxsj

Java_开源框架_JPinyin汉字转拼音的Java开源库

本博文为子墨原创,转载请注明出处! http://blog.csdn.net/zimo2013/article/details/50039339 1.介绍 JPinyin是一个汉字转拼音的Java开源类库,在PinYin4j的功能基础上做了一些改进.[JPinyin主要特性]1.准确.完善的字库:Unicode编码从4E00-9FA5范围及3007(〇)的20903个汉字中,JPinyin能转换除46个异体字(异体字不存在标准拼音)之外的所有汉字:2.拼音转换速度快:经测试,转换Unicode编

隐马尔科夫模型python实现简单拼音输入法

在网上看到一篇关于隐马尔科夫模型的介绍,觉得简直不能再神奇,又在网上找到大神的一篇关于如何用隐马尔可夫模型实现中文拼音输入的博客,无奈大神没给可以运行的代码,只能纯手动网上找到了结巴分词的词库,根据此训练得出隐马尔科夫模型,用维特比算法实现了一个简单的拼音输入法.githuh地址:https://github.com/LiuRoy/Pinyin_Demo 原理简介 隐马尔科夫模型 抄一段网上的定义: 隐马尔可夫模型 (Hidden Markov Model) 是一种统计模型,用来描述一个含有隐含