找了两个库,都是基于键值的对拼音的简单查找,不支持多音字:
https://github.com/cleverdeng/pinyin.py
https://github.com/anjuke/pinyin4py
也可以自己写一个简单的转换器,上面的两个项目中都有汉字和拼音的对照表。
http://www.oschina.net/code/snippet_862384_25415 中的代码中也有对招表。
多音字的识别,目测可以参考结巴分词的实现原理:
https://github.com/fxsjy/jieba
时间: 2024-10-27 02:33:35