深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式

很高兴的告诉大家,感谢GitHub上的h4x3rotab提供python版的搜狗用户词库备份bin格式的解析算法,感谢tmxkn1提供了C#版的实现,深蓝词库转换终于迎来了一个重大更新,能够支持搜狗用户词库的bin格式备份的导出了。再也不用受到搜狗输入法的钳制,可以自由切换到其他输入法了。搜狗bin词库只解析到了用户词条和词频,没有拼音,所以如果要导出其他拼音输入法,中间转换工具会根据词条的内容重新生成拼音。

另外在2.4版中,增加了用户词频强制设置的功能,比如将搜狗用户词库bin格式备份转换为Win10自带的微软拼音,那么词频会导致该词条在微软拼音上的位置不对,那么我们就需要忽略掉搜狗bin格式解析出来词频,而是使用1表示词频,这样在微软拼音中才会显示正常。

设置了强制的默认词频后,所有词频将按照新词频算法生成。

导入到Win10自带微软拼音的用户自定义短语后的效果如图:

最新版的深蓝词库转换的下载地址:

https://github.com/studyzy/imewlconverter/releases

原文地址:https://www.cnblogs.com/studyzy/p/9801629.html

时间: 2024-10-08 01:44:20

深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式的相关文章

深蓝词库转换2.7版发布——支持Mac原生输入法词库,QQ拼音新词库qcel格式

2020年过年期间,由于冠状病毒肺炎的流行,在家无事,就把搁置了很久的词库进行了改进.发布了2.7版:https://github.com/studyzy/imewlconverter/releases/tag/v2.7.0 转眼深蓝词库转换从诞生到现在都已经10个年头了,这是我做的最久的软件了.本次2.7版的更新主要包含了以下新特性: 一.MacOS原生简体拼音输入法自定义短语词库的支持 在MacOS的“系统偏好设置”中选择“键盘”,“文本”,即可看到,Mac简体拼音输入法的自定义短语词库.

【JavaScript 封装库】Prototype 原型版发布!

1 /* 2 源码作者: 石不易(Louis Shi) 3 联系方式: http://www.shibuyi.net 4 =================================================================================================== 5 程序名称: JavaScript 封装库 Prototype 版 6 迭代版本: 无 7 功能总数: 14 个 8 功能介绍: 9 1. 实现代码连缀 10 2. id /

CRL快速开发框架4.4版发布,支持主从读写分离

经过一些调整和优化,4.3已经运行在生产环境,对于不久将会遇到的查询性能,读写分离需求列上日程 读写分离需求 对于一个数据库作了主从发布/订阅,主库为DB1,从库为DB2 所有写入通过DB1,所有查询通过DB2,当然也可以通过DB1 CRL内部实现 在CRL内部调用,请求读和请求写的方法会标记为Read或Write,然后再通过标记实现不同的数据库连接访问对象 如以下代码 1 /// <summary> 2 /// 返回动态对象的查询 3 /// </summary> 4 /// &

深蓝词库转换2.8发布&mdash;&mdash;支持微软拼音自学习词库导入导出

Win10自带的微软拼音一直以来有不少忠粉,但是词库导入导出一直是一个问题,因为微软拼音的自学习词库是自有格式,没有对外开放,所以一直没有解决.只能通过自定义短语的形式导入其他输入法的词库到微软拼音中. 最近经过网友的提醒,再自我研究了几晚上,终于把微软拼音的自学习词库导入导出解决了. 本次2.8版本的发布主要包含了以下更新: 微软拼音自学习词库的导入和导出. 转换词库时如果某些词条无法转换,通过错误窗口提示错误信息. 增强了微软拼音自定义短语对多种双拼方案的支持. 修改持续集成的实现方式,使用

如何创造自己的数据字典(词库转换工具的使用)

对于很多做大数据的人来说,我们需要大量的数据字典作为我们准确分析信息的一个重要标准.而这些信息从哪儿来?我们不可能程序员自己一个一个去写吧?这样效率太低了! 所以,今天在这儿给大家分享一款软件.深蓝词库转换.exe工具! 下载地址是:http://download.csdn.net/detail/u011763190/8604025 希望能够帮助到大家! 还有一些比较好的词库下载地址: 百度输入法词库:http://shurufa.baidu.com/dict.html 搜狗输入法词库:http

Boost程序库完全开发指南——深入C++“准”标准库(第3版)

内容简介  · · · · · · Boost 是一个功能强大.构造精巧.跨平台.开源并且完全免费的C++程序库,有着“C++‘准’标准库”的美誉. Boost 由C++标准委员会部分成员所设立的Boost 社区开发并维护,使用了许多现代C++编程技术,内容涵盖字符串处理.正则表达式.容器与数据结构.并发编程.函数式编程.泛型编程.设计模式实现等许多领域,极大地丰富了C++的功能和表现力,能够使C++软件开发更加简捷.优雅.灵活和高效. <Boost程序库完全开发指南——深入C++“准”标准库(

开放源码的微微信.NET 0.8 版发布了

微微信.NET 0.8 版发布了     A.源码应用范围:         未认证的和经过认证的微信订阅号.微信服务号均可使用,本源码的每一个模块都提供完全的 ASP.NET C#源代码,绝对不含封装的DLL , 我们提供的是一套不断更新的源码,需要用户有一些.NET的基础.     B.微信方面功能     01  欢迎消息:微信被关注后用户消息自动回复欢迎消息:     02  关键词回复:微信用户关键字的自动文本.图文.音乐形式回复设置:     03  签到积分:微信的用户每日签到和积

MingQQ Android版发布了,可以在Android手机上登录你的QQ,收发消息哦...

最近为了学习Android开发,特意将原来写的MingQQ Windows版移植到了Android上面,以此练手.通过这次练习,学习到了不少Android开发的相关知识,特别是界面开发部分. MingQQ的界面模仿了Android QQ的基本功能,虽然体验性完全比不上QQ,但目前技术有限,只能做到现在这水平了,更好的界面用户体验留待以后再提升吧. 下拉刷新目前使用了第三方开源库Android-PullToRefresh,以后再考虑替换成自己写的下拉刷新组件,并增加消息列表的右滑删除功能. 发布的

MiinCMP1.0 SAE 新浪云版发布, 开源企业网站系统

MiinCMP是一款开源企业网站系统,除可运行于256M左右100元的国内IDC外,JUULUU聚龙软件团队近期开发了面向新浪云的版本,该版本可将网站免费布署到新浪云SAE上.MiinCMP采用java开发,兼容jetty,tomcat等servlet容器.   MiinCMP1.0 新浪云SAE版安装包 http://pan.baidu.com/s/1kT1EbUR 百度云下载   MiinCMP1.0 新浪云SAE版源码包 http://pan.baidu.com/s/1kT9f9mZ  百