一个基于科大迅飞语音识别库的语音控制工具
目前内部模块包括
科大迅飞语音识别模块
语音识别控制模块
语音信息模糊匹配模块(PCRE正则)
功能执行模块
界面显示模块
各个模块之间耦合性不是非常高
比较容易拆分
目前可预见的重要问题:
1:当前工程目前只支持完整的指令识别,
也就是在一定时间内,说一句话,然后识别一句,
不支持断续的指令识别,
这里后续需要改进。
2:我申请的科大迅飞语音识别权限为在线版,
离线之后无法进行语音识别,
以后是否需要考虑换平台问题。
3:响应速度的问题,
目前配置响应速度为
“语音前2秒+语音中+语音后2秒+科大迅飞的识别时间大致1秒”
可以感受到的速度为说话后,等待3-4秒,才响应,
有点慢,这个时间该优化一下。
目前完成度不高,
只实现了打开程序相关的指令响应,
其他后续指令需要慢慢添加
如果有人愿意陪我一起完善它,我会很高兴的
GITHUB 地址
https://github.com/276793422/SpeechControl_Windows.git
时间: 2024-10-24 23:10:56