eggplant 发表于 2014-12-14 12:41

想问问语音识别有没有什么开源的库?

汉语语音别,就是自己录点声音,或者说对着麦克说一些特定的句子,比如开机,关机,上一页,下一页这种词,可以识别出来的。
然后我在C/C++中可以继续处理,比如再执行一个什么相关函数。
不知道相关内容该怎么找,感觉上应该是要大量的语音采样库为基础吧?有没有业内给点方向,该找哪方面的东西。

残酷的天使 发表于 2014-12-14 13:28

本帖最后由 残酷的天使 于 2014-12-14 13:29 编辑

开源的不了解。。楼主是要做在什么平台上?我只知道一些API提供商提供自己的SDK,基本都是C或者C++.但是核心的引擎和模型都不是自己能够控制的,最多也就是一些初始化时候参数的微调。一般根据需求需要和sdk提供商定制一些模型文件,因为一般也只是做有限范围的词汇识别,定制的模型可以有一些优化和简化。这样最后集成的东西可以控制的比较小。
手机上接触过你这种类似的用途的,大概就是监听一些特定的词语做命令响应。比较像google语音那个"ok google",当然那个更底层而且google自己是完全控制所有链条。我们自己原型研发的时候是集成第三方的引擎来做声音的识别处理,所以基本就是一个盒子往里塞个音频数据的样子。
如果要集成更宽泛的语音识别的话,中文么就知道讯飞了。

eggplant 发表于 2014-12-14 17:22

本帖最后由 eggplant 于 2014-12-14 17:26 编辑

残酷的天使 发表于 2014-12-14 13:28
开源的不了解。。楼主是要做在什么平台上?我只知道一些API提供商提供自己的SDK,基本都是C或者C++.但是核 ...
windows平台,其实就是想实现个简单的中文语音识别,之后按识别出来的内容执行个指令,比如用在游戏上,用语音输入,开启,关闭功能等,让人看起来有点高大上的感觉。
开不开源其实问题不大,反正就是识别一下,正确了能自己调用个函数就行。

类似这种应用。

http://www.bilibili.com/video/av762679/

没落の翼 发表于 2014-12-14 18:18

没太看懂楼主的表述, 你现在是只需要数据库来训练你的识别器还是说你只是简单的有一个想做语音识别的想法?

紧那罗 发表于 2014-12-14 18:45

你就是要套api就好了吧...
开源的不知道 SDK的话谷歌 微软都有
国产的有个讯飞?

eggplant 发表于 2014-12-14 19:14

感谢回复,已经搞定,讯飞折腾中。
页: [1]
查看完整版本: 想问问语音识别有没有什么开源的库?