更低价的Python语音识别【含离线】

编程入门 行业动态 更新时间:2024-10-08 10:52:06

更低价的Python语音识别【含<a href=https://www.elefans.com/category/jswz/34/1767604.html style=离线】"/>

更低价的Python语音识别【含离线】

本文章仅仅讲述了思路,具体代码可以百度搜索。

为什么要低价?

想去开发一款商用的语音识别,比如智能家具之类的,因此会遇到大量的访问(如果遭受黑客攻击,你所购买的语音包可能会在几分钟之内被调用完)。

并且在线的语音识别价格并不客观,百度云每个要0.0011元/次,华为云更是贵的离谱。

而例如讯飞这样的离线识别语音包,却不支持windows平台,因此我们需要一个更便宜的离线识别方案

离线识别很差劲吗?

如果让我评价离线识别,只能说在python平台上,不好做。

目前python最大的离线识别就是sphinx,实际体验效果不好,但是可以进行小范围的输入,比如开启 空调,这样的指令,做智能对话,就变得完全无用。

当然啦,也不是一无是处,目前这个库的功能就是用来做唤醒功能的,可以自定义词库,去训练它。

谷歌识别 最好的方案

谷歌语音识别,真的是目前最好的方案,但是大陆无法访问,当然,你可以去考虑购置一台香港的服务器,然后搭建一个转发功能,把用户上传的语音文件传给谷歌,然后返回给用户识别出来的文字。

然而这绝对不是长久之计,因为人口基数庞大的话,你的带宽可能撑不住。

kaldi真正的智能识别

这是我正在尝试的方案,因为利用java,C++去开发语音识别的比较多,比如kaldi,可以利用一些别人发布的模型去使用。

缺点就是,离线识别的库太大了,如果说你不在意那几百m的空间,可以塞进客户端。

文章很短,只是记录下我的思路,前两者我都去尝试过了,实在是不可行。如果哪家大公司愿意出一个桌面级的离线识别接口,那就是大吉大利了(虽然这不可能,因为这会牵扯到他们的利益)

更多推荐

更低价的Python语音识别【含离线】

本文发布于:2024-02-13 09:49:43,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1758099.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:离线   低价   语音识别   Python

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!