将音频分割为60s内的短文件[Cygwin; speech

编程入门 行业动态 更新时间:2024-10-24 08:24:08

将<a href=https://www.elefans.com/category/jswz/34/1768490.html style=音频分割为60s内的短文件[Cygwin; speech"/>

将音频分割为60s内的短文件[Cygwin; speech

安装Cygwin和打开

Windows 安装 cygwin,及cygwin 中 下载cmake make gcc g++等编译软件
安装后,打开cygwin软件,进入相应目录E:\Program_Files\Cygwin\home\ASUS\speech-vad-demo
其中,E:\Program_Files\Cygwin是我安装Cygwin的位置,ASUS是我主机名称,speech-vad-demo是从GitHub点这里下载的代码并解压。

具体操作:

桌面上有相应图标,双击打开,pwd显示当前位置,结果为:/home/ASUS,实际对应的位置是E:\Program_Files\Cygwin\home\ASUS
speech-vad-demo代码文件复制到ASUS目录下。通过cd speech-vad-demo命令进入即可。

修改代码

1,复制待切分音频到./speech-vad-demo/pcm文件夹中,如result.wav。
2,打开./speech-vad-demo/src/main.c文件,修改第16行为:

const char filename[] = "pcm/result.wav"; // 读取的文件

保存。
3,在cygwin命令行窗口输入sh build_and_run.sh

效果




切分完成,可以看到。
音频文件通过 HMM(高斯混合模型) 切分为一些小于60s的片段,而且分割点都是说话人停顿的地方。

(一切似乎进展的很顺利,然而。。)
后续并不顺利,百度ai语音识别转换时报错了

资料

集成Webrtc的VAD,用于切分音频文件

Windows 安装 cygwin,及cygwin 中 下载cmake make gcc g++等编译软件
然后,sh build_and_run.sh

windows 安装cygwin教程
Windows:安装cygwin教程

百度AI平台:

更多推荐

将音频分割为60s内的短文件[Cygwin; speech

本文发布于:2024-02-12 15:01:58,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1688267.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:音频   文件   speech   Cygwin

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!