Tutorial

编程入门 行业动态 更新时间:2024-10-24 22:24:02

<a href=https://www.elefans.com/category/jswz/34/1767379.html style=Tutorial"/>

Tutorial

OK,沉迷了快两个星期,终于有进展了啊啊啊!!!

这段时间内心崩溃,感觉毫无思路,但是我没放弃!!!看了许多论文,然后代码在这个星期也终于调通了。不过还是有很多地方值得优化,后面再继续努力吧!

其实我个人觉得语音识别这一块的商用还不够,情感识别就更别说了,而且识别率这一块有待提升。

开始正题

数据集用的是EMO-DB数据集。并以此充当训练集,测试集自己想用哪些音频就可以用哪些音频,但是命名和文件路径得符合代码编写的规则。音频时长最好不要超过6秒,以便获得比较好的性能。

一些重要函数:

获取数据集

预测情感函数

训练模型获取数据

项目中重要文件及对应的功能:
audioFeatureExtraction.py :音频特征提取,从音频中提取功能
globalvars.py:全局变量
train.py:训练模型
predict.py:根据音频预测情感

整个框架采用的是双LSTM+attention机制,attention机制是通过逻辑回归实现的。

训练数据

预测情感结果

情感分类有以下几种:生气,无聊,厌恶,焦虑(害怕),幸福,悲伤,中立。

现在模型的预测准确率在百分之六十几,后面会通过继续学习来提高精度的。

生命不息,奋斗不止,Fighting!!!

定个小目标:即将拥有腹肌SZY!!!

更多推荐

Tutorial

本文发布于:2024-03-13 02:58:11,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1733035.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:Tutorial

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!