数字变声器设计方案|电子爱好者

admin管理员组
文章数量:1567918

2023年12月12日发(作者：)

基于FFT算法的数字变声器

201242216

河北北方学院宣化教学部河北宣化 075100

【摘要】本数字变声器是实现男声变女声和女声变男声以及变成童声的系统。设计本数字变声器的目的是锻炼自己的学习实践能力。通过matlab编写程序修改语音参数来实现男声女声之间的变换。

【关键词】变音算法数字滤波器语音信号数字滤波器频谱分析 MATLAB

1 引言

变声器在现实生活中应用广泛，变声器是通过改变输入音频的音色、音调，并将变声后的音频输出的工具。根据变声器材质不同，变声器分为变声器硬件和变声器软件。变声器硬件，即通过硬件实现变声的工具；变声器软件，即通过软件实现变声的工具，软件类变声器，运行平台皆为电脑系统。无论是硬件变声器，还是软件变声器，其原理都是，通过改变输入声音频率，进而改变声音的音色、音调，使输出声音在感官上与原声音不同。我们每个人的声音不同，源于我们的每个人的音色和音调不同，我们所说的男中音、男高音，就是音调的不同，而即便音调一致，我们依然能区分出两个不同人的声音，或不同乐器的声音，这就是音色的不同。变声器，正是借助对声音音色和音调的双重复合改变，实现输出声音的改变。我们这里的变声器就是matlab来实现变声。

2 数字变声器的原理和算法

发音方法，发音时，喉头、口腔、鼻腔节制气流的方式和状态，包括发音时构成阻碍和克服阻碍的方式，气流强弱的情况及声带是否振动等几个方面。人类语音可分为有380声语音和无声语音，前者是由声带振动激励的脉冲信号经声腔调制变成不同的音，它是人类语言中元音的基础，声带振动的频率称为基频。无声语音则是声带保持开启状态，禁止振动引发的。一般来说，由声门振动决定的基频跟说话人的性别特征有关，如下表，而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短，其共振峰频率高于成年人，成年女性的声道一般短于成年男性，所以女性的共振峰频率一般高于男性。本实验是基于男生录制的声音进行相关参数提取，修改接近于女声、童声、老人声，并实现了音调的高低与速度的快慢1.变声原理

在进行性别变声时，主要考虑基音周期、基频和共振峰频率的变化。基音周期改变时，基频、共振峰同时变化，若伸展既有男变女、女变童，反之亦可。本实验是基于男生录制的声音进行相关参数提取，修改接近于女声，实现男声到女声的变换。

● 音段特征：描述的是语音的音色特征。特征参数主要包括基音频率、

共振峰位置、共振峰带宽、基音频率、能量等。

● 超音段特征：描述的是语音的韵律特征。特征参数主要包括因素的时

长、基音频率的变化（音调）、能量等

● 语言特征：包括习惯用语、方言、口音等。基音是指发浊音时声带振

动所引起的周期性，而基音周期是指声带振动频率的倒数。基音周期是语音信号最重要的参数之一，它描述了语音激励源的一个重要特征。不同的人以及同一个人在不同的年龄时期有不同的基音周期。人唱歌时，其基音频率范围大约是：童声高音频率范围为

260-880Hz ，低音频率范围为 196-700Hz ，女声高音频率范围为 220-1.1KHz, 低音频率范围为 200-700Hz ，男声高音频率范围为 160-523Hz 低音频率范围为 80-358Hz 。此外，基音的变化模式称为声调，它携带着非常重要的具有辨意作用的信息。先就如何实时地通过基音频率的变化来实现语声变声，进行讨论， Matlab实现算法。

男声基频分布（hz）：50~180 共振峰频率分布：偏低

人群

女声基频分布（hz）：160~380 共振峰频率分布：中

提取参数

（1 ）语音时变傅里叶变换为：X(e)jwnx(n)ejwn

在低通滤波时，采用巴特沃斯滤波器。

（2）构建巴特沃斯低通滤波器

根据人的说话特征设定相应指标参数，对本段语音设计算出巴特沃斯模拟滤波器的阶数，截止频率，归一化低通原型系统函数。

本段语音设计算出巴特沃斯模拟滤波器的阶数N为5，3dB截止频率,,算出为0.175，归一化低通原型系统函数为：

其中

将带人中，得到低通滤波器，

各种理想数字滤波器的幅度频率响应

流程图

准备查看变声器和声音的相关资料收集声音进行波形分析，傅里叶变换构建巴特沃斯低通滤波器用matlab进行程序设计，构建GUI界面男声打开声音文件女声变女声变男声

3 数字变声器的软件实现与仿真结果

代码部分

选择音频文件 [filename,pathname]=uigetfile({'*.wav','ALL FILES'},'select voice file');

if isequal([filename pathname],[0,0])

return;

end

str=[pathname filename];

[temp,Fs]=audioread(str);

temp1=resample(temp,80,441);

handles.y1=temp;

handles.y=temp1;

=Fs;

guidata(hObject,handles);

原音播放

c=;

sound(handles.y1,c);

plot(1,handles.y1)

title(1,'时域图');

ysize=size(handles.y1);

y1=fft(handles.y,length(handles.y1));

ysize=size(y1);

plot(2,abs(y1(1:ysize/2)));

xlabel(2,'频率');

ylabel(2,'幅度');

title(2,'频率特性');

男声变女声

FL=80;

WL=240;

P=10;

x1=handles.y;

fs=;

x1=resample(x1(:,1),8000,fs);

fs=8000;

x1=x1+0.000001*randn(length(x1),1);

x1=x1/max(x1);

L=length(x1);

FN=floor(L/FL)-2;

exc=zeros(L,1);

zi_pre=zeros(P,1);

x1_rec=zeros(L,1);

zi_rec=zeros(P,1);

exc_syn=zeros(L,1);

x1_syn=zeros(L,1);

last_syn=0;

zi_syn=zeros(P,1); exc_syn_t=zeros(L,1);

x1_syn_t=zeros(L,1);

last_syn_t=0;

zi_syn_t=zeros(P,1);

hw=hamming(WL);

for n=3:FN

x1_w=x1(n*FL-WL+1:n*FL).*hw;

[A E]=lpc(x1_w,P);

x1_f=x1((n-1)*FL+1:n*FL);

[exc1,zi_pre]=filter(A,1,x1_f,zi_pre);

exc((n-1)*FL+1:n*FL)=exc1;

[x1_rec1,zi_rec]=filter(1,A,exc1,zi_rec);

x1_rec((n-1)*FL+1:n*FL)=x1_rec1;

x1_Pitch=exc(n*FL-222:n*FL);

PT=findpitch(x1_Pitch);

G=sqrt(E*PT);

PT1=floor(PT/2);

poles=roots(A);

deltaOMG=190*2*pi/8000;

for p=1:10

if imag(poles(p))>0 poles(p)=poles(p)*exp(j*deltaOMG);

elseif imag(poles(p))<0 poles(p)=poles(p)*exp(-j*deltaOMG);

end

A1=poly(poles);

tempn_syn_t=[1:n*FL-last_syn_t]';

exc_syn1_t=zeros(length(tempn_syn_t),1);

exc_syn1_t(mod(tempn_syn_t,PT1)==0)=G;

exc_syn1_t=exc_syn1_t((n-1)*FL-last_syn_t+1:n*FL-last_syn_t);

[x1_syn1_t,zi_syn_t]=filter(1,A1,exc_syn1_t,zi_syn_t);

exc_syn_t((n-1)*FL+1:n*FL)=exc_syn1_t;

x1_syn_t((n-1)*FL+1:n*FL)=x1_syn1_t;

last_syn_t=last_syn_t+PT1*floor((n*FL-last_syn_t)/PT1);

end

sound(x1_syn_t,fs)

plot(1,x1_syn_t);

title(1,'时域图');

grid on;

ysize=size(x1_syn_t);

y=fft(x1_syn_t,length(x1_syn_t));

ysize=size(y);

plot(2,abs(y(1:ysize)))

xlabel(2,'频率 ');

ylabel(2,'幅度'); title(2,'频率特征');

女声变男声

FL = 80; %帧长

WL = 240; % 窗长

P = 10; % 预测系数个数

c=;

Fs=c;

s=handles.y;

s = resample(s(:,1),8000,Fs);

Fs = 8000;

s = s + 0.000001*randn(length(s),1);

s = s/max(s); %归一化¯

L = length(s); % 读入语音长度

FN = floor(L/FL)-2; %计算帧数

% 预测和重建滤波器

exc = zeros(L,1); %激励信号

zi_pre = zeros(P,1); % 预测滤波器状态¬

s_rec = zeros(L,1); % 重建语音

zi_rec = zeros(P,1);

% 变调不变速滤波器

exc_syn_t = zeros(L,1); % 合成的激励信号

s_syn_t = zeros(L,1); % 合成语音

last_syn_t = 0; %储存上一个或多个段的最后一个脉冲的下标

zi_syn_t = zeros(P,1); % 合成滤波器状态

hw = hamming(WL); %依次处理语音

for n = 3:FN

%计算预测系数

s_w = s(n*FL-WL+1:n*FL).*hw; %汉明窗加权后的语音

[A, E] = lpc(s_w, P);

s_f = s((n-1)*FL+1:n*FL); % 本帧语音

% 计算激励

[exc1,zi_pre] = filter(A,1,s_f,zi_pre);

exc((n-1)*FL+1:n*FL) = exc1; %计算得到的重建语音

[s_rec1,zi_rec] = filter(1,A,exc1,zi_rec);

s_rec((n-1)*FL+1:n*FL) = s_rec1;

· s_Pitch = exc(n*FL-222:n*FL);

PT = findpitch(s_Pitch); % 计算基音周期pt

G = sqrt(E*PT); % 计算合成激励的能量

PT1 =floor(PT/0.50);

poles = roots(A);

deltaOMG = 80*2*pi/8000;

for p=1:10 if imag(poles(p))>0 ,poles(p) = poles(p)*exp(1i*deltaOMG);

elseif imag(poles(p))<0 ,poles(p) = poles(p)*exp(-1i*deltaOMG);

end

A1=poly(poles);

tempn_syn_t = (1:n*FL-last_syn_t)';

exc_syn1_t = zeros(length(tempn_syn_t),1);

exc_syn1_t(mod(tempn_syn_t,PT1)==0) = G; %算出脉冲

exc_syn1_t = exc_syn1_t((n-1)*FL-last_syn_t+1:n*FL-last_syn_t);

[s_syn1_t,zi_syn_t] = filter(1,A1,exc_syn1_t,zi_syn_t);

exc_syn_t((n-1)*FL+1:n*FL) = exc_syn1_t; %计算得到的合成激励

s_syn_t((n-1)*FL+1:n*FL) = s_syn1_t; %计算得到的合成语音

last_syn_t = last_syn_t+PT1*floor((n*FL-last_syn_t)/PT1);

end

sound(s_syn_t,Fs);

plot(1,s_syn_t)

title (1,'时域');

ysize=size(s_syn_t);

y=fft(s_syn_t,length(s_syn_t));

ysize=size(y);

plot(2,abs(y));

xlabel(2,'频率');

ylabel(2,'振幅');

title(2,'频域');

仿真图形

（1）男原声播放

女原声播放

（2）男声变女声

（3）女声变男声 4结束语

经过对数字变声器的设计，我收获很多。自己也感觉到数字信号处理的应用和matlab的强大，同时网络是学习的重要工具，能在网络上获得好多资料。在这里非常感谢曹老师给我的这次机会，也感谢老师和同学们的热心的帮助。

参考文献

[1] 程佩青.数字信号处理教程。清华大学出版社，2007.2

[2] 张威 MATLAB基础与编程入门（第二版）西安电子科技大学出版社，2008.1

[3] 陈垚光等.精通MATLAB GUI设计.北京：电子工业出版社，2011.1

[4] 高西全,丁玉美.数字信号处理(第三版)[M].西安电子科技大学出版社,2011.

[5]陈生潭,郭宝龙,李学武,高建宁.信号与系统(第三版)[M].西安电子科技大学出版社,2008.

[6] 张雪英.数字语音处理及MATLAB仿真.北京：电子工业出版社，2010.7

[7] 郑阿奇.MATLAB实用教程。北京：电子工业出版社，2007.8

本文标签：变声频率语音声音数字

版权声明：本文标题：数字变声器设计方案内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1702373212a3652.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

数字变声器设计方案

更多相关文章

关于我乱删注册表导致电脑没有声音这件事

android内录音软件,安卓内录声音软件（能内录音频的手机软件）

Win10和Win11设置开机默认开启数字小键盘

win11开机数字小键盘失灵不能使用问题

HNB：ON THE FUSION OF STATIC AND DYNAMIC FEATURES FOR SPEECH EMOTION RECOGNITION - 语音情感识别论文

vivo手机计算机怎么开语音,vivo怎么打开语音助手

rx580默认频率1150_不到1300元的RX580 显卡能买吗？！迪兰 RX580 2048SP 4G X-Serial 开箱测试...

探索语音技术的未来：Microsoft Cognitive Services Speech SDK 示例项目

html5 讯飞离线语音包,讯飞输入法离线语音怎么用？讯飞输入法离线语音开启方法...

科大讯飞输入法android离线语音,讯飞输入法Android5.0.1752 离线语音更轻快的表达...

讯飞输入法PC版测评：拼音输入糟糕，语音输入强悍

html调用讯飞语音文本朗读,(原创)讯飞输入法的妙用:语音翻译+智能OCR + 文本转语音播报...

搜狗语音输入提示服务器繁忙,讯飞语音输入如何提高识别率 提高方法

【Qbot】6.讯飞文字转语音Api使用VITS派蒙复读机实现

html语音输入功能讯飞,图解讯飞语音输入法pc版语音悬浮窗的正确用法

水深火热的国内三大语音输入法对比

Python调用讯飞语音合成API接口来实现文字转语音

百度AI输入法发布全感官输入2.0版本，语音技术取得世界级突破

win10系统没声音 服务器,解决Win10正式版没有声音的五种方法

win10系统禁用音频服务器,Win10下怎样设置禁用扬声器、插入耳机有声音【图文教程】...

发表评论

推荐文章

关于chrome浏览器更新后，谷歌插件无法给网页嵌套的iframe植入cookie的问题

万物互联：软件与硬件的协同之道

达梦数据库-下载安装、基本操作及报错处理

chrome浏览器获取一个要下载文件的地址的方法

Macbook Pro 删除启动台无效图标

热门文章

关于云桌面的几个常见问题

利用Java Swing实现在线游戏盒子：推箱子 + 飞机大战游戏

谷歌浏览器安装（Win、Linux、离线安装）

本地计算机添加网络打印机共享,共享好的打印机，如何添加到本地来使用？-win7添加打印机...

【操作系统】《计算机的心智:操作系统之哲学管理》读书笔记

Git版本控制学习笔记

java下载次数_java 统计下载次数，却加多了一次，点击下载按钮，走了一遍，弹出迅雷下载窗口，点击下载，又走多一遍。...

Docker下载与安装(win7，8，10，mac)

windows 命令 关机 ISO装载

在Docker中使用Dockerfile实现ISO文件转化为完整版Centos镜像，并搭建集群数据仓库

最新文章

猫头虎分享: MathType 7.6 从入门到精通教程

华硕FL5900U笔记本电脑重装win10专业版详细操作教程

ThinkPad X1 Carbon 安装Ubuntu 18.04到移动硬盘 教程指南

重装系统相关操作流程

教你如何制作OS X Lion启动U盘与使用U盘安装系统

Autodesk 2015全套密钥

如何使用U盘安装操作系统,非PE安装系统的方法

用U盘安装Ubuntu15.04

不使用 U 盘等任何工具全新安装 Windows 操作系统

【重装Windows系统后】电脑环境部署

Visio专业版 2019激活（步骤详细）

ubuntu14.04 u盘安装教程

ubuntu 18.04 双系统安装

电脑安装ubuntu系统详细教程

无显示器u盘安装centos_从u盘安装centos

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

搜狗语音输入提示服务器繁忙,讯飞语音输入如何提高识别率提高方法

win10系统没声音服务器,解决Win10正式版没有声音的五种方法

windows 命令关机 ISO装载

ThinkPad X1 Carbon 安装Ubuntu 18.04到移动硬盘教程指南

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载