admin管理员组文章数量:1566678
2024年6月28日发(作者:)
软件2012年第33卷第3期 S0FTWARE 国际IT传媒品牌
基于多音轨MIDI主旋律提取的音乐可视化表达
孙博文 张艳鹏 赵振国 高超 孟繁博
(1.哈尔滨理工大学计算中心,哈尔滨150080I 2.哈尔滨理工大学计算机科学与技术学院,哈尔滨150080l
3.哈尔滨理工大学应用科学学院,哈尔滨150080;4.哈尔滨理工大学电气学院,哈尔滨150080)
摘要:本文以MIDI音乐为研究对象,以表达音乐主旨为前提,提出了一种基于主旋律提取的音乐可视化表达方法。通过对
MIDI文件的特征识别,构造音乐主旋律的提取方法,并将提取出来的主旋律作为音乐视觉表现的主要对象,而其他非主旋律的音乐
元素淡化辅助表示,从而实现更加准确表达音乐核心之目的,以达到更好的视听效果。
关键词:音乐可视化;MIDI音乐;音乐特征提取;主旋律提取
中图分类号:TP391 文献标识码:A DOI:10.3969 ̄.issn.1003—6970.2012.03.019
Music Automatic Classification Approach Based on Fractal Dimension
SUN Bo—wen ,ZHANG Yan.peng ,ZHAO Zhen.guo ,GAO Chao ,MENG Fan.bo
(1.Computing Center,Harbin University ofScience and Technology,Harbin 150080;
2.Computer Science and Technology,Harbin University ofScience and Technology,Harbin 1 50080;
3.AppliedScience,Harbin Universiyt ofScience and Technology,Harbin 150080;4.Electric,Harbin Universiyt ofScience and Technology,Harbin 150080)
[Abstract]This article takes MIni music as research object,on the premise ofexpressing music hetme and then put forward a meth-
od which is based on the extraction of melody to express music visualization.Through the characteristics identification of MIDI,create a
method of melody extraction.And the melody extracted from music represent as a visual object of music visualization.The other element
will be represented lightly ̄So as to achieve a more accurate expression music core purposes and better audio-visual effects.
[Key words]Music visualization;MIDI music;MIDI’S music feature extraction;melody extraction
0 引 言
音乐可视化(Music Visualization)是对音乐表达的一种
非主观的解释和判断,是为理解、分析、比较音乐的表现力和内
部结构提供的一种呈现技术…。它是跨音乐 数字音频、图形
学、图像处理、虚拟现实等领域的又一新的研究方向,在娱乐、
教育、艺术和商业中具有广阔的应用前景。作为一种全新的视
为研究的数据源。
1 多音轨MIni文本文档的创建
1.1 MIDI的基本格式
MIDI结构如下图1所示 。具体说明如下:
一
个文件头块 多个音轨
听技术,近年来,音乐可视化也引起了科研人员的密切关注。
但是现今的音乐可视化方法多将各音乐元素看成整体进
行统一展示,未能将主旋律与辅旋律区分开来,以至于无法突
出音乐所要表现的主体内容。如:一些音乐中的激烈背景鼓点
块标识 MTrk) 块长度
块标识{MTrd) 块长度 格式信息 音乐头 MIDI事伺
可能会掩盖同时出现的主旋律所要表达的可视化内容。
鉴于此,本文提出了一种基于主旋律提取的音乐可视化表
达方法,将音乐主旋律提取并进行突出可视化显示,同时辅以
音乐的辅助旋律进行背景淡化显示。
金毅等人通过研究指出 :从自然声音文件中提取旋律特
征的处理过程复杂、难度高,精确度差。而结构化声音MIDI,
其构造方式是以音乐元素的组织结构为基础的,所以为音乐特
征的自动识别提供了极大的方便,因此本文选取MIDI乐曲作
通道信息 系统信息
通道模 通道声 系统一 系统实 系统专
式信息 音信息 般信息 用信息 用信息
图l MIDI音乐格式
(1)文件头:
十六进制代码为:4d 54 68 64l 00 o0 o0 06I ff ff
nn nnI dd dd,其中:
基金项目:全国大学生创新实验资助编号:(101021434)
作者简介:孙博文(1963-),男,哈尔滨理工大学计算中心,副教授,音乐可视化及分形理论,sunbowen@hrbust.edu.CDI张艳鹏(1987-),男,哈尔滨
理工大学计算机学院研究生,音乐可视化,yanpeng873@163.corn。
软件杂志欢迎推荐投稿:http://www.ccomsof1.corn/ ・64
软件 (您的文章得到院士的关注) 孙博文等:基于多音轨MIDI主旋律提取的音乐可视化表达
(4)再下一行为音乐具体特征:如第二个字符1.220为音符
开始时间,第三个字符E2代表音高,第四个字符V127代表音
符力度值,第五个字符代表音符持续时间,第六个字符代表音
色。
・4d 54 68 64:前四个是ASCII字符“MThd”是用来
鉴别是否MIDI文件。
・00 00 00 06:指明文件头描述部分的字节数,它一定是6。
・ff ff:文件的格式,有3种格式:0——单轨;1——多轨,
同步;2——多轨,异步。
・nn nn:MIDI文件中的轨道数。(注:MIDI的数据是由
若干个格式相同的子数据构成的,这些子数据在多音轨的格式
中记录了一个轨道的所有信息。多加一个音轨,就把数据追加
在前一音轨的后面就可以了,同时更改此数据)。
・dd dd:每个4分音符delta-time节奏数。
(2)轨道块(数据描述)
全局音轨:包括歌曲的附加信息(比如标题和版权)、歌曲
速度和系统码(Sysx)等内容。音符音轨:包含音符信息的音轨。
・4D 54 72 6B:不管是全局音轨还是含有音符的音轨,
它其实是ASCII字符“MTrk”。
・XX XX XX XX:其后跟着一个4个字节的整数,它标志
图3 MIDI音乐特征文本
了该轨道的字节数,这不包括前面的4个字节和本身的4个字节。
・数据:接着是记录数据的地方了,每一个数据有着相同
的结构:时间差+事件。
3多音轨MIDI的主旋律提取
采用MIDI音乐文件作为数据源,但MIDI文件几乎都是
多音轨的,而且主旋律通常就隐藏在其中的某些音轨或音轨片
段中 ,所以必须先对MIDI文件进行音轨分解,得出主旋律音
轨才能为其所用。
1.2文本文档创建
为了便于提取MIDI的音乐特征,需要根据MIDI基本格
式将二进制MIDI文件编译成为十进制文本文件(不破坏MIDI
结构)。其基本原理是:将每8位二进制位对应一个十进制数,
逐个翻译。图2为乐曲((Canon}}的十进制文本文件:
本文采用文献[6]提出的基于H—K算法的MIDI音乐主
旋律提取方法来提取MIDI主旋律。H—K算法针对两类或多
类分类问题,在特征空间中寻找一个最优的超平面作为两类的
分割平面川。此方法具有有效性及可行性,并且计算简单,易于
实现,对于主旋律分布于一个音轨上的MIDI音乐有很高的准
确性。具体做法如下:
(1)根据文献[6]提供的公式从MIDI文件中计算并提取
相应特征,包括:左右声道平衡度,音量,音长,力度,音高,音
程。
(2)H—K算法的主旋律提取:
①应用文献[8】中提到的一些基本的主旋律判别方法排除
一
下明显不是主旋律的音轨,这样做可以提高算法的准确性。
②由左右声道平衡度、音量、音长、力度、音高和音程构
成一个6维特征空间,音乐特征矢量x--(xl, 2, , 4, 5,x6)
2多音轨MIDI特征提取
基于上节所述MIDI音乐结构特征规则标记,从已经转译
的十进制文本文件中提取出各个音轨信息,包括:节拍,开始时
间,音高,力度,持续时间,音色。构建MIDI音乐特征文本。图
3为MIDI音乐特征文本。说明如下:
(1)第一行为这首音乐每节的单元数。
(2)第二行为第一音轨开始标记。
对应于特征空间中的一个点,运用已知的样本进行学习产生
一
个最优超平面d(x)--WoX+W -0,将特征空间划分成两个子
区域,使不同模式类分布在不同的子区域中并将特征量符号
规范化得到特征量增广矩阵X,引入N维余矢量b>O,于是
不等式方程组变为:w ≥b>O。使用平方误差标准函数:
.
2
J(w,b) Ilwo’ —bI ∑( 薯一 )==>minH—K算法将准则
l
函数 十)视作W和b的函数,在迭代过程中不断修正w并调整
6,最终求得准则函数J关于W和b的极小值点,作为判断主旋
律音轨的依据。
(3)第三行开始分节拍显示,M001代表第一节拍,后边的
1/2代表1/2拍。
软件杂志欢迎推荐投稿:http://www.ccomsoft.com/
版权声明:本文标题:基于多音轨MIDI主旋律提取的音乐可视化表达 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.elefans.com/dianzi/1719537477a783852.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论