[发明专利]应用于基础音乐视唱教育的视唱音频唱名识别建模方法有效
申请号: | 201811580476.1 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109584904B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 吴清强;杨小娟;刘昆宏;陈滨;徐民洪;李昌春 | 申请(专利权)人: | 厦门大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/48;G10L25/30;G10L25/24;G10L21/0208;H04L67/06;H04L67/02 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 应用于基础音乐视唱教育的视唱音频唱名识别建模方法,涉及视唱音频唱名识别。提供可帮助用户提升自己音乐视唱方面能力的一种应用于基础音乐视唱教育的视唱音频唱名识别建模方法。唱名识别效果可以达到专业的识别的水平,识别精准率较高;唱名识别运算效率较高,可以在3~5s之内完成唱名识别过程,达到工业应用要求;唱名识别抗噪能力较强,在有一定背景噪声的情况下也能较好的识别。 | ||
搜索关键词: | 应用于 基础 音乐 视唱 教育 音频 唱名 识别 建模 方法 | ||
【主权项】:
1.应用于基础音乐视唱教育的视唱音频唱名识别建模方法,其特征在于包括以下步骤:1)通过Web端录音软件,在界面上选择多音录制或者单音录制,其中单音录制的唱名为do,re,mi,fa,so,la,xi七个音符中的一个,选中之后通过按下录音键实现本地录音,按下上传键实现上传,上传之后自动记录在服务器上,并以唱名和序号进行文件命名,以此收集多人视唱练习的音频;2)将步骤1)的音频数据进行去噪进行去噪,剪裁无音频的空白片段,进行人声增强的数据预处理;3)将步骤2)处理过的音频数据根据多音视唱曲目中音频的变化特征、音频频率高低的变化和时域高低变化上的差异进行剪辑,分别生成独立的音频数据;将每个独立音频数据存储在硬盘上,作为测试初始数据,单音视唱数据作为训练初始数据和测试初始数据;4)将步骤3)中的单音视唱音频数据按2︰1划分,其中2份为训练数据,1份为测试数据,经分割的多音视唱音频变成单音音频后作测试数据;5)读取步骤4)中音频文件,将音频数据预处理后,使用梅尔频率倒谱系数方法分别提取多音与单音音频特征;将训练用的音频特征数据进行抽取与处理,使得特征长度一致;6)将步骤5)处理过的训练音频数据输入循环神经网络中,用RNN的反向传播算法进行模型的训练;7)经分割的多音视唱音频变成单音音频后作识别模型的测试数据,调整优化模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811580476.1/,转载请声明来源钻瓜专利网。