[发明专利]应用于基础音乐视唱教育的视唱音频唱名识别建模方法有效

专利信息
申请号: 201811580476.1 申请日: 2018-12-24
公开(公告)号: CN109584904B 公开(公告)日: 2022-10-28
发明(设计)人: 吴清强;杨小娟;刘昆宏;陈滨;徐民洪;李昌春 申请(专利权)人: 厦门大学
主分类号: G10L25/51 分类号: G10L25/51;G10L25/48;G10L25/30;G10L25/24;G10L21/0208;H04L67/06;H04L67/02
代理公司: 厦门南强之路专利事务所(普通合伙) 35200 代理人: 马应森
地址: 361005 *** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 应用于基础音乐视唱教育的视唱音频唱名识别建模方法,涉及视唱音频唱名识别。提供可帮助用户提升自己音乐视唱方面能力的一种应用于基础音乐视唱教育的视唱音频唱名识别建模方法。唱名识别效果可以达到专业的识别的水平,识别精准率较高;唱名识别运算效率较高,可以在3~5s之内完成唱名识别过程,达到工业应用要求;唱名识别抗噪能力较强,在有一定背景噪声的情况下也能较好的识别。
搜索关键词: 应用于 基础 音乐 视唱 教育 音频 唱名 识别 建模 方法
【主权项】:
1.应用于基础音乐视唱教育的视唱音频唱名识别建模方法,其特征在于包括以下步骤:1)通过Web端录音软件,在界面上选择多音录制或者单音录制,其中单音录制的唱名为do,re,mi,fa,so,la,xi七个音符中的一个,选中之后通过按下录音键实现本地录音,按下上传键实现上传,上传之后自动记录在服务器上,并以唱名和序号进行文件命名,以此收集多人视唱练习的音频;2)将步骤1)的音频数据进行去噪进行去噪,剪裁无音频的空白片段,进行人声增强的数据预处理;3)将步骤2)处理过的音频数据根据多音视唱曲目中音频的变化特征、音频频率高低的变化和时域高低变化上的差异进行剪辑,分别生成独立的音频数据;将每个独立音频数据存储在硬盘上,作为测试初始数据,单音视唱数据作为训练初始数据和测试初始数据;4)将步骤3)中的单音视唱音频数据按2︰1划分,其中2份为训练数据,1份为测试数据,经分割的多音视唱音频变成单音音频后作测试数据;5)读取步骤4)中音频文件,将音频数据预处理后,使用梅尔频率倒谱系数方法分别提取多音与单音音频特征;将训练用的音频特征数据进行抽取与处理,使得特征长度一致;6)将步骤5)处理过的训练音频数据输入循环神经网络中,用RNN的反向传播算法进行模型的训练;7)经分割的多音视唱音频变成单音音频后作识别模型的测试数据,调整优化模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811580476.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top