ionicons-v5-f

听音识曲系统设计与实现

课程名称:数字信号处理

实验题目:听音识曲系统设计与实现

课程简要信息

《数字信号处理》课程的理论学时为48学时,实验学时为16学时,适用于通信工程、自动化、电子科学技术等相关电类专业的大二学生。

实验内容与任务(限500字)

设计并实现一个听音识曲系统,该系统接收播放的歌曲信号,通过相关算法与数据库中的歌曲进行比较,识别出所播放歌曲的名称。系统界面示例及相关说明如图1。

图1 听音识曲系统界面与功能说明

1. 基本部分(60分)

所实现的听音识曲系统应满足:数据库中的歌曲不少于10首;接收播放歌曲的时间不超过8秒;在室内等较安静场所,歌曲的识别正确率在60%以上。

2. 提高部分(40分)

(1) 提高识别正确率:数据库中的歌曲不少于20首,在室内等较安静的场所,识别正确率在80%以上;(20分)

(2) 提高鲁棒性:在室外等存在背景噪声的场所,识别正确率在60%以上;(10分)

(3) 提高识别速度:歌曲识别的时间小于5s。(10分)

3. 扩展部分(额外加分,在基本部分和提高部分达到80分的基础上)

基于数字信号处理课程的内容,设计两种不同的听音识曲方案,如基于傅里叶变换和基于小波变换,实现并比较两种方案的性能。

2 实验过程及要求(限300字) {#实验过程及要求限300字}

本实验包括方案设计、编程实现、撰写报告、答辩四个环节构成,要求学生以小组为单位完成。

方案设计包括分析问题、文献查阅、解决问题,方案设计中需要解决以下问题:录制音乐信号中噪声的去除、采用何种特征表示音乐信号,如何对比待识别音乐信号和数据库中的音乐信号。

设计好方案后,采用编程语言实现,并最终以应用程序的形式进行展示,编程语言和使用软件不限。

实验报告不是程序代码的堆砌,需要对整个系统的实现进行提炼和分析,按照科技论文的形式撰写实验报告。

答辩要求学生以ppt形式讲解实验原理,展示系统实际效果。教师对小组的每个学生提出问题并予以评价。

相关知识及背景(限150字)

在商场超市等陌生场所听到一首很喜欢的歌曲,你无从打听这是什么歌曲,但是又很想知道,怎么办?目前智能手机上的相关软件可以解决这一问题,只要打开软件,录制一段时间的歌曲,几秒之内就可以查出歌曲的名称,这就是听音识曲。本实验基于离散傅里叶变换的应用、窗函数的应用、数字滤波器的设计等实现听音识曲系统的设计。

教学目标与目的(限100字)

实验题目面向工程实际问题,使学生将理论与实践紧密结合,加深对相关理论的理解,掌握利用现代技术手段实现信号处理的基本方法,培养学生的工程实践能力和创新意识,同时培养学生撰写科技论文的能力。

教学设计与引导

在课堂授课过程中,教师讲解听音识曲系统的基本原理和设计方案,包括实际工程背景、问题的分析、问题的解决思路、听音识曲方案设计、不同设计方案的比较、信息收集与文献资料查阅、实验报告的撰写规范等内容。在课堂上布置本次实验要求学生完成的具体任务,明确课程考核要求。在学生实验过程中,教师安排固定时间采用面对面和网络课程平台等多种方式对学生进行答疑指导。

在实验教学中,应在以下几个方面加强对学生的引导:

(1) 课程中讲解了多种数字滤波器设计方法,实际中应如何选取?

(2) 课程中讲解了多种窗函数实现信号加窗,结合不同窗函数的理论分析,选取合适的窗函数。

(3) 为提高歌曲识别的速度,可以对音乐信号进行降采样处理,如何选取合适的降采样速率?

(4) 对于实际工程问题,一般可采用多种方案解决,本实验中基于离散傅里叶变换和小波变换均可以实现歌曲的特征提取, 引导学生对工程问题解决过程的理解。

(5) 体会理论分析与工程实际的区别和联系。

实验原理及方案

听音识曲的主要方法是基于内容的音乐检索,即利用音乐的音符、旋律、节奏、歌曲风格等语义级的特征或者声学层特征从数据库中检索乐曲。下面给出使用信号频谱分析方法实现音乐检索的原理和方案,该方案包含两部分,第一部分为模板库的构建,第二部分为音乐信号的识别,如图2所示。

图2 听音识曲系统

模板库的构建:首先在网上下载多首音乐,然后对每首音乐提取特征,多首音乐的特征即构成模板库。音乐信号并不是一个平稳随机过程,所以不能直接对整个信号进行频谱分析,需要对其进行加窗分帧操作。将音乐信号分为毫秒级的多个音乐片段,每个音乐片段可以看做是平稳随机过程,然后对音乐片段进行频谱分析。为了保证两个音乐片段之间的平滑过渡,需要设置一个偏移量,也就是前后两帧的数据需要共同拥有同一节数据,偏移量一般设置为帧长的二分之一。加窗分帧操作可以通过窗函数实现,每移动一次窗函数,便得到一帧的音乐片段。常见的窗函数有以下几种,矩形窗、汉明窗、汉宁窗,它们各自的表达式如下所示:

矩形窗:

(1)

汉宁窗(Hanning):

(2)

海明窗(Hamming):

(3)

不同窗函数的特点不相同,在使用窗函数分帧时,应根据具体的情况来选择恰当的窗函数。矩形窗具有很好的平滑过渡性,但容易丢失语音信号的高频部分,频谱泄露现象较严重。海明窗可以改善频谱泄露问题,但其主瓣的有效宽度是相同窗长矩形窗的两倍。

特征提取方法可采用离散傅里叶变换DFT实现。对加窗分帧处理后的音乐片段进行DFT将其时域变换到频域,采用的方法是快速傅里叶变换FFT。此时整个音乐信号可以用一个三维图来表示,X轴表示时间,Y轴表示频率,Z轴表示能量,如图3所示。由于能量极大值点(图4的星型)抗噪能力较强,因而可采用频谱图中的能量极大值点构建表示音乐信号的特征。

图3 音乐信号频谱三维图

图4 音乐信号频谱的能量极大值点

音乐信号的识别:打开麦克风对音乐进行录制其实就是将模拟信号转换为数字信号的过程,即信号的时域抽样。在数字信号的采集过程中,会受到混叠干扰、电源工频干扰等,在对采集到的信号进行识别之前需要进行滤波。为降低频率为50Hz的电源工频的干扰,需要设计一带通数字滤波器。带通数字滤波器可以设计IIR滤波器实现,也可设计FIR滤波器实现。按照模板库构建过程,对滤波后信号进行加窗分帧和特征提取,最后将待识别信号的特征与模板库进行匹配,得到该首音乐的歌曲名称。

为提高歌曲识别的速度,可以对音乐信号进行降采样处理,需要结合信号抽样和多速率信号处理理论,对音乐信号的频谱进行分析,得到合适的降采样率,以达到在不造成频谱混叠的情况下降低处理的数据量。

教学实施进程

(1) 课堂讲授:教师讲解听音识曲系统的背景和基本原理,引导学生对该系统主要问题的思考。

(2) 学生查阅资料,小组内探究解决问题的方案,分工协作完成系统的设计与实现。

(3) 教师答疑:采用实验室集中答疑以及网络答疑两种方式。

(4) 结果验收:学生现场演示听音识曲效果,教师针对设计任务书中要求的功能和性能指标测试验收,给予评价。

(5) 答辩:学生以ppt的形式介绍系统的原理和方案,教师针对设计中涉及到的原理、实验结果分析等方面向小组中的每个学生提出问题。

(6) 报告批改:学生在答辩后可结合教师的提问和意见对报告进行修改,教师从规范性、逻辑性、完整性等方面对报告进行评价。

实验报告要求

实验报告以科技论文的格式撰写,包含以下内容:

(1) 背景介绍:包括研究背景和研究现状。

(2) 方案设计:包括系统的整体方案(如流程图)以及方案中主要算法的原理介绍。

(3) 实验结果与分析:包括涉及参数如何选取、系统性能分析以及系统的优缺点。

(4) 主要参考文献

考核要求与方法(限300字)

本实验成绩由系统设计、 实验报告、 答辩三个环节构成。

系统设计环节要求学生以小组为单位完成设计任务,通过原理分析、查阅资料、算法设计、软件编程、小组讨论等环节,共同完成听音识曲系统的设计与实现。针对设计任务书中要求的功能和性能指标测试验收,给予评价。此部分培养学生解决工程问题的能力,占总成绩的50%。

教师从规范性、逻辑性、完整性等方面对实验报告进行评价。此部分培养学生撰写科技论文的能力,占总成绩的 25%。

答辩包括学生讲解与教师提问两个部分,学生以ppt的形式介绍系统的原理和方案,教师针对设计中涉及到的原理、实验结果分析等方面向小组中的每个学生提出问题,并给予评价。此部分培养学生的表达能力,占总成绩的 25%。

项目特色或创新(限150字)

(1) 综合性:实验内容涵盖信号频谱分析、窗函数使用、数字滤波器设计、多速率信号处理等内容;

(2) 多样性:学生可以采用不同的方案实现听音识曲系统的设计;

(3) 拓展性:学生在掌握课程相关知识的基础上,需要查阅资料完成系统的设计与实现;

(4) 趣味性:演示效果好,与日常生活相关,激发学生的学习热情。

参赛选手信息表

案例提供单位 北京交通大学 相关专业 通信、自动化、电子科学与技术
设计者姓名 李艳凤 电子邮箱 yf.li@bjtu.edu.cn
移动电话 13811030537

通讯地址

(含邮编)

北京市海淀区北京交通大学电子信息工程学院,100044
设计者姓名 黄琳琳 电子邮箱 huangll@bjtu.edu.cn
移动电话 13522886312

通讯地址

(含邮编)

北京市海淀区北京交通大学电子信息工程学院,100044
设计者姓名 胡健 电子邮箱 jhu@ bjtu.edu.cn
移动电话 13501286418

通讯地址

(含邮编)

北京市海淀区北京交通大学电子信息工程学院,100044
相关x课程名称 数字信号处理 学生年级 大二 学时(课内+课外) 16

支撑

条件

仪器设备 计算机
软件工具 Matlab、Visual Studio
主要器件

获奖信息

获奖等级 一等奖
年份 2018

作品信息

作者信息

作者
李艳凤,黄琳琳,胡健
学校
北京交通大学

电工电子实验教学资源平台 苏ICP备09069895号-19