比较三麦克风和两麦克风助听器在嘈杂环境中对语音分辨率的影响

比较三麦克风和两麦克风助听器在嘈杂环境中对语音分辨率的影响

一、噪音环境下比较三麦克风与双麦克风助听器对言语分辨率的影响(论文文献综述)

梅淑琳[1](2021)在《基于人耳听觉的双通道DNN助听器语音增强研究》文中研究说明语言是人类沟通的桥梁,但对于患有听力损失的人来说,这一缺陷严重影响了他们的日常交流。据调查,全世界听力残疾的人已接近4亿。数字助听器是解决听力障碍这一问题的有效措施,并且近几年深度神经网络(Deep Neural Network,DNN)凭借其擅长表示语音间复杂非线性关系的优势已成功应用于助听器。故本文通过优化的DNN对数字助听器中的语音增强算法进行改进,来进一步提高重构语音质量。论文所做的工作如下:(1)对数字助听器的研究现状及研究意义进行了阐述,简单介绍了助听器的工作原理和其关键技术。并着重对其中的语音增强部分进行了研究,从基于DNN和波束形成两个方面的语音增强算法出发,对其现有的研究成果进行了详细说明。(2)针对神经网络语音增强算法因特征选取不能全面表示语音非线性结构导致语音质量较差的问题,提出一种新动态特征联合自适应比率掩模优化神经网络的语音增强算法。首先提出新动态特征,通过提取带噪语音的三种静态特征进行拼接,后求两阶差分导数,捕捉语音的瞬息信号,融合成动态特征,动静结合完成特征内部互补,减少语音失真。其次,提出一种新的自适应比率掩模,它既能自适应调整语音、噪声的能量比例,又能自适应调节传统掩模和平方根掩模的比例;并用Gammatone通道权重修改每个通道内的掩模值,模仿人类听觉系统,使增强语音的可懂度和清晰度同时达到最好。最后,对不同噪声背景下的多条语音进行实验仿真,结果表明:与已有的文献中不同算法相比,该算法的信噪比、语音质量、短时客观可懂度值都较高,验证了该算法的有效性。(3)为提高数字助听器语音增强模块重构语音的听觉感知度,本文结合单、多通道处理信号的优势,提出Bark域损失函数优化的双通道DNN时频掩蔽语音增强算法。首先,为改善传统的DNN损失函数时域优化不符合人耳听觉感知的问题,提出一种Bark域加权损失函数,通过心理声学域优化DNN,来提高增强语音的客观质量;其次,为提高算法抑制方向性噪声的能力,提出基于自适应掩模的方向矢量定位法,通过精确计算语音、噪声的空间协方差矩阵和方向矢量,使其在带噪和混响的环境下也能准确定位目标声源;最后实验结果表明:与其它单、多通道语音增强算法相比,重构语音具有更好的语音质量和可懂度。

陈又圣,陈伟芳,张璞,陈培培[2](2019)在《电子耳蜗前端麦克风阵列语音增强技术的研究与进展》文中研究表明麦克风阵列的方法在近年来被逐渐应用在电子耳蜗前端语音增强和提高言语识别率的研究里。该方法通过在空间不同的位置上放置若干麦克风,可以采集包含大量空间位置和方位信息的多通道信号,并形成增强目标信号和抑制干扰信号的特定波束指向模式。该方法更加适合用于电子耳蜗增强面对面交流的应用场景,其应用价值受到越来越多研究人员的关注。本文对麦克风阵列波束形成的原理进行阐述,并对目前文献中基于麦克风阵列的语音增强技术进行分析,归纳和总结了其中的技术难点和发展趋势。

李德民[3](2019)在《提高语言声厅堂主观评价结果准确性的技术控制方法研究 ——以教室为例》文中认为目前,语言声厅堂的评价方法有主、客观两种,其中主观评价是最终判定的依据,对语言声厅堂的设计和评价都起着重要的作用。影响语言声厅堂主观评价结果准确性的因素很多,在实际声场中,常将测试位置的房间脉冲响应或双耳脉冲响应提取出来,使用卷积、混缩等信号合成的方法制备信号,使主观评价消除了时间和地点的限制,但合成信号的响度和相对声压级会产生较大误差,使主观评价的结果不准确;主观评价的测试语音除了可以在实际声场中获取,还可以借助仿真声场,对未建成厅堂的听音效果进行评价,但由于现阶段技术的限制,仿真软件还不能完全模拟现实声场中声音的传播和衰减,在实际操作中,仿真模型的精度直接影响了主观评价结果的准确性。本文针对仿真和信号合成过程中,影响主观评价结果准确性的两个方面问题展开研究,旨在提出一系列的技术控制方法,减少主观评价结果的误差,提高有效性。论文的主要工作包括以下几个部分:(1)对四种具有代表性的语言声厅堂主观评价方法进行系统的梳理和研究。(2)对Odeon仿真软件的有效性进行研究,提出一系列的提高仿真声场主观评价结果准确性的技术控制方法。(3)研究了两类在国际上得到广泛认可的响度计算模型,对比了它们在计算汉语语音材料总响度方面的有效性和误差。(4)为了使四种主观评价指标在统一的框架下运行,本文搭建了一种主观评价系统,使用MATLAB程序语言编程实现,旨在提高语言声厅堂主观评价方法运用的现实意义,也能使本文的技术性研究成果得到很好的验证及运用。(5)应用本文搭建的主观评价系统对仿真和实际声场进行主观评价测试,并将主观评价指标与客观评价指标进行拟合。本文从减少主观评价误差的技术性研究入手,对主观评价方法进行了系统性的梳理和研究,针对仿真和实际声场中主观评价方法存在的系统误差提出一系列的量化控制方法,并在四种主观评价方法的基础上,构建一种全面的、可靠的语言声厅堂主观评价系统,对房间的语言声传输效果进行评价。本文开发的主观评价测试系统增加了语言声厅堂主观评价结果的可靠性,对主观评价指标的推广和运用增加了现实意义,在工程实践和科学研究领域都有较好的指导意义。

潘冬梅[4](2019)在《数字助听器中基于深度学习的方向性语音增强算法研究》文中研究指明为了改善数字助听器的性能,提高耳障患者佩戴助听器的舒适度和可懂度。本文提出了数字助听器中基于深度学习的方向性语音增强算法,该算法从双耳数字助听器中的声源定位、波束形成和语音增强等关键技术出发,首先利用头相关传递函数提取双耳空间特征信息,通过两级深度学习确定出声源的空间信息,接着利用波束形成的方法滤除与声源不同方向的噪声,最后在与声源同方向的含噪语音通过基于cosh测度改进的后置滤波方法对进行增强,达到语音增强的目的。本课题的研究工作由以下几个部分组成:(1)基于深度学习的双耳声源定位算法的研究:首先双耳语音信号通过Gammatone滤波器分解成若干通道,接着利用头相关传递函数提取各通道的双耳时间差、耳间相关性、双耳声压差和双耳相位差等四个表征声源空间信息的特征参数,并将前两个特征参数作为第一级深度学习模块的输入,得到声源所在的象限,缩小定位范围。然后将以上提取的四个特征作为第二级深度学习模块的输入,得到90度范围内的方位角。最后依据两级深度学习模块的输出确定声源的精确方位角,实现了在水平面上360度以5度为步长的72个方位角的声源定位。(2)基于cosh测度的滤波的语音增强算法的研究:传统的维纳滤波方法,在消除噪声的同时,对语音的能量会大大的削弱。为了改进维纳滤波对语音能量的削减,本文采用cosh测度方法进行改进,采用对数形式的测度进行语音增强。因为语音信号的频率和带宽呈现出类似于对数的非线性关系,对数的特性更适合描述语音信号。(3)数字助听器中的方向性语音增强算法的研究:该算法首先利用基于声源定位的语音增强算法得到声源方向的空间信息,然后利用波束形成法去除与目标语音不同方向的噪声,接着利用基于cosh测度改进的后置滤波去除与声源相同方向的噪声。实验结果表明,本文提出算法能够在特定方向的目标语音进行方向性语音增强,使得增强后的语音提高了言语可懂度和舒适度。首先本文提出的基于深度学习的双耳声源定位算法能够获得声源的方向信息,保证了波束形成法能够很好地去除与声源信号不同方向的语音。在声源方向上,利用基于cosh测度改进后置滤波的语音增强算法不仅对噪声具有更强的鲁棒性,而且进一步保留了语音能量。相较于对比算法,本文提出的数字助听器中的方向性语音增强算法有更好的去噪能力。

汪家冬[5](2018)在《面向智能机器人应用的声源定位系统研究》文中研究表明将人类听觉系统机理应用到机器人领域,不仅可与视觉互补,使得机器人能灵活地处理所处环境中视听信息,且对于智能机器人设计有重要参考价值。声源定位作为机器人听觉系统的主要功能之一,近些年得到学者的广泛关注与研究。它是实现其他听觉功能,如声源分离、语音识别的前提,同时声源定位在人机交互(HMI,Human-Machine Interaction)和人工智能领域也有着举足轻重的地位。本文在研究以往的声源定位系统成果的基础上,深入讨论了麦克风阵列技术;建立了一个以基于Linux系统的树莓派ReSpeaker 4-Mic扩展板为核心阵列的四元十字阵声源定位系统,通过仿真比较波束形成、超分辨率谱估计、到达时延差(TDOA,Time Delay of Arrival)三类算法的性能,采用当前主流的时延估计(TDE,Time Delay Estimation)声源定位算法,并分别在室内和室外不同环境下测试了系统性能和算法精度;最后搭建一个以DSP板ADI-21489和STC89C52联合控制的步进电机转动系统,将声源定位系统移植到机器人头上,实现了机器听觉系统中的声源定位以及机器人头部转动面向声源的功能,系统经过测试获得较好的效果。本文工作和内容如下:(1)介绍了麦克风阵列语音信号处理的关键技术,提出了基于麦克风阵列技术实现机器人听觉系统的方案。(2)设计了一个基于树莓派ReSpeaker 4-Mic扩展板的四元十字型麦克风阵,通过仿真比较波束形成、超分辨率谱估计、到达时延差三类声源算法的性能,综合考虑选择基于到达时延差为系统的最终算法,同时比较了GCC、LMS等时延差定位算法性能,提出了基于最小均方差的改进的时延估计算法,仿真实验表明该算法在室内混响场景下具有较高精度。(3)设计了机器人声源定位系统,将四元十字麦克风阵安装于机器人头部,并通过步进电机实现控制机器人头运动轨迹,实现了机器人声源定位和头部转动面向声源的功能,达到了机器人听觉系统“听声辨位”的指标。(4)总结本文主要研究内容,探讨本文中所实现机器人听觉系统的功能,提出了不足需改进之处。

张爽[6](2017)在《基于场景匹配的双耳助听器语音增强算法》文中研究表明目前双耳助听器语音增强模块中主要应用的是自适应波束形成算法进行去噪,该算法对于环境依赖度较高且对于非平稳噪声去除效果较差。因此,本文拟采用一种基于场景匹配的双耳助听器语音增强算法,该算法从双耳数字助听器中的语音增强、声源定位和场景匹配等关键技术的研究出发,通过声源定位算法提取空间信息确保空间信息的完整度同时通过空间滤波将与语音不同方向的噪声滤除,将接收到的多通道语音信号化简为单通道语音信号,然后利用场景匹配检测背景环境。针对现在的场景匹配算法复杂度较高且适应环境较少,本文采用一种基于多特征融合的数字助听器场景匹配算法,该算法对语音段和噪声段分别融合多个特征参数,采用改进的加权最小距离分类实现适用于数字助听器的场景匹配算法。然后根据匹配结果采用相对应的语音增强算法进行去噪处理,最后根据HRTF模型恢复空间信息,达到增强的目的。语音增强算法通常是在对语音和噪声的频谱特性做出了某些设想的前提下得到的,正因为此,语音增强算法会在具有不同频谱特征的噪声场景下性能表现出差异。本文算法将双耳助听器中常用的多通道增强转换为单声道增强,降低计算复杂度,同时保留多声道声音具有空间信息的特点,并可以针对不同背景噪声环境分别处理。本课题的研究对双耳智能数字助听器的改革和推广具有重要的现实意义。本课题的研究工作大体分为三部分:(1)声源定位算法研究:现有的双耳数字助听器声源定位算法,虽然有着不错的定位能力,但是都不能适用于多场景,精确度高并且算法复杂度低的双耳数字助听器中。在对前人的声源定位算法进行深入分析的基础上,提出了一种新的双耳声源定位算法,首先将双耳声源信号通过Gammatone滤波器分解成若干信道,通过加权系数提取高能量的信道,接着通过计算头相关函数相关参数并首次引入高斯混合模型进行声源定位,去除与声源不同方向的噪声,大大减少了之后语音增强模块的运算复杂度。(2)场景匹配算法研究:现有的听觉场景匹配算法,虽然匹配精度相对理想,但其适用噪声场景不多,难以满足在复杂环境下工作的数字助听器的性能要求。基于现有的听觉场景匹配算法进行深入研究,找到一种适用于智能数字助听器的听觉场景匹配算法。为了适用更多的场景,并提高匹配精度,本文使用基于分带谱熵和谱能量的端点检测算法将待测的带噪语音分为语音段和噪声段,针对语音段和噪声段分别确定需要提取的特征参数,噪声段提取分带谱熵、短时过零率和临界带能量比,语音段则只提取分带谱熵和临界带能量比,最后采用匹配精度较好,计算复杂度较低的符合数字助听器实际应用要求的加权最小距离分类算法对带噪语音进行语音噪声环境场景匹配。(3)最佳语音增强算法选择:不同的噪声具有不同的特性,针对它们各自的特性进行去噪处理可以提升语音增强模块的去噪性能。通过噪声库中的各种噪声进行大量去噪性能实验总结出对每种噪声去噪效果最佳的语音增强方法并有针对性的进行去噪处理。实验结果表明,本文所提出的基于Gammatone滤波器分解的头相关函数和高斯混合模型融合的双耳声源定位算法无论在鲁棒性、定位精度还是计算复杂度都优于参考算法。本文提出的基于多特征融合和加权最小距离分类的数字助听器场景匹配算法除了能适用于更多的噪声场景外,还提高了多场景匹配的精确度,并且计算复杂度远小于参考方法。使用针对性的语音增强方法进行去噪处理也使得各个噪声的去噪效果达到最佳。本文构建的基于场景匹配的双耳语音增强系统比参考算法拥有更佳的去噪性能。

王兆阳[7](2015)在《基于波束形成算法的麦克风阵列语音处理研究与实现》文中研究指明随着半导体技术的快速发展,处理器性能的不断提升,多通道麦克风阵列语音处理技术凭借优越的语音拾取性能逐渐取代了单通道的语音处理技术,麦克风阵列也广泛应用到市场上各种语音处理设备比如手机、对讲机、数字助听器等的语音拾取部分。今天的高端数字助听器有着强大的数字信号处理能力,特别是近十几年来步入数字化时代后,数字助听器的优势更加明显,其低噪声、节能、小型化和自适应调节等特点都是模拟助听器所欠缺的,成为听力患者的希望。麦克风阵列在数字助听器中的广泛使用尤为突出,多麦克风盒式助听器将成为今后助听器发展的主流。论文主要的研究内容是应用于数字助听器的麦克风阵列语音处理算法,该算法基于波束形成技术。论文研究了常规波束形成算法、线性约束最小方差(LCMV)波束形成算法,并基于广义旁瓣消除(GSC)设计了一种基于最小均方误差(LMS)的自适应波束形成算法,完成了算法各部分处理模块,实现了语音增强功能。论文对三种语音增强算法进行了仿真验证,分析了每种算法的优缺点。其中常规波束形成算法有一定语音增强效果,但是处理后语音质量偏低,去噪效果有限,LCMV波束形成算法去噪性能高,但是计算量偏大,不适合数字助听器使用。本文所设计的LMS-GSC麦克风阵列语音增强算法输出信噪比明显高于常规波束形成算法,并且在保证语音质量的同时计算量较少,适用于数字助听器。论文中设计了一种计算量小、估计准确的语音活动检测算法。只有语音检测算法高速有效,才能提高整个语音增强算法的效果。为了提高语音信号延时补偿的准确性,论文在互相关极值法的基础上引入最短路径算法,目的是屏蔽方向性噪声,提高目标语音的获取能力。本文设计了数据流程和软件实现,分析了内部的基本运算,讨论了算法中的问题并对程序加以优化。改进后的语音增强算法成功在ARM Cortex-A8嵌入式开发板上实现。仿真结果证明,算法处理的效果良好。

陈瑶[8](2015)在《面向智能助听系统的语音处理研究》文中提出据世界卫生组织报告称,目前全世界共拥有3.6亿听力受损者,由于用耳不规范现象的普遍存在,这个听力受损者人数仍在增长,在10年内会突破9亿。然而由于传统助听设备价格昂贵并且不能满足所有用户需求于一体,因此,利用价格适宜的嵌入式平台开发一种集成多种声音处理功能并且有良好用户体验的智能助听系统具有非常重要的现实意义。同时,我们从改变人类听力方式的角度出发,结合语音建模、识别和分离等技术,设计一种同时适用于正常人的智能听力系统,将听觉从被动转为主动,实现让任何人在任何地方听到自己想听的声音,屏蔽一切自己不想听的声音,这一思想将对未来智能体系提供一个新思路。本论文以智能助听系统为研究背景,以现有的语识别、声源定位以及混合声音分离等语音处理技术为基础,针对复杂语音环境下智能获取目标语音信息问题,在现有的处理技术分析基础上,主要开展研究工作如下:(1)针对复杂语音环境下智能获取目标语音信息问题,为了实现复杂语音环境下根据用户需求智能分离获取用户指定的目标语音信息的目标,设计了由语音建模模块、混合语音环境下多语音源定位模块、混合语音分离与识别提取模块组合成的目标系统框架。(2)针对目标系统框架中的语音建模问题,重点开展了具有鲁棒性的说话人建模方法的研究,通过在语音预处理部分采用了改进的语音端点检测,进而改进了在低信噪比语音环境下说话人模型的可靠性。(3)针对复杂环境下目标语音源的提取问题,以盲信号分离理论和语音识别理论为基础,开展了将复杂环境下混合语音源分离后根据识别结果提取目标声源的研究。通过研究基于声音强度矢量分布对声音信号进行分离,然后将分离后的信号与目标声音的高斯混合模型进行识别,最终提取匹配的目标声音。(4)针对复杂环境下多语音源的确定问题,以基于矩阵特征空间分解的MUSIC(Multiple Signal Classification,多信号分类)算法为基础,开展了多运动语音源的定位与预测的研究,提出了基于卡尔曼滤波和粒子滤波的声源方向实时预测跟踪,实验验证了这两种方法的合理性和准确性,同时还对比分析了这两种声源方向预测的结果,分析了两种方法的优缺点。(5)针对系统硬件平台实现问题,本文选取在TMS320DM642硬件平台上实现整个智能听力系统,完成了以上算法从PC平台向嵌入式DSP平台的移植,进一步验证智能听力系统的可行性,也为未来系统的产品化奠定基础。本论文的工作,为发展可穿戴设备提供了新的思路,从改变听觉模式的角度出发,为改变人们的听觉方式以及进一步的生活习惯提供的新的视角和理论技术基础,也为发展语音处理技术提供的新的知识基础。

黄剑文[9](2014)在《多通道语音增强算法及应用研究》文中提出语音增强是语音信号处理的一个重要内容,在语音压缩编码和语音识别等领域,有广泛的应用。它是一种噪声抑制技术,对解决语音噪声污染、改进语音通信质量、提高语音可懂度及语音识别率等方面具有重要的意义。随着语音增强技术的发展,传统的单通道语音增强方法,如谱减法、卡尔曼滤波法和子空间法等相继被提出。近年来,由于多麦克风的开发和应用,多通道语音增强方法已倍受关注,已经成为语音增强技术的研究热点。它能在消除噪声、提高语音质量方面优于单通道语音增强方法。同时多通道语音增强技术比单通道较为复杂,这是因为麦克风阵列融合了语音信号的空时信息。多通道语音增强方法研究已得到发展,但一些关键技术有待进一步研究和改进。本文的主要研究工作如下:1.研究现有多通道语音增强技术:如多通道维纳滤波语音增强技术,多通道子空间语音增强技术及基于时空渐进预测的语音增强技术(STP)。通过模拟实现这些多通道语音增强方法,比较在不同种类噪声下的去噪效果,进而分析它们优缺点。2.通过利用多通道子空间语音增强技术在去除噪声上的优势与维纳滤波语音增强技术的平稳特性,本文提出一种基于信号噪声能量比估计的自适应组合维纳滤波器与子空间滤波器的多通道语音增强方法。大量实验表明,在不同的白色噪声及有色噪声下,与传统多通道子空间语音增强技术,如多通道维纳滤波语音增强,基于时空渐进预测的语音增强技术(STP)及信号子空间语音增强技术进行比较,本文提出的自适应联合滤波器的多通道语音增强技术具有较好的语音恢复效果。3.研究了多通道语音增强算法在助听器的应用。本文进一步将提出的多通道语音增强新方法应用于双麦克风助听器系统中,并说明该算法的有效性。

王鹏[10](2013)在《数字助听器响度补偿算法研究及其系统实现》文中研究表明老年感音神经性耳聋已成为一个世界性的问题,为这些耳聋患者配带一付合适的数字助听器是目前最佳的解决办法。随着耳聋等听力健康问题越来越受到社会的普遍关注,各种功能先进的数字助听器获得了广阔的应用前景。它以改善患耳听觉舒适性、提升语音辨识率为根本目标,其采用的各种有针对性的语音处理算法,将帮助佩戴者显着地提高听力水平,为耳聋患者恢复正常语言交流带来了福音。然而,数字助听器依赖的语音处理算法是否参数优化、性能稳定,将直接影响其性能的进一步提升,因此研究数字助听器中的关键助听器算法及其系统实现,更加具有重要的社会意义和应用价值。本文重点研究了数字助听器的响度补偿算法及其系统实现,以人耳听觉生理特性为出发点,开发准确契合患耳听力损失曲线的响度补偿智能算法,并且设计用于算法实现的DSP软、硬件系统方案。论文的主要工作包括:1.阐述人耳听觉系统的生理功能,分析听力损失的表现形式;进而引出,助听器的技术进步给听障患者的听力恢复提供了越来越方便的科学方法;更进一步对数字助听器应用的各项语音处理算法原理展开详细的分析总结;2.深入理解语音信号的基本特性,详细分析老年感音神经性听障患者在频域内的听力缺失特点,阐述出语音输入声强在所处频率的不同取值,是影响增益补偿因子计算正确性的关键因素。根据纯音听力测试数据在频域内的分布,总结宽动态压缩响度补偿算法原理及实现方法,提出一种基于共振峰估计的算法改进途径,避免了因频谱增益时对语音共振峰的忽视而导致的语音非线性失真,改善响度补偿算法应用的听觉舒适性;3.利用Matlab强大的算法仿真验证能力,对响度补偿算法的输入、输出语音数据进行了详细的分步仿真验证,并仔细分析对比两种算法在实现语音响度补偿过程中的同期数据。仿真结果表明:基于共振峰估计的改进算法,在实时地补偿患者频域内听觉响度损失的基础上,有效降低了语音共振峰的非线性失真;4.从系统硬件和软件两个层面,分别详细论述数字助听器的系统实现方法,并对系统设计过程中的关键环节以及对具体细节的处理展开详细地阐述。

二、噪音环境下比较三麦克风与双麦克风助听器对言语分辨率的影响(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、噪音环境下比较三麦克风与双麦克风助听器对言语分辨率的影响(论文提纲范文)

(1)基于人耳听觉的双通道DNN助听器语音增强研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景及意义
    1.2 数字助听器
        1.2.1 数字助听器的研究现状
        1.2.2 数字助听器的工作原理
        1.2.3 数字助听器中的核心算法
    1.3 数字助听器中语音增强算法的国内外研究现状
        1.3.1 单麦克风语音增强算法
        1.3.2 麦克风阵列语音增强算法
    1.4 语音增强算法性能的评价指标
        1.4.1 语音质量的主观评价方法
        1.4.2 语音质量的客观衡量标准
    1.5 本文研究结构
第2章 基于DNN及波束形成的语音增强概述
    2.1 语音信号的产生和人耳听觉
        2.1.1 语音信号的生成机理及特征
        2.1.2 人耳听觉机理及特性
    2.2 符合人耳听觉感知的心理声学域
    2.3 基于DNN的语音增强算法
        2.3.1 常见的语音特征和时频掩蔽值
        2.3.2 常见的神经网络损失函数
        2.3.3 DNN的结构及训练过程
        2.3.4 基于DNN的语音增强系统
    2.4 基于波束形成的语音增强算法
        2.4.1 麦克风阵列的声源定位算法
        2.4.2 波束形成
    2.5 本章小结
第3章 新动态特征联合自适应比率掩模优化神经网络语音增强
    3.1 引言
    3.2 语音信号的模型
    3.3 动静态联合特征提取
        3.3.1 静态特征提取过程
        3.3.2 动态特征提取过程
        3.3.3 动静态联合特征提取过程
    3.4 自适应比率掩模估计
    3.5 神经网络模型
    3.6 动静态联合特征和自适应比率掩模优化的DNN语音增强系统
    3.7 实验结果与分析
        3.7.1 实验数据的选取
        3.7.2 非线性幂函数取值对MRACC特征的影响及其优势
        3.7.3 使用不同特征、学习目标增强语音的对比实验
    3.8 本章小结
第4章 基于心理声学(Bark)域损失函数优化的双通道神经网络时频掩蔽语音增强
    4.1 引言
    4.2 双通道语音增强系统信号模型
    4.3 基于心理声学域构建符合听觉感知的Bark域加权损失函数
    4.4 基于自适应掩模方向矢量定位的WPD卷积波束形成器
        4.4.1 依据信噪比优化的自适应掩模估计
        4.4.2 加权功率最小无失真响应卷积波束形成器
        4.4.3 基于AM方向矢量定位的WPD卷积波束形成器
    4.5 基于Bark域加权损失函数优化的双通道神经网络时频掩蔽的语音增强系统
    4.6 实验结果与分析
        4.6.1 实验数据选取
        4.6.2 Bark域加权损失函数中加权因子β的选取对实验结果的影响
        4.6.3 不同损失函数对语音整体性能的影响
        4.6.4 验证双通道时频掩蔽语音增强系统的性能
    4.7 本章小结
第5章 总结与展望
    5.1 工作总结
    5.2 工作展望
参考文献
攻读学位期间取得的科研成果
致谢

(3)提高语言声厅堂主观评价结果准确性的技术控制方法研究 ——以教室为例(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景
    1.2 研究目的和意义
    1.3 相关研究进展
    1.4 研究内容
    1.5 研究方案和技术路线
2 语音传输质量主观评价方法
    2.1 言语可懂度测试SI
        2.1.1 改进的押韵测试法MRT
        2.1.2 测试材料
    2.2 听音难度测试LD
    2.3 言语识别阈SRT
    2.4 听音效率LE
        2.4.1 测试材料
        2.4.2 测试方法
3 Odeon仿真声场的精度控制
    3.1 Odeon虚拟声源设置
        3.1.1 虚拟声源的指向性
        3.1.2 虚拟声源的频响
    3.2 Odeon遗传算法GA
        3.2.1 主观阀值JND
        3.2.2 遗传算法原理
        3.2.3 Odeon吸声系数的搜索范围
        3.2.4 遗传算法的迭代方法
        3.2.5 案例运用
    3.3 头相关传递函数的差异在主观听觉上的比较
        3.3.1 头相关传递函数HRTF
        3.3.2 BRIRs的获取
        3.3.3 主观差异实验
        3.3.4 实验结果分析
    3.4 小结
4 等响度与相对声压级控制
    4.1 时变响度模型
        4.1.1 Zwicker模型及其计算步骤
        4.1.2 Moore模型及其计算步骤
        4.1.3 总响度表示方法
    4.2 ITU BS.1770-4 响度算法原理
        4.2.1 计算步骤
        4.2.2 与A计权等滤波曲线的比较
        4.2.3 多段语音信号的等响度方法修正
    4.3 基于耳机回放的响度实验
        4.3.1 耳机回放实验的有效性
        4.3.2 使用的声音信号
        4.3.3 受试者和实验设备
    4.4 成对比较实验1
        4.4.1 实验方法及其步骤
        4.4.2 实验结果及分析
    4.5 响度匹配实验2
        4.5.1 实验方法及其步骤
        4.5.2 等响度算法误差估计
        4.5.3 实验结果及分析
    4.6 小结
5 主观测试平台SINT
    5.1 软件的开发
        5.1.1 功能
        5.1.2 优点
        5.1.3 技术特点
        5.1.4 软件的运行环境
    5.2 测试方法
        5.2.1 测试界面1(测试参数SI、LD、LE、RT)
        5.2.2 测试界面2(测试参数SRT)
    5.3 SINT的测评-以教室为例
        5.3.1 实际声场测量
        5.3.2 建立教室Odeon仿真模型
        5.3.3 实验设置
        5.3.4 测试结果分析
        5.3.5 主客观关系的拟合
        5.3.6 改善语言声厅堂语音传输质量的策略
    5.4 小结
6 结论与展望
    6.1 研究结论
    6.2 展望
参考文献
图片目录
表格目录
附录 A 等响度修正方法Leq(K)的MATLAB源程序代码
附录 B 双通道卷积和固定声压级双通道混缩MATLAB源程序代码
附录 C MRT主观评价测试所使用的测试字表
附录 D 阶梯教室实测和仿真的声学参数
附录 E STI间接法MATLAB源程序代码
攻读硕士学位期间发表学术论文情况
致谢

(4)数字助听器中基于深度学习的方向性语音增强算法研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 课题背景
    1.2 国内外研究现状
        1.2.1 传统语音增强算法的研究现状
        1.2.2 常用的双通道语音增强算法的研究现状
        1.2.3 基于深度学习的语音增强算法研究现状
    1.3 研究内容
    1.4 论文结构
第2章 基于深度学习的双耳声源定位算法
    2.1 基于麦克风阵列的声源定位算法原理
        2.1.1 基于最大输出功率的可控波束形成技术
        2.1.2 基于到达时间差的定位技术
        2.1.3 基于高分辨率谱估计的定位技术
    2.2 声源定位算法的原理与实现
        2.2.1 基于Gammatone滤波器组分解的数据缩减
        2.2.2 基于头相关函数的双耳线索的特征提取
        2.2.3 基于深度置信网络的声源方向的象限划分
        2.2.4 基于深度神经网络的声源定位
    2.3 实验结果与分析
        2.3.1 运算复杂度测试
        2.3.2 不同噪声在各信噪比下的声源定位性能研究
        2.3.3 两级深度神经网络和只用一级深度神经网络的定位精度的结果
        2.3.4 不同混响环境下声源定位性能研究
    2.4 本章小结
第3章 基于波束形成的空间滤波
    3.1 空间滤波的基本方法
        3.1.1 固定波束形成算法
        3.1.2 自适应波束形成算法
    3.2 最小方差无失真响应波束形成原理
        3.2.1 MVDR波束形成算法实验
    3.3 线性约束最小方差波束形成原理
        3.3.1 LCMV波束形成算法实验
    3.4 MVDR和 LCMV波束形成器算法实验
    3.5 本章小结
第4章 基于cosh测度滤波的语音增强
    4.1 后置滤波法算法算理
    4.2 维纳滤波算法原理
    4.3 基于cosh测度改进的维纳滤波
    4.4 实验结果
    4.5 本章小结
第5章 数字助听器中的方向性语音增强
    5.1 本文算法的原理及实现
    5.2 实验结果及分析
        5.2.1 客观性能测试评价
        5.2.2 主观性能测试评价
    5.3 本章小结
结论
参考文献
攻读硕士学位期间所发表的学术论文
攻读硕士学位期间参加的科研项目
致谢

(5)面向智能机器人应用的声源定位系统研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 引言
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 声源定位算法
    1.4 本文的内容安排
第二章 麦克风阵列技术的发展与应用
    2.1 麦克风阵列原理
        2.1.1 近场模型和远场模型
        2.1.2 麦克风阵列拓扑结构
    2.2 麦克风阵列信号处理技术
        2.2.1 波束形成技术
        2.2.2 声源定位技术
    2.3 麦克风阵列技术的技术难点
    2.4 本章小结
第三章 机器人听觉系统机理
    3.1 人类听觉系统机理
        3.1.1 人类外围听觉系统的组成
        3.1.2 人耳声源定位的原理
    3.2 机器人听觉系统原理
        3.2.1 计算听觉场景分析
        3.2.2 20世纪的机器人听觉系统
        3.2.3 机器听觉系统涉及的功能
    3.3 机器人听觉系统设计遇到的难题
        3.3.1 麦克风
        3.3.2 混响
        3.3.3 环境噪声
        3.3.4 实时性
    3.4 本章小结
第四章 四元十字阵定位系统
    4.1 四元十字阵定位算法原理
        4.1.1 距离r的计算
        4.1.2 方位角φ的计算
        4.1.3 俯仰角θ的计算
    4.2 时延差估计算法
        4.2.1 互相关法
        4.2.2 自适应滤波法
        4.2.3 特征分解法
    4.3 MUSIC算法
        4.3.1 算法模型
        4.3.2 算法原理
    4.4 MVDR算法
        4.4.1 算法模型
        4.4.2 算法原理
    4.5 声源定位算法仿真
        4.5.1 实验设置
        4.5.2 声源定位算法仿真
        4.5.3 定位算法总结
    4.6 声源定位硬件系统设计
        4.6.1 产品简介
        4.6.2 硬件概述
    4.7 数据采集与处理
        4.7.1 室、内外场景布置
        4.7.2 数据预处理
        4.7.3 计算时间延迟点数
        4.7.4 定位结果
    4.8 本章小结
第五章 机器人声源定位系统的实现
    5.1 系统实现流程
    5.2 系统主要硬件组成及其介绍
        5.2.1 ADI-21489和STC89C52
        5.2.2 110B步进电机驱动器2M2260
    5.3 硬件系统的搭建与测试
    5.4 声源定位算法验证
        5.4.1 GCC算法
        5.4.2 NLMS算法
        5.4.3 VLMS算法
    5.5 本章小结
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
攻读硕士学位期间发表的论文
致谢

(6)基于场景匹配的双耳助听器语音增强算法(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 课题背景
    1.2 国内外研究现状
    1.3 常用双耳助听器语音增强算法
        1.3.1 固定波束形成算法
        1.3.2 自适应波束形成算法
    1.4 研究内容
    1.5 论文结构
第2章 基于 Gammatone 滤波器分解的HRTF和GMM 融合的低复杂度双耳声源定位算法
    2.1 基于麦克风阵列的声源定位算法原理
        2.1.1 基于最大输出功率的可控波束形成技术
        2.1.2 基于到达时间差的定位技术
        2.1.3 基于高分辨率谱估计的定位技术
    2.2 声源定位算法的原理与实现
        2.2.1 基于Gammatone滤波器组分解的数据缩减
        2.2.2 基于头相关函数的声源定位特征提取
        2.2.3 基于高斯混合模型(GMM)的声源定位
    2.3 实验结果与分析
        2.3.1 运算复杂度测试
        2.3.2 不同信噪比下的声源定位性能研究
        2.3.3 不同噪声环境下声源定位性能研究
    2.4 本章小结
第3章 基于特征融合和加权最小距离分类的数字助听器听觉场景匹配算法
    3.1 本章所提算法原理和实现
    3.2 端点检测算法
    3.3 特征提取
        3.3.1 分带谱熵
        3.3.2 临界带能量比
        3.3.3 自适应过零率
    3.4 加权最小距离分类器
    3.5 实验结果与分析
        3.5.1 计算复杂度比较
        3.5.2 分类仿真
        3.5.3 分类匹配精度
    3.6 本章小结
第4章 不同噪声环境下最佳语音增强算法的选择
    4.1 常用单声道语音增强算法
        4.1.1 谱减法
        4.1.2 子空间方法
        4.1.3 维纳滤波法
        4.1.4 加权欧式距离失真测度法
        4.1.5 二值掩蔽法
    4.2 最佳语音增强算法的选取
    4.3 本章小结
第5章 基于场景匹配的双耳助听器语音增强系统
    5.1 本文算法的原理及实现
    5.2 实验结果及分析
        5.2.1 客观性能评价
        5.2.2 主观性能评价
        5.2.3 算法复杂度分析
    5.3 本章小结
结论
参考文献
攻读硕士学位期间所发表的学术论文
攻读硕士学位期间参加的科研项目
致谢

(7)基于波束形成算法的麦克风阵列语音处理研究与实现(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 课题研究背景
    1.2 麦克风阵列的应用和研究现状
    1.3 课题研究目的及意义
    1.4 论文主要研究内容
第2章 语音处理基础知识
    2.1 语音信号模型
    2.2 噪声和干扰
    2.3 信噪比和干噪比
    2.4 性能度量
    2.5 本章小结
第3章 麦克风阵列语音定位算法
    3.1 麦克风这阵列语音定位概述
    3.2 语音帧活动检测
    3.3 时延估计算法
    3.4 方向角计算方法
        3.4.1 二维空间方向角计算
        3.4.2 三维空间方向角计算
    3.5 最短路径演算法
    3.6 软件实现及实验结果
    3.7 本章小结
第4章 麦克风阵列语音增强算法
    4.1 多通道语音增强介绍
    4.2 波束形成算法基础
    4.3 常规波束形成算法
        4.3.1 基本原理和算法
        4.3.2 理论性能分析
    4.4 自适应波束形成算法
        4.4.1 GSC波束形成器原理
        4.4.2 LCMV波束形成器原理
        4.4.3 LCMV-GSC波束形成器
    4.5 基于RLS和LMS的迭代线性自适应波束形成
        4.5.1 基于RLS的迭代线性自适应波束形成算法
        4.5.2 基于LMS确定性梯度波束形成算法
        4.5.3 基于LMS随机梯度波束形成算法
    4.6 仿真结果与算法比较
    4.7 本章小结
第5章 系统设计与实现方案
    5.1 系统设计方案概述
        5.1.1 硬件设计方案
        5.1.2 软件设计方案
    5.2 语音算法设计方案及参数分析
        5.2.1 语音增强算法的总体方案
        5.2.2 语音增强算法中参数分析
    5.3 算法开发流程和优化
    5.4 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢

(8)面向智能助听系统的语音处理研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景
        1.1.1 传统助听器概述
        1.1.2 助听器的发展
    1.2 国内外智能助听器研究现状
        1.2.1 国外智能助听器的研究现状
        1.2.2 国内智能助听器的研究现状
    1.3 研究意义
    1.4 组织结构
第2章 智能助听系统框架
    2.1 语音建模部分
        2.1.1 说话人识别简介
        2.1.2 说话人识别分类
        2.1.3 说话人识别的主要方法
    2.2 复杂环境下混合语音分离及目标人语音的提取部分
        2.2.1 混合信号盲分离的提出与发展
        2.2.2 混合信号多通道盲分离的模型与定义
        2.2.3 混合信号多通道盲分离的方法
        2.2.4 指定目标人语音信息提取
    2.3 本章小结
第3章 基于GMM的说话人语音模型
    3.1 语音信号产生机理
    3.2 语音信号的预处理
        3.2.1 预加重
        3.2.2 分帧和加窗
        3.2.3 双门限端点检测
    3.3 高信噪比下基于双门限端点检测的高斯混合模型
        3.3.1 MFCC特征提取
        3.3.2 高斯混合模型
        3.3.3 模型评价
        3.3.4 实验结果及分析
    3.4 低信噪比下基于改进端点检测的高斯混合模型
        3.4.1 多窗谱估计谱减法和能熵比法的端点检测
        3.4.2 实验结果及分析
    3.5 本章小结
第4章 复杂环境下混合语音分离与目标语音提取
    4.1 MUSIC算法确定多目标语音个数和方向
        4.1.1 概述
        4.1.2 算法原理
        4.1.3 仿真实验
    4.2 基于声音强度矢量方向的多声音分离
        4.2.1 声波、声强和声压的物理基本概念
        4.2.2 算法原理
        4.2.3 声音分离质量评价
        4.2.4 仿真结果
    4.3 基于声音强度矢量方向的多声源完全盲分离算法
        4.3.1 算法原理
        4.3.2 仿真结果
    4.4 基于声源方向跟踪的多声源完全盲分离算法
        4.4.1 卡尔曼滤波的声源跟踪算法原理
        4.4.2 仿真实验
        4.4.3 基于粒子滤波的声源跟踪算法原理
        4.4.4 仿真结果
    4.5 目标语音提取
    4.6 本章小结
第5章 智能助听系统的硬件平台实现
    5.1 系统的硬件平台搭建
        5.1.1 系统总体方案设计
        5.1.2 语音采集与输出模块
        5.1.3 DSP数据处理模块
        5.1.4 DSP数据处理模块
        5.1.5 时序逻辑控制模块
        5.1.6 JTAG接口模块
    5.2 硬件平台上的软件实现
        5.2.1 系统的初始化
        5.2.2 数据的存储
        5.2.3 数据的处理
    5.3 系统性能与结果分析
    5.4 本章小结
第6章 总结与展望
    6.1 本文的主要贡献与结论
    6.2 未来工作
参考文献
致谢
攻读硕士学位期间的论文专利情况

(9)多通道语音增强算法及应用研究(论文提纲范文)

中文摘要
Abstract
第一章 绪论
    1.1 课题背景及意义
    1.2 发展现状
    1.3 本文主要工作及创新点
    1.4 本文的组织结构
第二章 多通道语音模型及经典的增强算法
    2.1 多通道语音增强模型
    2.2 三个经典的语音算法
        2.2.1 维纳滤波技术
        2.2.2 多通道信号子空间语音增强算法
        2.2.3 基于时空渐进预测的语音增强算法
        2.2.4 语音评价方法
        2.2.5 三个算法的结果比较
    2.3 本章小结
第三章 改进的多通道语音增强算法
    3.3 算法描述
    3.4 算法比较
    3.5 实验结果与比较分析
        3.5.1 仿真环境
        3.5.2 实验一
        3.5.3 实验二
        3.5.4 实验三
    3.6 本章小结
第四章 多通道语音增强技术的应用研究
    4.1 多通道语音增强技术的应用
    4.2 多通道语音增强技术在助听器中的应用研究
        4.2.1 助听器主要工作原理
        4.2.2 基于SVD的最优滤波技术在助听器中的应用
        4.2.3 基于所提出的语音增强算法在助听器中的应用
        4.2.4 实验结果与分析
    4.3 本章小结
第五章 总结与展望
    5.1 本文研究工作总结
    5.2 研究展望
参考文献
致谢
个人简历

(10)数字助听器响度补偿算法研究及其系统实现(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究的背景
        1.1.1 人耳听觉系统
        1.1.2 听力损伤和助听器
        1.1.3 助听器技术发展
    1.2 研究的意义
        1.2.1 模拟助听器介绍
        1.2.2 数字助听器介绍
    1.3 国内外研究现状综述
        1.3.1 国外助听器技术现状
        1.3.2 国内助听器技术现状
    1.4 本文的主要研究工作和内容
        1.4.1 本文的主要研究工作
        1.4.2 本文的主要内容
2 语音信号分析与用于数字助听器的语音处理算法
    2.1 语音信号分析
        2.1.1 语音信号的基本特征
        2.1.2 语音信号的听觉感知特性
        2.1.3 语音信号的听觉度量—响度
        2.1.4 语音信号的时域分帧
    2.2 用于数字助听器的语音处理算法
        2.2.1 响度补偿
        2.2.2 自适应回声反馈抑制
        2.2.3 自适应语音增强
        2.2.4 声束定向
        2.2.5 移频压缩
    2.3 本章小结
3 数字助听器响度补偿算法研究
    3.1 听力响度补偿曲线的确定
        3.1.1 响度补偿原理
        3.1.2 声强~增益曲线
        3.1.3 频率~增益曲线
    3.2 传统的多通道响度补偿算法
    3.3 宽动态压缩算法
        3.3.1 宽动态压缩算法原理
        3.3.2 宽动态压缩算法流程
    3.4 基于共振峰估计的宽动态压缩算法
        3.4.1 共振峰
        3.4.2 共振峰的提取
        3.4.3 改进的宽动态压缩算法
        3.4.4 算法的步骤
    3.5 本章小结
4 响度补偿算法的验证
    4.1 宽动态压缩响度补偿算法的仿真验证与结果分析
    4.2 基于共振峰估计改进算法的仿真验证与结果分析
    4.3 本章小结
5 数字助听器的系统实现
    5.1 数字信号处理的有限字长效应分析
        5.1.1 二进制尾数的表示引起的有限字长效应
        5.1.2 模拟信号采样过程中的有限字长效应
        5.1.3 快速傅里叶变换(FFT)的有限字长效应
    5.2 数字助听器硬件实现方案
        5.2.1 声学输入
        5.2.2 声学输出
        5.2.3 音频 COEDC 部分
        5.2.4 系统中央处理器部分
        5.2.5 电源部分
        5.2.6 硬件通讯部分
    5.3 数字助听器软件实现方案
        5.3.1 DSP 初始化
        5.3.2 TLV320AIC23B 配置
        5.3.3 听力响度补偿模组
        5.3.4 系统软件设计结果演示
    5.4 本章小结
6 总结与展望
    6.1 全文总结
    6.2 展望
参考文献
攻读硕士期间发表的论文及所取得的研究成果
致谢

四、噪音环境下比较三麦克风与双麦克风助听器对言语分辨率的影响(论文参考文献)

  • [1]基于人耳听觉的双通道DNN助听器语音增强研究[D]. 梅淑琳. 太原理工大学, 2021(01)
  • [2]电子耳蜗前端麦克风阵列语音增强技术的研究与进展[J]. 陈又圣,陈伟芳,张璞,陈培培. 生物医学工程学杂志, 2019(04)
  • [3]提高语言声厅堂主观评价结果准确性的技术控制方法研究 ——以教室为例[D]. 李德民. 大连理工大学, 2019(03)
  • [4]数字助听器中基于深度学习的方向性语音增强算法研究[D]. 潘冬梅. 北京工业大学, 2019(03)
  • [5]面向智能机器人应用的声源定位系统研究[D]. 汪家冬. 广州大学, 2018(01)
  • [6]基于场景匹配的双耳助听器语音增强算法[D]. 张爽. 北京工业大学, 2017(07)
  • [7]基于波束形成算法的麦克风阵列语音处理研究与实现[D]. 王兆阳. 哈尔滨工业大学, 2015(03)
  • [8]面向智能助听系统的语音处理研究[D]. 陈瑶. 东北大学, 2015(01)
  • [9]多通道语音增强算法及应用研究[D]. 黄剑文. 福州大学, 2014(09)
  • [10]数字助听器响度补偿算法研究及其系统实现[D]. 王鹏. 中北大学, 2013(08)

标签:;  ;  ;  ;  ;  

比较三麦克风和两麦克风助听器在嘈杂环境中对语音分辨率的影响
下载Doc文档

猜你喜欢