为什么声学器件的小型化容易产生非线性的失真呢?这个需要从喇叭发声的基本原理说起,我们都知道声波的本质是一种物理振动,而喇叭发声的基本原理就是通过电流来驱动喇叭的振膜发生振动之后,这个振膜会带动周围的空气分子相应发生振动,这样就产生了声音。如果我们要发出一个大的声音的话,那么就需要在单位时间内用更多的电流去驱动更多的空气分子发生振动。假设有大小不同的两个喇叭,他们用同样的功率去驱动,对于大喇叭而言,由于它跟空气接触的面积要大一些,所以他在单位时间内能够带动更多的空气分子振动,所以它发出来的声音也会大一些。而小喇叭如果想发出跟大喇叭一样大的声音,就需要加大驱动功率,这样会带来一个问题:我们的功率放大器件会进入到一种饱和失真的状态,由此就会带来非线性的失真。这就是声学器件小型化容易产生非线性失真的一个主要的原因。这里廉价化比较好理解了,就不多说了。原因之二,就是声学结构设计的不合理。典型的一个实例就是声学系统的隔振设计不合理。喇叭发声单元跟麦克接收单元之间,通常是需要做隔振处理的,如果没有隔振处理的话,那么在喇叭发声的过程中,他所产生的振动会通过物理方式传递到麦克接收端。
介绍非线性声学回声消除的公开文献也少之又少。北京语音交互声学回声消除算法
运用声学处理来控制回声和混响,当有某个房间或建造一个录音棚时,如出现下述问题,就需要进行声学处理:(1)在墙边拍一下手,然后可听到颤动回声。这是由于声音在硬的平行墙面之间的来回撞击而产生的。(2)录音棚有非常活跃的环境,诸如像一个车库或是混凝土结构的地下室之类,可以听到很多的房间混响。(3)录音棚体积很小。(4)从录音作品中可以听到外界的噪声。(5)低音吉他放大器和音箱的声音有隆隆声。(6)缺乏在数英尺之外作不拾取噪声或不拾取过量房间混响的拾音的自由度。(7)在传声器信号中可听到大量的泄漏声。一些泄漏的例子,如吉他传声器拾取了鼓声,或是由于铙镲传声器拾取了电吉他的声音。如果有上述情况出现,则可按如下的建议来改善录音室的声学状况。混响和回声是由于房间表面的声音反射引起的,因此,强吸声的表面会有助于化解这些问题。高频吸收如要吸收高频,可使用诸如多孔的褶皱(凹凸不平的)的泡沫垫材料。这些材料是高可燃性的,所以,要作阻燃处理。把它们钉住或粘贴在墙面上,或者把它们固定在框架上。从效果上看,使用厚的泡沫材料要比薄的好。装在墙上的,这取决于声音撞击到泡沫材料上的角度。在泡沫材料嵌板之间要留有一些空隙。
河北通话声学回声消除算法如何处理非线性声学回声消除,效果又如何?
噪声抑制和声源分离同属于语音增强的范畴,如果把噪声理解为广义的噪声三者之间的关系,噪声抑制需要准确估计出噪声信号,其中平稳噪声可以通过语音检测判别有话端与无话端的状态来动态更新噪声信号,进而参与降噪,常用的手段是基于谱减法(即在原始信号的基础上减去估计出来的噪声所占的成分)的一系列改进方法,其效果依赖于对噪声信号估计的准确性。对于非平稳噪声,目前用的较多的就是基于递归神经网络的深度学习方法,很多Windows设备上都内置了基于多麦克风阵列的降噪的算法。效果上,为了保证音质,噪声抑制允许噪声残留,只要比原始信号信噪比高,噪且听觉上失真无感知即可。单声道的声源分离技术起源于传说中的鸡尾酒会效应,是指人的一种听力选择能力,在这种情况下,注意力集中在某一个人的谈话之中而忽略背景中其他的对话或噪音。该效应揭示了人类听觉系统中令人惊奇的能力,即我们可以在噪声中谈话。科学家们一直在致力于用技术手段从单声道录音中分离出各种成分,一直以来的难点,随着机器学习技术的应用,使得该技术慢慢变成了可能,但是较高的计算复杂度等原因,距离RTC这种低延时系统中的商用还是有一些距离。噪声抑制与声源分离都是单源输入。
3.双耦合滤波器设计当滤波器的结构确定下来之后,我们要去设计滤波器系数了。设计过程我把它总结成了三步,第一步就是构建优化准则,第二步是求解滤波器的权系数——Wl和Wn,一步就是构建耦合机制。第一步就是构建优化准则。我觉得构建优化准则,应该是整个滤波器设计里面重要的一步,因为它决定了滤波器性能的上限。什么样的优化准则是一个好的优化准则呢?我觉得好的优化准则需要跟问题的物理特性有效匹配起来,所以在构建优化准则之前,我们先对非线性声学回声的特性进行分析,希望通过这种分析去挖掘非线性声学回声的一些物理特性。我们的分析是基于上面的函数,我们称它为短时相关度,它所表示的是两个信号,在一个短时的观测时间窗“T”这样一个尺度范围内的波形的相似程度,需要注意的是这个函数它是统计意义上的,因为我们对它进行了数学期望运算。同时在分子的一项我们还加了一个相位校正因子,目的是为了将这两路信号的初始相位对齐。基于前面构建的短时相关度函数,我们对大量声学回声数据进行分析,并挑选了几组比较典型的数据:绿色的曲线对应的是一组线性度非常好的回声数据。我们从这个数据上可以看到,在整个时间T的变化范围内,它的短时相关度都非常高。
在构建滤波器模型的过程中结合了非线性声学回声的一些特性。
23.避免厅堂音质缺陷的方法主要是从厅堂的体形设计和吸声材料布置两方面入手,消除产生音质缺陷的条件。例如,为了消除回声,应在可能引起回声的部位布置强吸声材料,使反射声减弱经;另一种方法是调整反射面角度,将后墙与顶棚交接处作成比较大的倾角,将声音反射给后区观众,彻底消除回声,取得化害为利的效果。为了消除声聚集现象,应尽量控制厅堂界的曲面弧度,采用凸形结构,并在弧面上布置合适的吸音材料。为了消除音质缺陷,可根据厅堂内声源的位置。采用几何作图法,用声线的分布找出各种声缺陷的条件和部位,再采取必要的措施进行抑制。24.回声指强度和时间差大到足可以引起听觉将它与直达声区分开来的反射声。从单一声源产生的一连串可分辩的回声则叫多重回声,当室内两个界面之间距离大于一定数值,且吸声量不足时,在其中间声源发出的声音就可能产生多重回声。回声会影响听音注意力,影响声音的清晰度,破坏立体声聆听的声像定位效果。25.颤动回声当声源在平行界面或一平面与一凹面之间发生反射,界面距离大于一定数值时会出现颤动回声。发生颤动回声时,声音有连续的重叠声,并有颤抖的感觉。颤动回声会引起听力疲劳,使人感到厌烦。
对于耳机来讲,主要是声学回声,表现为收发环路的隔离度不好。北京语音交互声学回声消除算法
什么是非线性声学回声。北京语音交互声学回声消除算法
我们还希望它在一个短时的观测时间窗的尺度里面也是比较好的,即局部比较好,所以在数学期望内部,我们又对误差进行了短时积分。这个优化准则跟传统的线性自适应滤波器是有本质区别的,因为传统的线性自适应滤波器基于小均方误差准则,它只是在统计意义上比较好,没有局部比较好约束。首先来求解这里的Wl,就是线性滤波器。主要求解方法是,假设Wn就是非线性滤波器是比较好解,把这个比较好解代入到前面的优化方程里,就会得到上面简化之后的优化目标函数。在这个地方,我们又做了一些先验假设,假设非线性的滤波器的一阶统计量和二阶统计量都等于0,我们就可以把上面的优化问题进一步简化,就得到我们非常熟悉的方程,就是Wiener-Hopf方程。这个结果告诉我们,线性滤波器的比较好解跟传统的自适应滤波器的比较好解是一致的,都是Wiener-Hopf方程的理论比较好解。所以我们就可以采用一些现有的比较成熟的算法,比如NLMS算法、RLS算法,对它进行迭代求解。这就是Wl的设计。接下来再看看Wn的设计。Wn的设计跟Wl的设计是类似的,也是需要将优化之后的线性滤波器,代入到开始的优化问题里,可以把前面的优化问题简化成下面的方程。接下来进行一系列的变量替换之后。
北京语音交互声学回声消除算法