男人说话的声频为~150Hz,女人说话声频为~230Hz,发动机声频为~250Hz,绝大部分机器的噪音也是以低频为主的中低频噪音),9.声音频率(声频)声波在单位时间内的振动次数称为频率(frequency),单位赫(Hz)。人耳能够听到的声音的整个范围是20~20000Hz,一般把声音频率分为低频(500Hz以下)、中频(500-1000Hz)和高频(1000Hz以上)三个频带。听觉好的成年人能听到的声音频率常在30~16000Hz之间,老年人则常在50~10000Hz之间。10.混响声源停止发音后,产生的声音延续现象。11.混响时间当声场达到稳定的状态后,突然关掉声源使其停止发声,声能逐渐减小到原来声能(稳定时具有的声能)的百万分之一所经历的时间,通常用声压级60dB所需要的时间,一般用T60表示(有时也用T),单位为秒(S);(简而言之:声能密度衰减60dB所需要的时间)。12.混响时间计算公式塞宾公式T60=αS。其中A为总吸声量,α为吸声系数,S为样件面积,V为混响室体积。13.比较好混响时间对大量音质效果评价认为较好的各种用途的厅堂实测的500HZ和1000HZ满场(指实际使用状态)的混响时间进行统计分析,从而得到的混响时间称为比较好混响时间。14.直达声与混响声声源发出的直接到达的声音是直达声。
便于大家对双耦合声学回声消除算法有一个定性的认识。福建电脑声学回声
非线性声学回声消除技术,非线性的声学回声消除问题,在实际声学系统里面非常普遍也非常棘手,到目前为止还没有特别有效的办法来解决。目前介绍非线性声学回声消除的公开文献也少之又少。如何处理非线性声学回声消除的,效果又如何?将从非线性声学回声消除产生的原因、研究现状、技术难点出发,详细介绍双耦合的声学回声消除算法以及实验检验结果。我要讲的内容是《非线性声学回声消除技术》,之所以选择这样的方向,主要是基于两个方面的原因:非线性的声学回声消除问题是一个困扰了行业很多年的技术难题,这个问题在实际的声学系统里非常普遍,同时又很棘手,到目前为止,还没有特别有效的办法。我猜测大家应该会对这个课题感兴趣。还有另外一个原因,我之前做过一些技术的调研,在现有公开的文献资料里,介绍非线性声学回声消除方面的资料非常少,我想借这样一个机会,介绍一些我们团队在这个领域的进展,希望能够对大家后续的研究有一些帮助,同时也想跟各位**做一下技术交流。我介绍的内容包括四个部分,个部分什么是非线性声学回声,它产生的原理、研究现状以及技术难点等问题;第二个部分重点介绍双耦合声学回声消除算法。
福建电脑声学回声回声来自于非预期的泄露,一般分为电学回声和声学回声。
达到,接近于1。黄色曲线,对应的数据具有比较弱的非线性失真,所以在时间T变大了之后,短期相关度逐渐降低,趋于一个相对平稳的值。而红色曲线是我们选的一条具有强非线性失真的数据,为了对这三组数据进行有效对比,我们还给出了一条蓝色曲线,这条曲线是信号与噪声的短时相关度,它在整个时间T范围内都很小。通过这样一组曲线的对比,会得到两个结论,个结论就是我们构建的短时相关度函数,能够相对客观反映这个声学系统的线性度特征,线性度越好,这个值会越大。第二个结论:对于非线性失真很强的系统,其在短时观测窗内(如T<100ms)依然具有较强的相关度,这从红色的曲线可以看出来。也正是基于这样的特征,我们接下来就构建了一种新的误差函数,称之为“短时累积误差函数”。大家可以注意到我们在一个观测时间窗T内,对残差进行了累积。基于这样的误差函数,我们进一步构建了一种新的优化准则,称为“小平均短时累计误差准则”。我们希望通过优化准则的约束,得到的滤波器权系数能够满足两个特性,个特性是滤波器在统计意义上能够达到比较好,即全局比较好,因此我们在目标函数里加入了数学期望运算。同时。
这将不止产生一次的回声,而是多次规律的回声现象。AEC即AcousticEchoCancellation(声学回声消除)技术简称,该技术的出现旨在消除这种因远程网络会议所带来的回授现象,以遏制次回声产生所需的必要条件来遏制多次回声的出现。为什么要费那么大周折去抑制回声?这个话题应该不言而喻了。会议、语音扩声讲究的即是STI语音清晰度(可懂度),而回声是语言清晰度的比较大。设想踩脚跟式的语音信号传达到耳朵,听者难受,讲者费劲,对于这样的语音会议来说,那必将是一场灾难。我们把声学回声消除这个技术变成一张实体的插件(设备插卡),在系统中,为实现次回声过滤(过滤回声源则过滤多次回声)。这个技术应该插入在系统的哪个环节呢?我们不妨来找找系统中具备近乎相同/相似信号的一级进出环节。们并不难发现一组具备相似信号的输入输出环节。而AEC技术认为,在这里对回声下手是治根的办法!市面上有多种类的回声消除器,也有部分抑制器,其算法和解决办法各有不同,本文就不详细阐释了。须知,通过对具有相似性极高的输入、输出信号的比对,约掉这一具备相似信号的输出。搜索“声学回声消除”的相关文献,一共找到了3402篇。
3.双耦合滤波器设计当滤波器的结构确定下来之后,我们要去设计滤波器系数了。设计过程我把它总结成了三步,第一步就是构建优化准则,第二步是求解滤波器的权系数——Wl和Wn,一步就是构建耦合机制。第一步就是构建优化准则。我觉得构建优化准则,应该是整个滤波器设计里面重要的一步,因为它决定了滤波器性能的上限。什么样的优化准则是一个好的优化准则呢?我觉得好的优化准则需要跟问题的物理特性有效匹配起来,所以在构建优化准则之前,我们先对非线性声学回声的特性进行分析,希望通过这种分析去挖掘非线性声学回声的一些物理特性。我们的分析是基于上面的函数,我们称它为短时相关度,它所表示的是两个信号,在一个短时的观测时间窗“T”这样一个尺度范围内的波形的相似程度,需要注意的是这个函数它是统计意义上的,因为我们对它进行了数学期望运算。同时在分子的一项我们还加了一个相位校正因子,目的是为了将这两路信号的初始相位对齐。基于前面构建的短时相关度函数,我们对大量声学回声数据进行分析,并挑选了几组比较典型的数据:绿色的曲线对应的是一组线性度非常好的回声数据。我们从这个数据上可以看到,在整个时间T的变化范围内,它的短时相关度都非常高。
非线性声学回声消除技术。福建电脑声学回声
AEC声学回声,电话的扬声器的声音(包括反射声),被麦克风拾取传送给远端,使远端说话人又听到自己的声音。福建电脑声学回声
喇叭发声单元跟麦克接收单元之间,通常是需要做隔振处理的,如果没有隔振处理的话,那么在喇叭发声的过程中,他所产生的振动会通过物理方式传递到麦克接收端。对麦克接收到的声学信号进行调制,而这种振动本质上是一种随机的、非线性的振动,所以它必然会带来非线性失真。手机声学特性调研我们之前针对市面上主要的手机机型做过一次调研,主要调查声学特性。结果我们很惊讶地发现,市面上超过半数的手机机型,声学特性不够理想,对应这里面的“较差”和“极差”这两档。我们平时用手机开外音玩游戏,或者语音通话时,经常会出现漏回声问题和双讲剪切问题,就与手机声学特性不佳有直接联系。当然这组数据只是针对手机这种电子产品,市面上类似于手机这样的电子产品还有很多,它们应该也有类似的问题。这组数据告诉我们,非线性失真问题在我们生活中的电子产品里是一个普遍存在的问题,我相信对这个问题的研究将会是一个很有价值也很有意义的方向。 福建电脑声学回声
深圳鱼亮科技有限公司在智能家居,语音识别算法,机器人交互系统,降噪一直在同行业中处于较强地位,无论是产品还是服务,其高水平的能力始终贯穿于其中。深圳鱼亮科技是我国通信产品技术的研究和标准制定的重要参与者和贡献者。公司主要提供语音识别,音效算法,降噪算法,机器人,智能玩具,软件服务,教育培训,芯片开发,电脑,笔记本,手机,耳机,智能穿戴,进出口服务,云计算,计算机服务,软件开发,底层技术开发,软件服务进出口,品牌代理服务。等领域内的业务,产品满意,服务可高,能够满足多方位人群或公司的需要。产品已销往多个国家和地区,被国内外众多企业和客户所认可。