这涉及了语音交互用户场景的变化,当用户从手机切换到类似Echo智能音箱或者机器人的时候,实际上麦克风面临的环境就完全变了,这就如同两个人窃窃私语和大声嘶喊的区别。前几年,语音交互应用为普遍的就是以Siri为的智能手机,这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是,若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,这会严重影响语音识别率。而且,单麦克风接收的信号,是由多个声源和环境噪声叠加的,很难实现各个声源的分离。这样就无法实现声源定位和分离,这很重要,因为还有一类声音的叠加并非噪声,但是在语音识别中也要抑制,就是人声的干扰,语音识别显然不能同时识别两个以上的声音。显然,当语音交互的场景过渡到以Echo、机器人或者汽车为主要场景的时候,单麦克风的局限就凸显出来。为了解决单麦克风的这些局限性,利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构(常用线形、环形)摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理。至于麦克风阵列的阵元数量,也就是麦克风数量,可以从2个到上千个不等。广州数字麦克风阵列设计
翻译后的文字数据、声音数据通过文字或者音频的方式传递给用户;其特征在于:所述声音采集模块包括麦克风阵列、信号放大电路、带通滤波器、电源管理电路;所述麦克风阵列包括两个麦克风,两个麦克风之间的间隔设置为15mm;所述信号放大电路包括两级放大电路,其中一级放大电路设置在所述麦克风阵列与所述带通滤波器之间,二级放大电路设置在所述带通滤波器之后;所述带通滤波器包括由二阶低通电路、二阶高通电路组成,所述一级放大电路传入的声信号,经过所述带通滤波器滤波后,声信号通过所述二级放大电路进行放大,使滤波后的信号达到预设的电压范围;由所述麦克风阵列采集的声信号通过所述一级放大电路、所述带通滤波器、所述二级放大电路进行放大、工频滤波处理、放大升压处理后送入所述音频转换模块中进行数模转换;所述电压管理电路同时为所述声音采集模块、所述音频转换模块、所述语音增强模块供电;所述语音增强模块中通过预先植入的语音增强算法对所述音频转换模块传入的声信号进行增强处理;所述语音增强算法包括以下步骤:s1:定义所述麦克风阵列中与目标声源s1接近的麦克风为前向麦克风mic1,其采集到的声信号为m1(n),另一个麦克风mic2采集到的声信号为m2(n)。广州数字麦克风阵列设计麦克风阵列一般用于:声源定位,包括角度和距离的测量抑制背景噪声、干扰、混响、回声信号提取。
说明是本实用新型实施方式的装置立体分解;本实用新型实施方式的印刷电路板的背面图;本实用新型实施方式的电连接关系;本实用新型实施方式的整体示意;1、包体;2、印刷电路板;3、音频采集装置;4、视频采集装置;5、wifi模块;6、电池;7、便携式平板电脑;8、图像出孔;9、透光挡片;10、夹层布料;11、图像采集装置安装孔;12、声音出孔;13、排线穿孔;14、吸音材料。具体实施方式下面结合和具体实施例对本实用新型的技术方案进行详细说明。以下所述为本实用新型的较佳实施例,并不用以限制本实用新型,凡在本实用新型的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本实用新型的保护范围之内。所举实例只用于解释本实用新型,并非用于限定本实用新型的范围。一种便携式可视化麦克风阵列装置,包括包体,设置在包体内的印刷电路板、音频采集装置、视频采集装置、无线模块和供电装置,以及便携式操作终端;包体的正面设有一图像出孔,视频采集装置安装在印刷电路板上,且其镜头与图像出孔重合,音频采集装置阵列式排布在印刷电路板上,无线模块分别与视频采集装置和音频采集装置电连接。
n)、s2(n)、s3(n)、snum(n)分别为通过麦克风mic1采集到的所述目标声源、所述干扰噪声源1、所述干扰噪声源2、所述干扰噪声源num-1发出的声音信号;因为所述前向麦克风mic1更接近所述目标声源s1,所以麦克风mic2采集到的信号相对于所述前向麦克风mic1采集到的信号会有一定的延迟,则根据关系,可得麦克风mic2采集到的混合信号m2(n):其中,d为所述前向麦克风mic1和麦克风mic2质检的距离,c为声速,fs为采样频率;b2:在混合信号的一个时频单元内,所述目标声源的信号占主导时,有如下关系:其中,δ1为所述目标声源的理想延迟时间,l和k分别是频率点和时间窗的序号;设,当所述目标声源占主导时,有如下关系:其中,l和k分别是频率点和时间窗的序号,pi为圆周率π;令:约等式右边的代数式为t(l,k),则,根据两个麦克风mic1、mic2采集到的数据可计算得到每个频域点的t(l,k);所述目标声源的理想延迟时间δ1的表达式为:步骤s4中的所述掩蔽权重b(l,k)的表达式为:其中,式中a1、a2、a3的取值范围是0~1之间的实数。本发明提供的一种基于麦克风阵列的智能语音转文字及同声翻译系统。根据麦克风阵列的拓扑结构,则可分为线性阵列、平面阵列、体阵列等。
9)在中找到一个子集,使得中的任意值要大于的平均值;10)类似于步骤3)和步骤4),在当前的搜索空间中随机选取个点,计算它们所对应的的值;11)将中的点放入子集中,并选取中值大的个点放入子集中,保存,放入下一次迭代时使用;12)令,进行下一次迭代,返回步骤5)。我们可以得到根据不同的定位精度需要、不同的麦克风个数需求与阵列大小,自行选择适用于自身实际场景的麦克风阵列。当说话人的语音经过室内环境所产生的声学信道传播,通过麦克风阵列的前置放大器进行接收,将接收到的各个麦克风信号进行基于多通道低通滤波与多通道自适应滤波的融合滤波,先由低通滤波器滤除掉说话人声信号以外的噪声,再由自适应滤波器校准接收信号的幅频特性,校准前后幅频特性,从而使定位效果更准确。而且音频采集装置为4×12的麦克风阵列,单个麦克风为底部出孔的mems麦克风。深圳无限麦克风阵列特征
音频采集装置为4×12的麦克风阵列,单个麦克风为底部出孔的mems麦克风。广州数字麦克风阵列设计
语音转写产品虽然能很好的识别单目标声源的人声并进行转写,但是一旦出现竞争性声源,则无法辨别目标声源,竞争声源的存在导致对目标声源的识别便产生紊乱,无法进行语音到文字的转写和翻译。技术实现要素:为了解决现有同声翻译设备中存在的竞争性声源中辨别目标声源困难、设备体积过大不易携带的问题,本发明提供一种基于麦克风阵列的智能语音转文字及同声翻译系统,其可以智能识别目标声源,去除或降低竞争性噪声,对目标声源进行语音增强后进行语音到文字的转写和翻译,且设备体积较小容易携带。本发明的技术方案是这样的:一种基于麦克风阵列的智能语音转文字及同声翻译系统,其包括:声音采集模块、音频转换模块、语音增强模块、翻译模块;所述声音采集模块智能地选取目标声源,将数据送入所述音频转换模块,进行模拟语音数据和数字语音数据之间的转换;所述语音增强模块通过数字信号处理器向所述音频转换模块中的音频编解码芯片发送控制信号,将所述音频转换模块传输过来的语音信号进行处理及其控制语音信号的传输;处理过的数字语音信号送入所述翻译模块,按照用户选择的目标语言进行实时翻译。广州数字麦克风阵列设计
深圳鱼亮科技有限公司致力于通信产品,是一家服务型的公司。公司自成立以来,以质量为发展,让匠心弥散在每个细节,公司旗下智能家居,语音识别算法,机器人交互系统,降噪深受客户的喜爱。公司将不断增强企业重点竞争力,努力学习行业知识,遵守行业规范,植根于通信产品行业的发展。深圳鱼亮科技凭借创新的产品、专业的服务、众多的成功案例积累起来的声誉和口碑,让企业发展再上新高。