音频转换模块包括音频解码器和,语音增强模块基于数字信号处理器dsp实现;语音增强模块通过数字信号处理器芯片的i2c接口向音频解码器发送控制信号,通过数字信号处理器芯片的mcasp接口连接音频解码器,交换数字音频信号的数据。语音增强模块中通过预先植入的语音增强算法对音频转换模块传入的声信号进行增强处理;语音增强算法包括以下步骤:s1:定义麦克风阵列中与目标声源s1接近的麦克风为前向麦克风mic1,其采集到的声信号为m1(n),另一个麦克风mic2采集到的声信号为m2(n);对声信号m1(n)、m2(n)进行分帧与加窗之后,再进行时频变换即得到频域信号m1(l,k)和m2(l,k),其中:l和k分别是频率点和时间窗的序号;s2:因为同一个声源的声信号到达两个麦克风mic1、mic2的时间存在延迟,计算延迟系数t(l,k);s3:将延迟系数与目标声源的理想延迟时间δ1进行比较,确定目标声源的能量所占成分;延迟系数t(l,k)的计算方法包括如下步骤:设目标声源存在竞争性语音噪声:干扰噪声源1、干扰噪声源2...干扰噪声源num-1,其中,num取值为自然数;目标声源偏离正向的角度为θ1,θ1的值为0°或非常接近0°。麦克风阵列发展趋势多传感器的融合。广州量子麦克风阵列介绍
)可以认为是麦克风阵列上所有麦克风对的信号两两做基于相位变换的广义互相关并求和:()=其中k、l第k、l个麦克风,表示相位变换的权重,τ()表示从声音从位置x到达第k个麦克风的时间。式中将定义为组合加权函数:考虑到计算()所涉及的对称性,并去掉一些固定能量项,则()随x变化的部分为:=因而,为了简化计算可以替换为:=4.在整个房间内进行全局搜索,利用随机区域收缩算法(src)得到能量大的坐标点y。随机区域收缩算法的基本思想是,在所给定的初始值中随机找出一个n维的矩阵,在顺序过程中,逐步缩小范围,直到达到足够小的范围,找出峰值。从而计算出定位坐标点。随机区域收缩算法的过程如下:1)先定义i为迭代的次数,表示第i次迭代时随机抽取的点数,表示下一代的子搜索空间中包含的点数,表示下一代子搜索空间。定义每计算一次便记为一次,表示第i次迭代后的次数,表示停止值,φ表示大被允许计算的次数。表示新的子搜索空间的边界;2)初始化迭代次数i=0;3)设置初始参数:、,;4)计算中所有的值;5)整理出,使得≪;6)根据收缩当前的搜索空间,更新搜索空间和新的区域边界;7)如果,或者并且,则确定该点坐标位置,保存结果并输出;8)如果只有,则舍弃结果。内蒙古无限麦克风阵列麦克风阵列,麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置。
所述升压转换器u3的3脚、4脚连接后与所述电阻r11的一端、所述电阻r12的一端、所述电容c13的一端、所述电容c9的一端、所述电容c10的一端、所述电容c11的一端连接后接入到电源,所述升压转换器u3的5脚连接所述电阻r11的另一端,所述电容c9的另一端、所述电容c10的另一端、所述电容c11的另一端互相连接后接地;所述升压转换器u3的6脚连接所述电容c12的一端,所述电容c12的另一端连接所述电阻r13的一端后接地,所述升压转换器u3的7脚、所述电阻r13的另一端、所述电阻r12的另一端、所述电容c13的另一端互相连接,所述升压转换器u3的9脚、10脚、所述电容c14的一端、所述电容c15的正极、所述电容c16的一端、所述电感l2的一端、所述电感l1的另一端互相连接,所述电容c14的另一端、所述电容c15的负极、所述电容c16的另一端互相连接后接地,所述电感l2的另一端连接所述开关j2的3脚,所述开关j2的2脚连接所述插座j1的2脚,所述插座j1的1脚接地;所述稳压电源u4的1脚连接所述电容c19的一端后接入电源,所述稳压电源u4的2脚连接所述电容c19的另一端后接地,所述稳压电源u4的3脚连接所述电容c20的一端后接入电源,所述稳压电源u4的4脚连接所述电容c21的一端后接入电源。
通过声音采集模块中的双麦克风结构的麦克风阵列、信号放大电路、带通滤波器实现针对多竞争声源的去噪功能,同时利用语音增强模块中的语音增强算法实现语音信号的去噪和增强处理;在本发明的技术方案中,通过双麦克风即可实现声音信号采集,采用极少的电器元件即可准确的在竞争声源中识别竞争声源,确保了本发明技术方案中的翻译设备的硬件体积更小,使本产品适于用户随身携带使用,更具实用性;通过语音增强算法实现了在收到混合声音的20ms内即可识别出干净的目标声源,确保了实时去噪的功能的实现,使本发明的技术方案适用于不同的同声翻译应用场景。说明为本发明的语音转文字及同声翻译系统的系统组成框;为本发明中的声音采集模块的结构框;本发明中的麦克风与声源位置的实施例;为本发明实施例中的一级放大电路的电路结构;本发明实施例中的二级放大电路和带通滤波器的电路结构;本发明实施例中的电源管理电路的电路结构。具体实施方式,本发明一种基于麦克风阵列的智能语音转文字及同声翻译系统,其包括:声音采集模块、音频转换模块、语音增强模块、翻译模块;声音采集模块智能地选取目标声源。涉及一种便携式可视化麦克风阵列装置。
翻译后的文字数据、声音数据通过文字或者音频的方式传递给用户;其特征在于:所述声音采集模块包括麦克风阵列、信号放大电路、带通滤波器、电源管理电路;所述麦克风阵列包括两个麦克风,两个麦克风之间的间隔设置为15mm;所述信号放大电路包括两级放大电路,其中一级放大电路设置在所述麦克风阵列与所述带通滤波器之间,二级放大电路设置在所述带通滤波器之后;所述带通滤波器包括由二阶低通电路、二阶高通电路组成,所述一级放大电路传入的声信号,经过所述带通滤波器滤波后,声信号通过所述二级放大电路进行放大,使滤波后的信号达到预设的电压范围;由所述麦克风阵列采集的声信号通过所述一级放大电路、所述带通滤波器、所述二级放大电路进行放大、工频滤波处理、放大升压处理后送入所述音频转换模块中进行数模转换;所述电压管理电路同时为所述声音采集模块、所述音频转换模块、所述语音增强模块供电;所述语音增强模块中通过预先植入的语音增强算法对所述音频转换模块传入的声信号进行增强处理;所述语音增强算法包括以下步骤:s1:定义所述麦克风阵列中与目标声源s1接近的麦克风为前向麦克风mic1,其采集到的声信号为m1(n),另一个麦克风mic2采集到的声信号为m2(n)。便携式可视化麦克风阵列装置可以被附接安装到无人机,或者其它可动装置或者附接到交通工具。湖北自主可控麦克风阵列服务标准
立体阵列麦克风(3-DMicrophoneArray)真正实现全空间360度无损拾音解决了平面阵高俯仰角信号响应差的问题。广州量子麦克风阵列介绍
k)在a3×δ1以下时,目标信号在这些视频单元内占据成分较低,则对延迟系数t(l,k)在这个范围内的时频单元中的能量进行舍弃;终设计了一个掩蔽权重矩阵,掩蔽权重b(l,k)的表达式为:其中,掩蔽矩阵b(l,k)的维度与m1、m2的维度相同,式中a1、a2、a3的取值范围是在0~1间的实数;综上,通过本发明技术方案获得的掩蔽矩阵会更好的保留原始信号,并且去除噪声。对于同声传译系统来说,可以更好的提升系统的精度。s5:对增强信号进行傅里叶反变换,然后利用重叠相加法,可以得到增强后的信号此时获得的信号中方向性的竞争语音噪声已经被抑制。本实施例选用dsp作为处理器来实现上述算法。数据传输协议为iis协议,一个采样周期内同时传输左右声道的数据,数据长度为16bit;本实施例的系统采样频率为16khz,每次传输的采样数据为左右声道各256点,dsp实际处理的数据由上次采集数据和本次采集数据拼接而成,音频处理的帧移为16ms,帧长为32ms。一级放大电路包括:放大器u1、电容c5、c6、c7、c8、电阻r5、r10,放大器u1的1脚连接电阻r10的一端,放大器u1的2脚连接电阻r10的另一端后接地,放大器u1的3脚和16脚分别连接电阻r5的两端。广州量子麦克风阵列介绍
深圳鱼亮科技有限公司专注技术创新和产品研发,发展规模团队不断壮大。公司目前拥有较多的高技术人才,以不断增强企业重点竞争力,加快企业技术创新,实现稳健生产经营。公司以诚信为本,业务领域涵盖智能家居,语音识别算法,机器人交互系统,降噪,我们本着对客户负责,对员工负责,更是对公司发展负责的态度,争取做到让每位客户满意。一直以来公司坚持以客户为中心、智能家居,语音识别算法,机器人交互系统,降噪市场为导向,重信誉,保质量,想客户之所想,急用户之所急,全力以赴满足客户的一切需要。