语音关键事件检测基本参数
  • 品牌
  • Bothlent
  • 型号
  • XFM-USBMEMS-6MIC
  • 封装形式
  • DIP
语音关键事件检测企业商机

    第二类图像中各个图像均为:基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的光流图。具体的,在本实现方式中,第二类图像为:包括光流图和光流图之前的连续n帧光流图的多张图像;其中,n为正整数;或者,第二类图像为:光流图。也就是说,在本实现方式中,电子设备可以将所获得的光流图确定为待分析图像;此外,在获取到光流图后,电子设备可以判断光流图之前的连续n帧光流图是否均是基于每两帧连续的关于目标防护舱且包括目标对象的图像获取的,当判断结果为是时,电子设备也可以将包括光流图和该连续n帧光流图的多张图像确定为待分析图像。这样,用于确定当前时刻,关于目标防护舱的事件检测结果的待分析图像为多张,可以更充分地反映目标防护舱中用户的运动变化情况,进而提高事件检测的准确率。其中,n可以为任一正整数,例如,5,10等。基于上述对步骤s304中的说明中,对检测模型模型的描述内容,可以确定不同类型和数量的待分析图像,所利用的检测模型不同。进一步的,针对不同的待分析图像,则上述步骤s304的实现方式不同。下面,针对不同类型和数量的待分析图像,对上述步骤s304的具体执行方式,以及待分析图像与检测模型之间的对应关系进行举例说明。语音关键事件检测是未来语音识别和智能交互领域的重要研究方向之一。安徽移动语音关键事件检测特征

    每种类型与某一数字对应,以便于计算机的处理,则可以分别标记为[0,1,2,3,4,...,29,30]。在本申请的示例性实施例中,因计算机无法直接处理中文,因此可以将句子(语句)中每一个单词转化为数字的映射。即,获得语句的向量化语义表示w1。在本申请的示例性实施例中,所述获得语句的向量化语义表示w1可以包括:通过双向lstm网络模型或bert模型获得语句的向量化语义表示w1。在本申请的示例性实施例中,在通过双向lstm网络获得语句的向量化语义表示w1之前,所述方法还可以包括:将语句中的m个字符随机初始化为一个维度为[m,n]的n维向量d,其中,对于从0到m-1的索引id,每个id对应一个不同的字符;对于长度为s的语句,该语句中每一个字符能够在向量d中找到对应的id,从而获得维度为[s,d]的向量。在本申请的示例性实施例中,通过双向lstm网络获得语句的向量化语义表示w1可以包括:将维度为[s,d]的向量输入预设的双向lstm神经网络,将所述双向lstm神经网络的输出作为语句的向量化语义表示w1。在本申请的示例性实施例中,假设语料中一共有20000个不同的字符(汉字和/或单词,可以包括其他常用符号),每个字符可以随机初始化为一个300维的向量,则可以得到一个维度为[20000。河南光纤数据语音关键事件检测介绍通过分析语音信号的频率、幅度和持续时间等特征,语音关键事件检测系统能够识别出不同的声音事件。

    如果是,基于所述当前帧图像,确定待分析图像,其中,所述待分析图像为:关于所述目标语音关键事件检测防护舱及所述目标对象的图像;将所述待分析图像输入到预设的检测模型中,得到关于所述目标防护舱的事件检测结果;其中,所述检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第二方面,本发明实施例提供了一种事件检测装置,所述装置包括:图像获取模块,用于实时获取关于目标防护舱的图像,并将当前时刻所采集到的图像作为当前帧图像;图像检测模块,用于检测所述当前帧图像是否包含目标对象,其中,所述目标对象为:能够表征用户进入所述目标防护舱的用户身体部位;如果是,触发图像确定模块;所述图像确定模块,用于基于所述当前帧图像,确定待分析图像,其中,所述待分析图像为:关于所述目标防护舱及所述目标对象的图像;结果确定模块,用于将所述待分析图像输入到预设的检测模型中,得到关于所述目标防护舱的事件检测结果;其中,所述检测模型为:基于各个样本图像和每个样本图像的事件检测结果所训练得到的模型。第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口。

    比如人名、地名、组织机构名、时间等。4、事件检测与主体抽取:事件检测与主体抽取即为同时抽取事件的触发词和事件的主体。5、注意力机制:注意力机制的本质来自于人类视觉注意力机制。当人们发现一个场景经常在某部分出现自己想观察的东西时,人们会进行学习在将来再出现类似场景时把注意力放到该部分上。在计算某一序列表示时,注意力机制可以获得权重和序列位置的相关性。6、自注意力机制:自注意力机制是对注意力机制的改进,减少了对外部信息的依赖,更擅长捕捉数据或特征的内部相关性,无视词之间的距离直接计算依赖关系,能够学习一个句子的内部结构。7、span:span可认为是“一段区域,每个span具有一定的宽度”,就是对一段话进行固定长度的选取,比如一句话“我吃了面包,喝了牛奶”,如果span的宽度为2,则可以得到片段“我今”、“”、“天吃”等。8、span的划分:span的划分是指根据设定的span的大宽度,从小到大依次进行划分。比如span大宽度为8,则span的宽度为1-8,分别进行划分,可以得到多个span。9、span的分类:span的分类是指通过模型或特定的方法判断一条数据所属的类型即标签,一般而言,分类任务中的每条数据只属于一个类别。语音关键事件检测在国际上的运用如何?欢迎咨询!

    并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而。在安全监控领域,语音关键事件检测可以用于检测和识别异常声音事件,如求救声等。上海新一代语音关键事件检测设计

语音关键事件检测的应用步骤是如何的?欢迎咨询!安徽移动语音关键事件检测特征

    当目标人物的沉浮频率偏离目标频率值时,也即目标人物沉浮频率过高或沉浮频率过低,目标人物均存在溺水的可能性。在具体实施中,游泳者在正常游泳时,泳姿可能会发生变化,但是泳姿通常是正常的,例如,游泳者在某一时间段进行蛙泳,之后一段时间进行仰泳。若游泳者出现溺水时,其对应的泳姿会出现异常。因此,在本实用新型实施例中,当目标人物的沉浮频率偏离预设的目标频率值,且目标人物的泳姿信息异常时,控制器12可以判定目标人物发生溺水。在具体实施中,若在目标人物所处的理论位置范围内没有检测到目标人物,且没有检测到目标人物的时间超过预设时长时,目标人物也可能会发生溺水。在本实用新型实施例中,当目标人物的沉浮频率偏离预设的目标频率值,且在预设时长内在所述理论位置范围内没有检测到目标人物时,控制器12也可以判定目标人物发生溺水。在实际应用中,预设时长可以根据具体的应用场景进行设定。例如,预设时长设置为15s。又如,预设时长设置为20s。需要说明的是,在本实用新型实施例中,控制器12执行的算法运算操作均可以采用现有的公知技术所实现。在具体实施中,在判定目标人物溺水之后,控制器12可以向预先关联的告警装置13输出告警指令。安徽移动语音关键事件检测特征

与语音关键事件检测相关的文章
与语音关键事件检测相关的产品
与语音关键事件检测相关的新闻
与语音关键事件检测相关的问题
新闻资讯
产品推荐
信息来源于互联网 本站不为信息真实性负责