摘要
本申请公开了一种语音信息识别方法、装置、设备及存储介质,涉及信号处理技术领域,包括:利用预设麦克风阵列确定待识别声音信息中各发言方之间的声音时间差,并利用基于房间的建筑特征、反射特性与初始声音信息处理方法得到的目标声音信息处理方法,然后基于声音时间差确定各发言方的初始位置坐标与发言时间,提取待识别声音信息的特征,得到声纹基频特征;利用卡尔曼滤波模型并基于初始位置坐标预测各发言方的轨迹,然后基于得到的轨迹预测结果与声纹基频特征确定待识别声音信息与初始位置坐标之间的映射关系;利用预设记录系统处理基于映射关系、发言时间与发言内容得到的语义映射结果,得到目标信息。这样能够提高识别声音信息的效率。
技术关键词
语音信息识别方法
声音信息处理方法
卡尔曼滤波模型
时间差
坐标
运动轨迹预测
麦克风阵列
空间分布信息
语音信息识别装置
语义搜索功能
关系
通道注意力机制
增量方法
信号处理技术
房间
分辨方法
标注规则
算法
系统为您推荐了相关专利信息
预测控制模型
约束预测控制方法
四旋翼无人机系统
矩阵
欧拉方法
路径推荐方法
路径推荐模型
档案库
推荐权值
分段
状态实时检测
数据
电表箱
时间序列分解方法
符号
点检测方法
影像
特征点
RANSAC算法
误匹配点