摘要
本申请提供了一种藏语复杂环境语音识别中的敏感词动态监控方法及装置,对复杂环境中待监控的藏语语音输入流进行片段分割,得到复杂环境中藏语语音的分帧语音信号,进而将分帧语音信号中各个候选敏感词的音素级评分、语义级评分、场景级评分和情感级评分进行多维度感知融合,得到各个候选敏感词对应上下文的感知融合特征;通过语音识别中解码路径的路径稳定性和藏语音节序列中各个藏语音节的后验概率确定藏语音节序列的解码置信度;基于解码置信度和各个感知融合特征确定各个候选敏感词的语境敏感度,进而通过语境敏感度对复杂环境中的藏语语音输入流进行分级预警。基于上述方案可实现藏语复杂环境语音识别中敏感词的多维度融合评分。
技术关键词
语音
动态监控方法
融合特征
模糊匹配算法
解码
后验概率
语义
序列
藏语情感词典
拼音
信号
声学场景分类
动态监控装置
计算机设备
可靠性特征
可读存储介质
存储计算机程序
编辑
系统为您推荐了相关专利信息
语音交互控制方法
场景
语音交互控制装置
车辆
参数
多模态特征
交叉注意力机制
融合特征
计算机可读指令
组合模块
情绪识别方法
终端设备
频段
拉普拉斯噪声
噪声量