摘要
本发明提供了一种处理语音混淆的命名实体矫正方法及系统,包括:检测给定的语音识别文本中的损坏实体;对损坏实体逐一执行音素级检索操作,基于损坏实体与预定义实体的语音相似度从预定义实体列表中筛选出候选实体;采用双编码器结构计算候选实体与语音识别文本上下文的语义相似度,基于语义相似度对候选实体动态排序;选取最优候选实体替换损坏实体,双编码器包含上下文编码器和实体编码器;基于实体拒绝机制,对比替换候选实体与原实体片段的拒绝得分,若替换候选实体拒绝得分更高,触发拒绝逻辑,保留原语音识别结果,否则接受替换。本发明解决了现有技术中语音识别系统在噪音环境补偿过程中存在的命名实体语音混淆的问题。
技术关键词
实体
语音识别文本
矫正方法
双编码器
语义
矫正系统
标记
权重模型
字符
语音识别系统
拼音
序列
模块
列表
动态
编辑
逻辑