摘要
本发明提供了一种自动语音识别结果优化系统、方法、介质及设备,优化系统包括:ASR前处理模块:对原始音频进行初次ASR识别,得到初步识别文本,对初步识别文本进行命名实体识别,将识别结果匹配热词库中发音相似的热词,将热词输入ASR模型进行二次识别;ASR文本后处理模块:利用大语言模型对ASR模型输出的文本进行语义纠错,并验证其合理性;ASR说话人识别模块:利用说话人分离技术对音频进行分段并编号,将编号与具体人名进行映射。本发明通过采用实体词提取+热词匹配的方式,解决了语音识别系统无法提前筛选相关热词的问题,提升了ASR系统的识别效果。
技术关键词
自动语音识别
大语言模型
命名实体识别
说话人识别模型
后处理模块
语义
音频
发音特征
标签文本
分段
语音识别系统
纠错
格式化
处理器
关系
可读存储介质
系统为您推荐了相关专利信息
知识图谱构建方法
实体
三元组
知识图谱自动构建方法
关系
脚本自动生成方法
错误特征
指令
意图识别
图形用户界面