摘要
本发明公开了一种语义顺滑的ASR文本优化方法,包括S1):接收原始ASR识别文本,并使用ASR模型进行预处理;S2):通过预训练语言模型生成语义连贯性评分;S3):修正区域定位,结合注意力机制和连贯性评分,判断是否需要修正;S4):根据不同场景设定修正强度参数α,并执行多级修正操作;S401):删除无语义贡献的停顿词;S402):根据上下文替换同音错别字;S403):合并或删除重复出现的语义单元;S5):基于依存句法分析重构句子结构,输出优化后的文本。本申请语义顺滑的ASR文本优化方法,同步解决了冗余词、同音字、语义重复三大问题,大大提升处理效率;同时,可适应从需高保真到需高流畅的不同各种场景,方法泛用性能强。
技术关键词
语义
文本
预训练语言模型
依存句法分析
BiLSTM模型
注意力机制
拼音
编辑
上下文特征
参数
强度
场景
滑动窗口
重构
冗余
字符
校正
语音
数值