摘要
本发明提供一种实时语音转录的双流程纠错方法及装置,涉及语音处理技术领域,包括:提取各片段的梅尔频谱特征,将各梅尔频谱特征输入轻量级端到端模型,获得初步转录文本;将片段按照预设个数进行拼接,获得多个长段,将各长段输入语音识别模型,获得高精度转录文本;根据初步转录文本的置信度集合对初步转录文本和高精度转录文本进行文本比对,获得初步转录文本中所有的错误词汇;根据错误词汇的类型和高精度转录文本对初步转录文本中的各错误词汇进行对应的纠错处理,获得最终转录文本。本发明通过初步转录文本和高精度转录文本的双流程转录纠错机制,在不影响实时性的前提下减少转录错误累积,提升复杂场景下的转录准确性。
技术关键词
文本
实时语音
纠错方法
置信度阈值
频谱特征
语音识别模型
非暂态计算机可读存储介质
动态时间规整算法
序列
纠错机制
纠错装置
纠错模块
处理器
存储器
电子设备
分词
场景
系统为您推荐了相关专利信息
水下图像增强方法
颜色直方图
水下图像增强系统
预训练模型
文本编码器
海上油气勘探开发
体系建立方法
标签体系
数据标签
关联规则挖掘算法
调度终端
监控调度系统
通信控制模块
语音识别模块
语音采集模块
法律知识图谱
大语言模型
智能问答系统
实体
问答对数据