一种实时语音转录的双流程纠错方法及装置

正文

推荐专利

一种实时语音转录的双流程纠错方法及装置

申请号：CN202510819098

申请日期：2025-06-18

公开号：CN120690225A

公开日期：2025-09-23

类型：发明专利

摘要

本发明提供一种实时语音转录的双流程纠错方法及装置，涉及语音处理技术领域，包括：提取各片段的梅尔频谱特征，将各梅尔频谱特征输入轻量级端到端模型，获得初步转录文本；将片段按照预设个数进行拼接，获得多个长段，将各长段输入语音识别模型，获得高精度转录文本；根据初步转录文本的置信度集合对初步转录文本和高精度转录文本进行文本比对，获得初步转录文本中所有的错误词汇；根据错误词汇的类型和高精度转录文本对初步转录文本中的各错误词汇进行对应的纠错处理，获得最终转录文本。本发明通过初步转录文本和高精度转录文本的双流程转录纠错机制，在不影响实时性的前提下减少转录错误累积，提升复杂场景下的转录准确性。

技术关键词

文本实时语音纠错方法置信度阈值频谱特征语音识别模型非暂态计算机可读存储介质动态时间规整算法序列纠错机制纠错装置纠错模块处理器存储器电子设备分词场景

系统为您推荐了相关专利信息

基于视觉-文本融合的水下图像增强方法及系统

水下图像增强方法颜色直方图水下图像增强系统预训练模型文本编码器

语音识别方法、装置、电子设备和存储介质

文本声纹特征语音识别方法分段数据存储

一种海上油气勘探开发数据标签体系建立方法

海上油气勘探开发体系建立方法标签体系数据标签关联规则挖掘算法

一种新能源远程监控调度系统

调度终端监控调度系统通信控制模块语音识别模块语音采集模块

基于法律大语言模型和法律知识图谱自动构建的方法及其智能问答系统

法律知识图谱大语言模型智能问答系统实体问答对数据

一种实时语音转录的双流程纠错方法及装置

站点导航

APP 下载