一种实时语音转录的双流程纠错方法及装置

AITNT
正文
推荐专利
一种实时语音转录的双流程纠错方法及装置
申请号:CN202510819098
申请日期:2025-06-18
公开号:CN120690225A
公开日期:2025-09-23
类型:发明专利
摘要
本发明提供一种实时语音转录的双流程纠错方法及装置,涉及语音处理技术领域,包括:提取各片段的梅尔频谱特征,将各梅尔频谱特征输入轻量级端到端模型,获得初步转录文本;将片段按照预设个数进行拼接,获得多个长段,将各长段输入语音识别模型,获得高精度转录文本;根据初步转录文本的置信度集合对初步转录文本和高精度转录文本进行文本比对,获得初步转录文本中所有的错误词汇;根据错误词汇的类型和高精度转录文本对初步转录文本中的各错误词汇进行对应的纠错处理,获得最终转录文本。本发明通过初步转录文本和高精度转录文本的双流程转录纠错机制,在不影响实时性的前提下减少转录错误累积,提升复杂场景下的转录准确性。
技术关键词
文本 实时语音 纠错方法 置信度阈值 频谱特征 语音识别模型 非暂态计算机可读存储介质 动态时间规整算法 序列 纠错机制 纠错装置 纠错模块 处理器 存储器 电子设备 分词 场景
系统为您推荐了相关专利信息
1
基于视觉-文本融合的水下图像增强方法及系统
水下图像增强方法 颜色直方图 水下图像增强系统 预训练模型 文本编码器
2
语音识别方法、装置、电子设备和存储介质
文本 声纹特征 语音识别方法 分段 数据存储
3
一种海上油气勘探开发数据标签体系建立方法
海上油气勘探开发 体系建立方法 标签体系 数据标签 关联规则挖掘算法
4
一种新能源远程监控调度系统
调度终端 监控调度系统 通信控制模块 语音识别模块 语音采集模块
5
基于法律大语言模型和法律知识图谱自动构建的方法及其智能问答系统
法律知识图谱 大语言模型 智能问答系统 实体 问答对数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号