基于长距离上下文的语音识别文本纠错方法、装置和设备

AITNT
正文
推荐专利
基于长距离上下文的语音识别文本纠错方法、装置和设备
申请号:CN202411032590
申请日期:2024-07-30
公开号:CN119132290A
公开日期:2024-12-13
类型:发明专利
摘要
本申请涉及一种基于长距离上下文的语音识别文本纠错方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,可用于自然语言处理技术领域。该方法包括:获取训练数据,并构建待训练的语音识别文本纠错模型;训练数据包括伪成对数据和真实成对数据;利用训练数据对待训练的语音识别文本纠错模型进行训练,得到目标语音识别文本纠错模型;通过目标语音识别文本纠错模型,对当前语音数据的原始语音识别文本进行错误信息识别,得到原始语音识别文本的错误信息识别结果;根据错误信息识别结果,对原始语音识别文本进行纠错处理,得到当前语音数据的目标语音识别文本。采用本方法能够提高语音识别文本纠错的效率。
技术关键词
语音识别文本 语音识别模型 计算机程序产品 计算机设备 模型训练模块 可读存储介质 纠错装置 数据获取模块 文本识别 处理器 模型更新 自然语言 存储器 语句
系统为您推荐了相关专利信息
1
一种基于数据挖掘的微小卫星大规模集群/巨型星座运行状态特征分析方法
特征分析方法 集群 数据挖掘交叉技术 置信度阈值 遗传算法
2
降低车辆功耗的方法、装置、车辆、存储介质及程序产品
车辆系统 外围设备 功耗 高性能 模式
3
光缆生产线中残次品检测方法、装置、设备及存储介质
光缆生产线 图像 缺陷位置信息 优化工艺流程 残次品率
4
用于生成视频的情感帧指示信息的方法、设备及介质
情感特征 视频帧 标签 文本情感分类模型 情感识别模型
5
目标检测方法、装置、计算机设备以及存储介质
视频 检索标签 客户端 图框 图片类别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号