基于长距离上下文的语音识别文本纠错方法、装置和设备

AITNT
正文
推荐专利
基于长距离上下文的语音识别文本纠错方法、装置和设备
申请号:CN202411032590
申请日期:2024-07-30
公开号:CN119132290A
公开日期:2024-12-13
类型:发明专利
摘要
本申请涉及一种基于长距离上下文的语音识别文本纠错方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,可用于自然语言处理技术领域。该方法包括:获取训练数据,并构建待训练的语音识别文本纠错模型;训练数据包括伪成对数据和真实成对数据;利用训练数据对待训练的语音识别文本纠错模型进行训练,得到目标语音识别文本纠错模型;通过目标语音识别文本纠错模型,对当前语音数据的原始语音识别文本进行错误信息识别,得到原始语音识别文本的错误信息识别结果;根据错误信息识别结果,对原始语音识别文本进行纠错处理,得到当前语音数据的目标语音识别文本。采用本方法能够提高语音识别文本纠错的效率。
技术关键词
语音识别文本 语音识别模型 计算机程序产品 计算机设备 模型训练模块 可读存储介质 纠错装置 数据获取模块 文本识别 处理器 模型更新 自然语言 存储器 语句
系统为您推荐了相关专利信息
1
电力负荷预测方法、装置、电子设备和计算机可读存储介质
电力负荷预测模型 门控循环单元 气象预报数据 场景 天气
2
基于Transformer模型的客服对话方法及装置
对话方法 客服 文本 自然语言 对话系统
3
一种虚拟场景的处理方法、装置、设备、计算机可读存储介质及计算机程序产品
图片 文本编辑框 场景深度图 计算机可执行指令 轮廓
4
基于多设备的模型运行方法、装置、电子设备
多设备 模型运行方法 拆分规则 变换器 界面系统
5
虚拟对象的动画生成方法、装置、计算机设备及存储介质
虚拟对象 悬挂参数 动画生成方法 计算机设备 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号