摘要
本申请公开了一种对话模型训练方法、装置、设备、存储介质及程序产品,其中方法包括:确定源语言和目标语言之间的多语种表征;利用多语种表征对大语言模型进行对抗训练,得到训练后的大语言模型;将多个源语言输入到训练后的大语言模型的生成器中,生成多个文本数据;基于多个文本数据,采用预设方法得到与每个文本数据相匹配的对话内容,并基于每个文本数据和该文本数据对应的对话内容,得到多个多语种对话数据;利用多个多语种对话数据对对话模型进行端到端对话训练,得到训练后的对话模型;训练后的对话模型用于部署于智能对话系统,以生成输入的语音数据对应的对话内容。采用该方法,可提高智能对话系统的整体性能。
技术关键词
平行语料库
文本
智能对话系统
人物特征数据
模型训练方法
生成对抗网络
大语言模型
模型训练装置
计算机程序产品
处理器
注意力机制
语音
计算机设备
模块
可读存储介质
存储器
解码器
矩阵
系统为您推荐了相关专利信息
推断系统
数据展示模板
数据存储格式
组织特异性表达
大语言模型
异常事件
生成提示信息
结构化查询语句
模型训练方法
计算机存储介质
文本生成模型
识别方法
关键帧
视频
电力作业场景