摘要
本申请公开了一种数据处理方法、模型训练方法及相关装置,该数据处理方法可以包括:获取文本数据集,文本数据集包括若干文本数据,若干文本数据中包含多个关键词;获取每个关键词的搭配词所对应的内容描述信息;基于每个关键词、每个关键词的搭配词以及每个关键词的搭配词所对应的内容描述信息,生成第一训练数据,第一训练数据用于训练文本生成模型。可见,最终得到的第一训练数据包括每个关键词的搭配词所对应的内容描述信息,由于该信息并非是预先标注的数据,因此利用该第一训练数据对文本生成模型进行训练的过程本质属于弱监督学习。后续利用这样的数据训练文本生成模型,能够提高文本生成模型的泛化能力,从而有助于提高文本生成的质量。
技术关键词
文本生成模型
数据处理方法
关键词
模型训练方法
标签
生成指令
观点
电子设备
弱监督学习
计算机存储介质
存储计算机程序
数据处理装置
数据获取模块
处理器
存储器
本质
框架
系统为您推荐了相关专利信息
大语言模型
逻辑
语言模型训练方法
超参数
格式化
树状数据结构
生成方法
框架
自定义关键词
语言解释器
网络流量特征
超参数
信息融合机制
资源
人工智能模型