一种数据处理方法、模型训练方法及相关装置

AITNT
正文
推荐专利
一种数据处理方法、模型训练方法及相关装置
申请号:CN202510575729
申请日期:2025-05-06
公开号:CN120492618A
公开日期:2025-08-15
类型:发明专利
摘要
本申请公开了一种数据处理方法、模型训练方法及相关装置,该数据处理方法可以包括:获取文本数据集,文本数据集包括若干文本数据,若干文本数据中包含多个关键词;获取每个关键词的搭配词所对应的内容描述信息;基于每个关键词、每个关键词的搭配词以及每个关键词的搭配词所对应的内容描述信息,生成第一训练数据,第一训练数据用于训练文本生成模型。可见,最终得到的第一训练数据包括每个关键词的搭配词所对应的内容描述信息,由于该信息并非是预先标注的数据,因此利用该第一训练数据对文本生成模型进行训练的过程本质属于弱监督学习。后续利用这样的数据训练文本生成模型,能够提高文本生成模型的泛化能力,从而有助于提高文本生成的质量。
技术关键词
文本生成模型 数据处理方法 关键词 模型训练方法 标签 生成指令 观点 电子设备 弱监督学习 计算机存储介质 存储计算机程序 数据处理装置 数据获取模块 处理器 存储器 本质 框架
系统为您推荐了相关专利信息
1
一种生理信号的特征提取和识别方法
识别方法 电信号 译码模块 生理 数学模型
2
大语言模型训练方法、逻辑问题处理方法及计算机设备
大语言模型 逻辑 语言模型训练方法 超参数 格式化
3
一种验证环境生成方法、装置、设备及存储介质
树状数据结构 生成方法 框架 自定义关键词 语言解释器
4
基于多尺度注意力和积累学习的多任务配准与分割方法
注意力 编码特征 分辨率 分割方法 解码器
5
基于人工智能的数据库存储资源安全调度方法
网络流量特征 超参数 信息融合机制 资源 人工智能模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号