一种数据处理方法、模型训练方法及相关装置

正文

推荐专利

申请号：CN202510575729

申请日期：2025-05-06

公开号：CN120492618A

公开日期：2025-08-15

类型：发明专利

摘要

本申请公开了一种数据处理方法、模型训练方法及相关装置，该数据处理方法可以包括：获取文本数据集，文本数据集包括若干文本数据，若干文本数据中包含多个关键词；获取每个关键词的搭配词所对应的内容描述信息；基于每个关键词、每个关键词的搭配词以及每个关键词的搭配词所对应的内容描述信息，生成第一训练数据，第一训练数据用于训练文本生成模型。可见，最终得到的第一训练数据包括每个关键词的搭配词所对应的内容描述信息，由于该信息并非是预先标注的数据，因此利用该第一训练数据对文本生成模型进行训练的过程本质属于弱监督学习。后续利用这样的数据训练文本生成模型，能够提高文本生成模型的泛化能力，从而有助于提高文本生成的质量。

技术关键词

文本生成模型数据处理方法关键词模型训练方法标签生成指令观点电子设备弱监督学习计算机存储介质存储计算机程序数据处理装置数据获取模块处理器存储器本质框架

系统为您推荐了相关专利信息

一种生理信号的特征提取和识别方法

识别方法电信号译码模块生理数学模型

大语言模型训练方法、逻辑问题处理方法及计算机设备

大语言模型逻辑语言模型训练方法超参数格式化

一种验证环境生成方法、装置、设备及存储介质

树状数据结构生成方法框架自定义关键词语言解释器

基于多尺度注意力和积累学习的多任务配准与分割方法

注意力编码特征分辨率分割方法解码器

基于人工智能的数据库存储资源安全调度方法

网络流量特征超参数信息融合机制资源人工智能模型

一种数据处理方法、模型训练方法及相关装置

站点导航

APP 下载