一种面向垂域大模型预训练的数据配比方法、装置及设备

AITNT
正文
推荐专利
一种面向垂域大模型预训练的数据配比方法、装置及设备
申请号:CN202411054262
申请日期:2024-08-02
公开号:CN118569338B
公开日期:2024-11-29
类型:发明专利
摘要
本申请公开了一种面向垂域大模型预训练的数据配比方法、装置及设备,涉及数据处理技术领域。该方法应用于计算机集群,包括以下步骤:确定目标领域,将领域子集和通用子集输入训练模型,计算注意力特征,得到领域子集和通用子集的注意力分布;利用训练模型对领域子集和通用子集进行知识探测,得到领域子集和通用子集的知识权重;基于领域子集和通用子集的注意力分布和知识权重,确定训练数据集的混合权重;根据训练数据集的混合权重动态调整训练数据集的混合比例,对训练模型进行进一步训练,直至训练模型达到预设标准。本方案综合了数据垂直领域和通用领域的特性,不断优化模型性能,实现了精准和有效的数据配比,提高了模型训练的效果和性能。
技术关键词
注意力 配比方法 模型预训练 维基百科 矩阵 集群 计算机设备 可读存储介质 配比装置 数据处理技术 处理器 参数 动态 关系 分析模块 批量 存储器 序列
系统为您推荐了相关专利信息
1
一种基于多模态残差注意力网络的调制识别方法和装置
调制识别方法 融合特征 多模态特征融合 多层级特征 数据
2
一种用于元宇宙的用户心理状态评估方法及系统
心理状态评估方法 资源分配 表达式 指数 数据
3
信息交互方法、装置、计算机设备及存储介质
文本 信息交互方法 大语言模型 车载控制器 注意力
4
支持矩阵乘和矩阵Reduce类算子的处理器及运算方法
矩阵 浮点数 处理器 基础 数值
5
一种基于扩散模型的视频生成方法
视频生成方法 强化学习框架 视频生成模型 场景 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号