目标大语言模型的确定方法、装置、设备、存储介质及程序产品

AITNT
正文
推荐专利
目标大语言模型的确定方法、装置、设备、存储介质及程序产品
申请号:CN202510527969
申请日期:2025-04-25
公开号:CN120449982A
公开日期:2025-08-08
类型:发明专利
摘要
本申请实施例提供目标大语言模型的确定方法、装置、设备、存储介质及程序产品。涉及人工智能领域。该方法包括:基于目标知识推理功能对应的数据集识别第一大语言模型中的目标网络模块;在知识裁剪场景中,基于该数据集对第一大语言模型中的目标网络模块进行裁剪,可以减少参数量和计算量,降低内存占用,从而基于第一训练集对裁剪后的第一大语言模型进行训练,可以提高第一大语言模型的训练效率;在知识迁移场景中,将目标网络模块迁移至第二大语言模型中,可以实现目标网络模块的复用,从而基于第二训练集,对迁移后的第二大语言模型进行训练,可以避免参数的重复训练,减少训练过程中的内存消耗,进而可以提高第二大语言模型的训练效率。
技术关键词
大语言模型 网络模块 问答对数据 场景 计算机可执行指令 训练集 参数 索引 处理器 元素 裁剪模块 计算机程序产品 电子设备 数据格式 矩阵 存储装置 内存
系统为您推荐了相关专利信息
1
一种基于大语言模型的金融案件信息挖掘方法和系统
实体 大语言模型 法律知识图谱 信息挖掘系统 金融
2
一种基于边缘计算的配电架空线温度与弧垂智能监测方法及系统
智能监测方法 架空线 智能分析引擎 计算机可执行指令 动态电压频率调节
3
一种新能源及储能参与容量市场的可信容量评估方法及系统
容量评估方法 切换优化策略 储能设备 计算机可执行指令 电力运行数据
4
讲题交互方法及相关装置、学习机和存储介质
交互方法 语句 指令 控件 学习机
5
基于大模型ReAct的商业智能系统的实现方法、系统及设备
商业智能系统 注册中心 画像数据库 列表 终端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号