目标大语言模型的确定方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510527969

申请日期：2025-04-25

公开号：CN120449982A

公开日期：2025-08-08

类型：发明专利

摘要

本申请实施例提供目标大语言模型的确定方法、装置、设备、存储介质及程序产品。涉及人工智能领域。该方法包括：基于目标知识推理功能对应的数据集识别第一大语言模型中的目标网络模块；在知识裁剪场景中，基于该数据集对第一大语言模型中的目标网络模块进行裁剪，可以减少参数量和计算量，降低内存占用，从而基于第一训练集对裁剪后的第一大语言模型进行训练，可以提高第一大语言模型的训练效率；在知识迁移场景中，将目标网络模块迁移至第二大语言模型中，可以实现目标网络模块的复用，从而基于第二训练集，对迁移后的第二大语言模型进行训练，可以避免参数的重复训练，减少训练过程中的内存消耗，进而可以提高第二大语言模型的训练效率。

技术关键词

大语言模型网络模块问答对数据场景计算机可执行指令训练集参数索引处理器元素裁剪模块计算机程序产品电子设备数据格式矩阵存储装置内存

系统为您推荐了相关专利信息

一种基于大语言模型的金融案件信息挖掘方法和系统

实体大语言模型法律知识图谱信息挖掘系统金融

一种基于边缘计算的配电架空线温度与弧垂智能监测方法及系统

智能监测方法架空线智能分析引擎计算机可执行指令动态电压频率调节

一种新能源及储能参与容量市场的可信容量评估方法及系统

容量评估方法切换优化策略储能设备计算机可执行指令电力运行数据

讲题交互方法及相关装置、学习机和存储介质

交互方法语句指令控件学习机

基于大模型ReAct的商业智能系统的实现方法、系统及设备

商业智能系统注册中心画像数据库列表终端

目标大语言模型的确定方法、装置、设备、存储介质及程序产品

站点导航

APP 下载