摘要
本发明公开了基于大模型数据回收的可控优化方法、系统、设备及介质,属于大模型技术领域,本发明要解决的技术问题为如何自动编辑现有的微调数据,提高大模型的可控性,采用的技术方案为:该方法是根据预定义规则将多个约束合并到回收的原始数据样本中,利用回收的数据加入扩充的约束,创建新的训练任务巩固大模型的可控制性;具体如下:根据样本数量和监督微调数据集设定令牌长度;基于重构指令和响应扩充现有监督微调数据集;利用在线模型选择算法将大模型代理有效地结合到序列决策中;在训练过程中扩大计算量,提高大模型的可用范围。
技术关键词
令牌
数据
计算机执行指令
模型算法
单周期
在线
检测器
样本
重构
扩充模块
生成指令
新消息
决策
模板
可读存储介质
批量
序列
关键词
系统为您推荐了相关专利信息
识别算法
纹理特征提取
深度学习模型
多模态特征融合
数据
训练数据量
偏差
人工智能技术
计算机系统
处理器
空间传输系统
历史流量数据
时间片
令牌分配方法
样本
迁移学习模型
分类器
挖掘算法
核苷酸序列数据
样本