摘要
本发明公开了一种需要少量标注数据提升大模型诚实性的训练方法及系统,新增了一个轻量级网络,用于辅助LLM对数据进行自标注,从而在有限的标注数据基础上,显著扩大可用于模型训练的数据规模,使得模型能够在数据资源有限的情况下,依然能够得到充分的训练和优化。轻量级网络与LLM之间形成了紧密的协同工作机制,轻量级网络通过对LLM生成的回答进行诚实性评估,为未标注数据生成可靠的标注信息,这一过程不仅充分利用了LLM自身的概率评估能力,还结合了轻量级网络对诚实性的量化评估,使得模型能够在有限的数据条件下,学习到更加诚实的回答策略,实现了利用少量的数据增强LLM的诚实性的目的。
技术关键词
少量标注数据
网络
训练系统
标注策略
预训练模型
指标
数据格式
模块
令牌
规模
机制
线性
框架
资源
模式
基础
系统为您推荐了相关专利信息
设备性能数据
在线监测系统
实时数据采集
分布式传感器网络
模型预测值
药物释放速率
低功耗广域网络
数据实时共享方法
急诊
抗菌涂层