摘要
本发明提供了一种基于大语言模型的伦理审查方法及装置,具有这样的特征,包括以下步骤:步骤S1,根据现有训练数据,对现有的大语言模型进行二次预训练、二次指令微调和人类反馈强化学习,得到训练好的大语言模型作为领域模型;步骤S2,将项目文档输入现有的通用模型,并结合检索增强方法和审查规则库,得到该项目文档对应的初步审查结果;步骤S3,将初步审查结果输入领域模型,结合审查规则库,得到审查结果。总之,本方法能够辅助审查人员进行快速高效地伦理审查。
技术关键词
大语言模型
项目
表达式
指令
强化学习方法
数据存储模块
人类
生成方法
文本
策略
书籍
论文
逻辑
因子
序列
参数
系统为您推荐了相关专利信息
BP神经网络模型
抗冲聚丙烯
训练样本数据
参数
变量
混合储能系统
负荷
多状态模型
储能系统充放电
孤岛微电网
分词
文章特征
热点事件检测方法
无监督特征
预训练语言模型