摘要
本申请涉及一种结合过程监督与快慢思考的类脑场景安全性评估方法。所述方法包括:首先,设计类脑场景安全性认知过程和场景安全等级划分标准;之后,基于所述类脑场景安全性认知过程和场景安全等级划分标准构建监督微调数据集和过程监督范式的强化学习微调数据集;之后,基于所述监督微调数据集对开源预训练多模态大语言模型进行冷启动,得到监督微调模型;之后,基于所述过程监督范式的强化学习微调数据集对所述监督微调模型进行强化学习训练;最后,将待评估场景图像输入训练之后的监督微调模型,得到场景安全性等级。能够让模型的推理过程在宏观层面上与人类的思维过程对齐,维持了思考过程的灵活性,提高了每一步结果的可解释性。
技术关键词
安全性评估方法
场景
数据
标签
图像
大语言模型
多模态
关系
实体
策略
评估装置
处理器
计算机设备
模块
可读存储介质
文本
存储器
指令
视觉
系统为您推荐了相关专利信息
可见光图像
门禁系统
红外热成像摄像头
图像特征提取
特征提取网络
光照控制方法
时间序列预测模型
多维特征向量
物联网设备
情景
内容审核模型
图像识别模型
内容审核方法
金融
生成广告