摘要
本发明提供一种基于大模型的人机交互安全性监管方法及装置,涉及人机交互安全监管技术领域。该方法包括:根据指令文本以及交互场景图像,通过Clip编码模型进行数据处理,获得全局图像特征以及全局文本特征;基于安全数据库,根据全局图像特征以及全局文本特征进行数据检索,获得匹配图像以及匹配文本;根据全局图像特征、全局文本特征、匹配图像和匹配文本,通过多级安全检查模型进行交互安全检查,获得安全反馈信息。本发明是一种基于大模型的多层级的高效率人机交互安全性监管方法。
技术关键词
文本
监管方法
计算机可读取存储介质
计算机可读指令
监管设备
融合特征
监管装置
场景
图像嵌入
大语言模型
安全监管技术
多头注意力机制
机器人
图文
多层感知机
麦克风
信息编码
系统为您推荐了相关专利信息
图像分析系统
图像分析方法
跨模态关联学习
自然语言文本
视觉特征
数据识别方法
语句
识别算法
计算机可读指令
数据识别装置