摘要
本发明公开了一种多模态数据驱动的教育大模型分布外检测方法及系统,属于多模态数据处理领域。本发明针对目标教育场景,获取待检测的分布内类别标签集合和图像数据集合,将设计好的最终提示词输入至大语言模型生成非典型类别标签集合,并得到扩展的标签集合;由预训练的文本编码器以及图像编码器分别输出文本特征和视觉特征,计算视觉特征与各个文本特征之间的余弦相似度,构建类归一化形式的比例函数,以得到题目图像的分布外分数;最后进行决策判断,对于分布外图像,则不进行处理,对于分布内图像,则构成分类数据集用于执行目标教育场景下的分类任务。本发明可以提升教育大模型在应用于实际教育场景时的稳健性和可靠性,具有良好的应用前景。
技术关键词
题目图像
外检测方法
图像数据集合
视觉特征
标签
文本编码器
图像编码器
多模态
教育场景
预训练模型
计算机电子设备
存储计算机程序
特征提取模块
数据处理模块
计算机程序产品
处理器
可读存储介质
系统为您推荐了相关专利信息
刀具磨损检测
Elman算法
特征提取模块
特征金字塔网络
网络结构
入侵检测模型
服务器节点
神经网络模型
双向长短期记忆
注意力机制
优化管理方法
性能偏移量
误差预测
变幅杆
调节换能器