一种多模态操控检测与定位的方法及系统

正文

推荐专利

一种多模态操控检测与定位的方法及系统

申请号：CN202510481491

申请日期：2025-04-17

公开号：CN120599211A

公开日期：2025-09-05

类型：发明专利

摘要

本发明公开了一种多模态操控检测与定位的方法及系统，涉及深度学习和人工智能技术领域，对输入的多模态数据进行特征提取；对图像生成描述性文本，计算图像与描述性文本的对齐损失；基于交叉注意力矩阵对图像特征和文本特征进行多模态融合，得到融合后的图像特征和融合后的文本特征；引入操控引导矩阵对操控区域赋予权重，计算操控引导后的注意力矩阵损失；利用融合后的多模态特征进行检测与定位，计算判别损失、分类损失、图像定位损失和文本定位损失；引入指示引导矩阵对图像中的操控区域进行强调，计算指示引导后的图像判别损失；基于模型总损失对模型进行训练，训练后的模型用于对多模态数据的操控进行检测与定位。本发明提升操控检测与定位的精度和可靠性。

技术关键词

多模态图像块特征注意力分类特征矩阵词语文本编码器图像编码器对齐模块模态特征检测器多分类器指示器二分类器人工智能技术数据计算机程序产品处理器

系统为您推荐了相关专利信息

演示文档生成方法和装置、电子设备、存储介质

图片布局特征文档生成方法融合特征注意力

基于视觉与传感融合的动态监测与管理平台

动态状态信息物理传感器管理策略随机森林模型图像特征分类

一种三维虹膜重建及展开方法

虹膜纹理图像深度信息生物识别身份验证 OCT技术生成深度图

一种微波无创血糖预测方法、装置、设备、介质及产品

无创血糖预测方法门控循环网络量子粒子群优化算法注意力微波

一种维修机构编配设备可替代性评估方法

维修设备层级评估指标体系数学模型维修保障基地

一种多模态操控检测与定位的方法及系统

站点导航

APP 下载