一种多模态操控检测与定位的方法及系统

AITNT
正文
推荐专利
一种多模态操控检测与定位的方法及系统
申请号:CN202510481491
申请日期:2025-04-17
公开号:CN120599211A
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种多模态操控检测与定位的方法及系统,涉及深度学习和人工智能技术领域,对输入的多模态数据进行特征提取;对图像生成描述性文本,计算图像与描述性文本的对齐损失;基于交叉注意力矩阵对图像特征和文本特征进行多模态融合,得到融合后的图像特征和融合后的文本特征;引入操控引导矩阵对操控区域赋予权重,计算操控引导后的注意力矩阵损失;利用融合后的多模态特征进行检测与定位,计算判别损失、分类损失、图像定位损失和文本定位损失;引入指示引导矩阵对图像中的操控区域进行强调,计算指示引导后的图像判别损失;基于模型总损失对模型进行训练,训练后的模型用于对多模态数据的操控进行检测与定位。本发明提升操控检测与定位的精度和可靠性。
技术关键词
多模态 图像块特征 注意力 分类特征 矩阵 词语 文本编码器 图像编码器 对齐模块 模态特征 检测器 多分类器 指示器 二分类器 人工智能技术 数据 计算机程序产品 处理器
系统为您推荐了相关专利信息
1
演示文档生成方法和装置、电子设备、存储介质
图片 布局特征 文档生成方法 融合特征 注意力
2
基于视觉与传感融合的动态监测与管理平台
动态状态信息 物理传感器 管理策略 随机森林模型 图像特征分类
3
一种三维虹膜重建及展开方法
虹膜纹理 图像深度信息 生物识别身份验证 OCT技术 生成深度图
4
一种微波无创血糖预测方法、装置、设备、介质及产品
无创血糖预测方法 门控循环网络 量子粒子群优化算法 注意力 微波
5
一种维修机构编配设备可替代性评估方法
维修设备 层级 评估指标体系 数学模型 维修保障基地
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号