一种基于语义驱动Transformer模型的弱监督目标定位方法

正文

推荐专利

申请号：CN202411674602

申请日期：2024-11-21

公开号：CN119648788A

公开日期：2025-03-18

类型：发明专利

摘要

本发明公开了一种基于语义驱动Transformer模型的弱监督目标定位方法，包括以下步骤：S1、对待检测的图片进行预处理，用于将待检测的图片转换为适合神经网络处理的格式；S2、将预处理后待检测的图片及其对应的图片级别的标签送入神经网络；所述神经网络包括Transformer主干网络、语义内核集成模块SKI和语义增强适配模块SBA；S3、神经网络对图片进行处理，在训练过程中输出待检测图片对应每一个类别的概率数值；S4、在测试过程中输出待检测图片预测的框的坐标、类别和得分；本发明通过使注意力图更加专注于前景区域，在弱监督环境下实现了更精确的、语义感知的目标定位，从而提高了模型的解释精度和相关性。

技术关键词

语义图片定位方法集成模块预训练模型文本编码器图像编码器内核标签热力图对象网络分类器注意力度函数核心样本

系统为您推荐了相关专利信息

基于AI分身虚拟数字人实时交互系统及使用方法

交互系统语音识别模块文本对照数据库自动语音识别

一种煤矿安全数据综合分析预警系统

分析预警系统模型训练模块可视化模块风险预测模型多源异构数据

三维点云语义分割与测量基准面智能拟合系统及其方法

拟合系统基准面三维点云数据语义标签特征提取模块

基于WebGis地图实现CAD红线图标注方法、系统、设备及介质

瓦片地图标注方法地图瓦片图片计算机制图技术

一种基于BIM技术的工程协同设计方法及系统

工程协同设计方法 BIM技术多源异构数据高风险支护结构

一种基于语义驱动Transformer模型的弱监督目标定位方法

站点导航

APP 下载