摘要
本发明公开了一种支撑街区场景的语义变化检测方法和系统,属于人工智能图像理解技术领域;包括:分析街区场景地理要素关系,构建时序街景变化检测数据集;基于Visual Genome数据集训练Transformer单阶段场景图生成模型,提取视觉、语义与空间特征;结合自建街景影像数据集,微调场景图生成模型以适应街区场景;输入不同时相街景影像,进行目标检测与关系建模,推断实体锚框坐标,生成含推断结果的JSON文件;基于提取的主‑谓‑宾三元组及空间锚框,构建图像空间知识图谱;通过节点对齐、图差分、相似度计算和图可视化,实现街景语义变化检测。本发明优势在于以图方式直观呈现街景变化,有效提升街区环境语义变化的实时、准确、全面监测与分析能力。
技术关键词
语义变化检测方法
街区场景
街景
节点
三元组
影像
训练场景
坐标
注意力机制
实体
图像
关系建模
前馈神经网络
解码器
标注工具
编码器
视觉特征
系统为您推荐了相关专利信息
风险动态评估方法
电力物资管理
深度强化学习模型
风险评估模型
计算机可执行指令
人机协同
节点
交互方法
多通道交互系统
多通道人机交互