摘要
本发明公开了融合多模态数据的城市治理大模型检测方法及系统。方法包括:获取城市街景或城市街区的图片数据,以得到初始图片数据;获取需要检测的问题内容;根据问题内容构建城市管理违规行为的文字描述集合,并使用文本思维链方法处理文字描述集合;对简化后的描述集合进行文本特征提取;对初始图片数据以及文本特征向量进行特征匹配和筛选;对初始图片数据结合匹配结果进行图像特征编码;根据文本特征向量以及图像特征向量进行余弦相似度计算,并转换成问题疑似分数,以确定是否存在城市治理问题。通过实施本发明的方法可解决传统的城市管理解决方案在面临快速变化的城市环境时所显现出的局限性,实现自动识别并处理各类城市管理问题。
技术关键词
文本特征向量
模型检测方法
图像特征向量
图像特征编码
图片
多模态
图像块
深度编码
模型检测系统
Softmax函数
Sigmoid函数
注意力机制
街景
特征提取单元
文本编码器
数据获取单元
图像编码
分词
系统为您推荐了相关专利信息
效率提升方法
文本
多模态
工程量清单
建立映射关系
像素
图像生成方法
皮尔逊相关系数
数据
图像生成装置
预检测方法
特征融合网络
光纤熔接器
高清摄像头
特征提取网络