摘要
本发明公开了基于视觉编码群的智慧城市感知系统,包括含有若干个功能不同的视觉编码结构的视觉编码群、视觉融合与压缩模块以及大语音模型,视觉融合与压缩模块包括:与每个视觉编码结构对应的用于分别对每个视觉编码特征自适应分配权重值的若干个动态阈值门控网络,用于根据每个视觉编码特征的权重值将若干个视觉编码特征进行融合,输出融合特征的特征融合模块;用于对融合特征进行压缩,输出多尺度图像特征的特征压缩模块以及将多尺度图像特征映射到语言语义空间,得到输入图像特征的多层感知结构。在视觉融合与压缩模块将多个视觉编码特征分配对应的权重,以表示原始推理图片所符合的场景需求,实现动态匹配场景,提高城市事件感知的准确度。
技术关键词
感知系统
特征提取模块
网络结构
图像编码
融合特征
图片
注意力
场景
动态
多尺度特征提取
视觉特征提取
决策
大语言模型
模块结构
系统为您推荐了相关专利信息
精细化管理系统
供电桩
精细化管理方法
密度
特征提取模块
离散小波变换
医学图像分割模型
医学图像分割方法
协同注意力
空间结构信息
电力系统拓扑模型
节点特征
时间序列特征
电力负荷预测方法
深度神经网络
位置隐私保护
数据采集方法
平台
保护位置隐私
群智感知系统