一种自然场景图像描述生成方法及系统

AITNT
正文
推荐专利
一种自然场景图像描述生成方法及系统
申请号:CN202410718322
申请日期:2024-06-05
公开号:CN118298431B
公开日期:2024-08-13
类型:发明专利
摘要
本发明公开了一种自然场景图像描述生成方法及系统,属于计算机视觉以及自然语言处理技术领域。本发明采用融合注意力机制的编码器‑解码器架构设计图像描述模型,构建基于向量梯度非均匀正则化的图像特征编码模块,增强图像中目标之间互动关系的准确性;构建基于特征贡献和标准差控制优化的文本特征解码模块,提高捕捉图像视觉信息的完整性和图像描述技术在各种场景下的泛化能力和适应性。本发明能够提升面向自然场景的图像描述的准确性、多样性和通用性,从而生成高精度、信息丰富和鲁棒性强的自然语言描述。
技术关键词
自然场景图像 图像特征编码 文本特征向量 聚类特征提取 生成方法 多尺度 图像特征向量 解码模块 解码模型 特征提取模块 融合注意力机制 拉普拉斯金字塔 执行矩阵乘法 融合图像特征 生成自然语言
系统为您推荐了相关专利信息
1
军事想定生成方法、系统、设备及可读存储装置
军事 神经网络模型 生成方法 模版 文本
2
一种基于大语言模型的机器视觉解决方案自动生成方法
大语言模型 自动生成系统 工作流引擎 自动生成方法 视觉
3
基于随机采集的电商平台销售方案生成方法及系统
数据采集服务器 认证服务器 客户端 审核服务器 标识
4
一种基于自适应模糊聚集策略和改进分散搜索算法的机器人路径规划方法
分散搜索算法 机器人路径规划方法 初始化方法 聚类 策略
5
大语言模型的生成方法、装置、设备以及存储介质
大语言模型 文本 生成方法 参数 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号