图像描述方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
图像描述方法、装置、电子设备及存储介质
申请号:CN202510332968
申请日期:2025-03-20
公开号:CN120495831A
公开日期:2025-08-15
类型:发明专利
摘要
本申请提供了一种图像描述方法、装置、电子设备及存储介质,涉及图像处理领域。其中,该方法包括:获取目标图像和目标图像中的至少一个目标子图像;目标图像与各目标子图像携带相同的文本提示;文本提示是对目标图像的内容进行提示;对目标图像和各目标子图像进行特征提取和特征融合,得到目标特征;在文本提示的引导下,利用扰动注意力优化机制,对目标特征进行迭代处理,生成多个令牌信息;根据各令牌信息进行文本生成,输出文本描述信息;文本描述信息用于描述目标图像的内容。本申请解决了相关技术中图像描述的准确率不高的问题。
技术关键词
令牌 注意力 文本 键值 电子设备 图像获取模块 大语言模型 机制 图像分割 处理器 图像处理 蒸馏 存储器 分辨率 密度 解码
系统为您推荐了相关专利信息
1
一种电力负面清单数据的分类方法及系统
分布特征 数据分布 分类方法 样本 支持向量机模型
2
融合标签混淆和拼音信息的中文文本分类方法
中文文本分类方法 融合标签 拼音 标签编码器 特征提取网络
3
一种智能车辆碰撞风险趋势预测方法及系统
轨迹 趋势预测方法 补丁 风险 意图
4
一种基于合作博弈和自适应学习的分布式无功资源协调方法
资源协调方法 收集设备 偏差 处理器 电流
5
基于BiLSTM Multi-Head Attention的拉曼光谱分类方法
深度学习分类模型 分类方法 注意力机制 拉曼光谱数据 时序特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号