图像描述文本的生成方法、装置、电子设备和存储介质

AITNT
正文
推荐专利
图像描述文本的生成方法、装置、电子设备和存储介质
申请号:CN202410796879
申请日期:2024-06-19
公开号:CN118520135A
公开日期:2024-08-20
类型:发明专利
摘要
本公开提供了一种图像描述文本的生成方法,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型技术领域。具体实现方案为:将针对原始图像的视觉处理结果转换为视觉知识文本;根据原始图像以及视觉知识文本,生成原始图像的整图描述文本;根据原始图像的局部图像以及视觉知识文本,生成局部图像的局部描述文本;整合整图描述文本和局部描述文本,得到原始图像的整合描述文本。本公开还提供了一种图像描述文本的生成装置、电子设备和存储介质。
技术关键词
实体 图像 生成方法 文本识别 电子设备 答案 生成装置 模块 人工智能技术 计算机程序产品 合并单元 计算机视觉 处理器通信 指令 冗余 可读存储介质
系统为您推荐了相关专利信息
1
用于生成图像的方法、装置、计算设备和程序产品
图像生成单元 生成提示词 计算机程序产品 处理器 策略
2
一种基于边缘算法的图像处理方法及系统
边缘算法 字符 图像处理方法 车牌 停车场
3
一种基于极大余弦损失的图像目标检测增量学习方法
增量学习方法 样本 蒸馏 教师 标签
4
一种基于多维度的司法大模型生成效果评价体系构建方法
评价体系构建方法 节点 拓扑网络 文本 句法依存关系
5
一种基于情感识别的跨模态音乐自动生成系统及方法
音乐自动生成方法 跨模态 多模态情感识别 音乐自动生成系统 记忆系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号