图像描述方法、装置、设备及计算机可读存储介质

AITNT
正文
推荐专利
图像描述方法、装置、设备及计算机可读存储介质
申请号:CN202411446380
申请日期:2024-10-16
公开号:CN119339378A
公开日期:2025-01-21
类型:发明专利
摘要
本申请公开了一种图像描述方法、装置、设备及计算机可读存储介质,本申请涉及人工智能技术领域,该方法包括:基于预设的待描述特征对原始图像数据进行描述,得到初始描述文本,其中,初始描述文本表征所述原始图像数据中待描述特征对应的描述信息;从预设的五感法维度上对初始描述文本进行语义增强处理,得到增强描述文本,其中,五感法维度包括视觉维度、触觉维度、听觉维度、味觉维度和嗅觉维度;基于初始描述文本和增强描述文本生成原始图像数据的综合描述信息。本申请能够提升多模态大模型在跨模态生成任务中的性能。
技术关键词
原始图像数据 文本 语义 可读存储介质 自然语言理解 图文 听觉 大语言模型 人工智能技术 指令 计算机 视觉 处理器 关系 多模态 基础 存储器
系统为您推荐了相关专利信息
1
一种沙箱在线调试方法、装置、设备及存储介质
在线调试方法 展示平台 接口 沙箱 编程
2
话单数据的处理方法、装置、设备、存储介质及程序产品
资源 格式 对象 号码 无监督学习
3
一种多轴数控铣床自动编程系统
刀具路径 多轴数控铣床 自动编程系统 后处理模块 关联关系分析
4
教学互动抢答定位方法、装置、计算机设备及存储介质
定位方法 短时傅里叶变换 关键帧 计算机可读指令 教学
5
轮式机器人通信网络动态负载均衡方法、装置及设备
轮式机器人 动态负载均衡方法 QoS指标 动态负载均衡装置 实时通信
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号