一种图像摘要生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
一种图像摘要生成方法、装置、设备及存储介质
申请号:CN202410869644
申请日期:2024-06-28
公开号:CN118861347A
公开日期:2024-10-29
类型:发明专利
摘要
本申请涉及图像摘要技术领域,提供一种图像摘要生成方法、装置、设备及存储介质,其中,方法包括:获取待处理图像和待处理图像对应的文本信息;基于特征提取模型,对待处理图像进行边缘检测、空间频域处理和像素点梯度方向统计,得到待处理图像的图像特征向量;基于语义提取模型,提取待处理图像对应的文本信息的语义向量;根据图像特征向量与语义向量,生成图像摘要。本申请考虑了图像特征和文本信息的关联性,以提高生成摘要的准确性。以医疗领域为例,通过本申请的方法提取医学图像的图像特征向量,以及提取每个医学影像中有关于解析医学影像的文本信息的语义向量,可以生成准确性较高的疾病诊断的摘要,从而帮助医生更快速地做出医疗诊断。
技术关键词
图像摘要生成方法 图像特征向量 语义向量 梯度直方图 特征提取模型 训练神经网络 边缘检测 文本 双向长短期记忆网络 模板匹配识别方法 像素点 光学字符识别方法 多模态 预训练模型 摘要生成装置 计算机设备 摘要技术
系统为您推荐了相关专利信息
1
一种交通基础设施的异常检测方法、系统、介质和设备
多模态 语义向量 异常检测方法 注意力 热力图
2
基于大语言模型与图对比学习的电商个性化推荐系统及方法
个性化推荐系统 大语言模型 消息传递机制 生成上下文感知 语义结构
3
一种基于智慧城市的交通智能疏导方法及系统
交通设施 车辆运动轨迹 交通特征 语义向量 交通智能疏导方法
4
一种基于CLIP和多模态掩码提示学习的面部动作单元识别的方法
面部动作单元识别 图像编码器 文本编码器 局部细节特征 视觉
5
一种基于意图到问题模型的动态用户画像生成系统及方法
画像生成方法 增量更新 多模态响应 语义向量 画像生成系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号