视频图像描述文本的生成方法、装置和存储介质

AITNT
正文
推荐专利
视频图像描述文本的生成方法、装置和存储介质
申请号:CN202510632280
申请日期:2025-05-16
公开号:CN120689916A
公开日期:2025-09-23
类型:发明专利
摘要
本公开涉及图像处理技术领域,尤其涉及一种视频图像描述文本的生成方法、装置和存储介质,方法包括:对待描述视频进行抽帧处理和切割处理得到至少一帧待描述图像和至少一个待描述子视频;对待描述图像和待描述子视频均进行人脸检测处理,得到人脸检测结果;对待描述图像进行图片描述处理得到第一图像描述文本,对待描述子视频进行视频描述处理得到第一视频描述文本;针对目标待描述图像,将包含目标待描述图像的待描述子视频确定为目标待描述子视频;根据人脸检测结果,将目标待描述子视频的第一视频描述文本融合至目标待描述图像的第一图像描述文本中,得到目标待描述图像的图像描述文本。本公开实施例能够提高生成视频图像描述文本的准确性。
技术关键词
文本 生成方法 人脸 关键词 标识 生成视频图像 计算机程序产品 上存储计算机程序 图片 图像处理模块 可读存储介质 图像处理技术 处理器 生成装置 语义 存储器 电子设备
系统为您推荐了相关专利信息
1
视频会议多模态实时摘要生成方法
摘要生成方法 多模态 场景特征 文本 语义特征
2
基于自适应局部优化算法的穿刺针路径规划方法及系统
局部优化算法 路径规划系统 坐标系 路径规划方法 障碍物
3
语言幻觉检测模型的生成方法、装置及电子设备
大语言模型 文本 数据 标签 生成方法
4
基于多模态大模型的图文信息抽取方法、系统及存储介质
信息抽取方法 图文 多模态 表格 多任务
5
基于语义检索的文本问答方法、系统、电子设备及介质
问答方法 文本 语义 大语言模型 图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号