摘要
本公开涉及图像处理技术领域,尤其涉及一种视频图像描述文本的生成方法、装置和存储介质,方法包括:对待描述视频进行抽帧处理和切割处理得到至少一帧待描述图像和至少一个待描述子视频;对待描述图像和待描述子视频均进行人脸检测处理,得到人脸检测结果;对待描述图像进行图片描述处理得到第一图像描述文本,对待描述子视频进行视频描述处理得到第一视频描述文本;针对目标待描述图像,将包含目标待描述图像的待描述子视频确定为目标待描述子视频;根据人脸检测结果,将目标待描述子视频的第一视频描述文本融合至目标待描述图像的第一图像描述文本中,得到目标待描述图像的图像描述文本。本公开实施例能够提高生成视频图像描述文本的准确性。
技术关键词
文本
生成方法
人脸
关键词
标识
生成视频图像
计算机程序产品
上存储计算机程序
图片
图像处理模块
可读存储介质
图像处理技术
处理器
生成装置
语义
存储器
电子设备
系统为您推荐了相关专利信息
局部优化算法
路径规划系统
坐标系
路径规划方法
障碍物