摘要
本公开关于一种视频描述信息的生成方法、装置、设备及存储介质,该方法包括:确定待分析对象在待分析视频中的运动变化信息;运动变化信息用于指示待分析视频中的对象动作变化的物理属性;将待分析视频和包括运动变化信息的第一提示信息输入至大语言模型,获得大语言模型输出的运动事件表示;第一提示信息用于引导大语言模型对待分析视频进行至少一个语义层次的运动解析,以生成结构化的运动表示;将待分析视频和包括运动事件表示的第二提示信息输入至视频描述模型,获得视频描述信息;第二提示信息用于引导视频描述模型针对待分析视频生成肢体级别的运动描述。本公开提升了视频描述信息的生成效率和准确度。
技术关键词
对象
姿态估计
大语言模型
角速度信息
骨骼关键点
运动速度信息
生成方法
频域特征
语义
物理
电子设备
可读存储介质
视频帧
处理器
关节
生成装置
元素
指令
系统为您推荐了相关专利信息
房屋框架结构
场景生成方法
自然语言
房间
词嵌入向量
自动生成系统
逻辑
自动生成方法
清单管理
企业合同管理系统
安全检查方法
大语言模型
施工现场
视觉感知系统
文本