视频描述信息的生成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510947145

申请日期：2025-07-09

公开号：CN120499467B

公开日期：2025-09-16

类型：发明专利

摘要

本公开关于一种视频描述信息的生成方法、装置、设备及存储介质，该方法包括：确定待分析对象在待分析视频中的运动变化信息；运动变化信息用于指示待分析视频中的对象动作变化的物理属性；将待分析视频和包括运动变化信息的第一提示信息输入至大语言模型，获得大语言模型输出的运动事件表示；第一提示信息用于引导大语言模型对待分析视频进行至少一个语义层次的运动解析，以生成结构化的运动表示；将待分析视频和包括运动事件表示的第二提示信息输入至视频描述模型，获得视频描述信息；第二提示信息用于引导视频描述模型针对待分析视频生成肢体级别的运动描述。本公开提升了视频描述信息的生成效率和准确度。

技术关键词

对象姿态估计大语言模型角速度信息骨骼关键点运动速度信息生成方法频域特征语义物理电子设备可读存储介质视频帧处理器关节生成装置元素指令

系统为您推荐了相关专利信息

大语言模型长文本外推方法、装置、电子设备及存储介质

大语言模型外推方法注意力机制文本滑动窗口

基于自然语言的复杂室内场景生成方法及系统

房屋框架结构场景生成方法自然语言房间词嵌入向量

一种基于历史修订痕迹的合同审查逻辑自动生成方法及系统

自动生成系统逻辑自动生成方法清单管理企业合同管理系统

多账号设备使用方法、车辆多账号使用方法及相关装置

账号数据访问标识转化算法进程

一种基于多模态大语言模型的施工现场安全检查方法

安全检查方法大语言模型施工现场视觉感知系统文本

视频描述信息的生成方法、装置、设备及存储介质

站点导航

APP 下载