视频描述信息的生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
视频描述信息的生成方法、装置、设备及存储介质
申请号:CN202510947145
申请日期:2025-07-09
公开号:CN120499467B
公开日期:2025-09-16
类型:发明专利
摘要
本公开关于一种视频描述信息的生成方法、装置、设备及存储介质,该方法包括:确定待分析对象在待分析视频中的运动变化信息;运动变化信息用于指示待分析视频中的对象动作变化的物理属性;将待分析视频和包括运动变化信息的第一提示信息输入至大语言模型,获得大语言模型输出的运动事件表示;第一提示信息用于引导大语言模型对待分析视频进行至少一个语义层次的运动解析,以生成结构化的运动表示;将待分析视频和包括运动事件表示的第二提示信息输入至视频描述模型,获得视频描述信息;第二提示信息用于引导视频描述模型针对待分析视频生成肢体级别的运动描述。本公开提升了视频描述信息的生成效率和准确度。
技术关键词
对象 姿态估计 大语言模型 角速度信息 骨骼关键点 运动速度信息 生成方法 频域特征 语义 物理 电子设备 可读存储介质 视频帧 处理器 关节 生成装置 元素 指令
系统为您推荐了相关专利信息
1
大语言模型长文本外推方法、装置、电子设备及存储介质
大语言模型 外推方法 注意力机制 文本 滑动窗口
2
基于自然语言的复杂室内场景生成方法及系统
房屋框架结构 场景生成方法 自然语言 房间 词嵌入向量
3
一种基于历史修订痕迹的合同审查逻辑自动生成方法及系统
自动生成系统 逻辑 自动生成方法 清单管理 企业合同管理系统
4
多账号设备使用方法、车辆多账号使用方法及相关装置
账号 数据访问 标识 转化算法 进程
5
一种基于多模态大语言模型的施工现场安全检查方法
安全检查方法 大语言模型 施工现场 视觉感知系统 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号