基于关键步骤的人类技能视频生成方法、设备及介质

正文

推荐专利

申请号：CN202510117823

申请日期：2025-01-24

公开号：CN120166236A

公开日期：2025-06-17

类型：发明专利

摘要

基于关键步骤的人类技能视频生成方法、设备及介质，首先，利用多模态大语言模型结合检索机制生成关键步骤描述；其次，通过关键步骤图像生成器处理关键步骤间的不连续性，生成关键步骤图像；最后，利用视频生成模型基于描述和关键步骤图像生成具有高时间一致性的视频片段。本发明提出了一种创新的视频生成方法，用于解决人类复杂技能生成的难题。本发明通过引入关键步骤技能生成任务，简化了人类技能视频的生成过程，以初始状态图和技能描述为输入，生成技能完成所需关键步骤的视频片段，而完整技能视频。本发明能为人类技能学习和智能体经验积累提供有力支撑，同时推动复杂技能生成领域的研究与应用发展。

技术关键词

视频生成方法图像生成器视频生成模型人类解码器文本编码器图像编码器场景颜色直方图特征生成视频序列大语言模型视频生成设备预测特征计算机可执行程序生成工作语义数据

系统为您推荐了相关专利信息

一种语义分割网络和语义分割方法

融合特征语义分割网络特征提取单元语义分割方法上采样

一种基于变分自编码器的轴承小样本数据扩充方法及系统

数据扩充方法编码器粒子群算法优化高斯混合模型协方差矩阵

基于图像表型匹配的大豆表型识别方法、电子设备、介质

图像编码器表型特征大豆识别方法解码器

语音识别方法、装置、计算机设备及存储介质

语音识别模型语音识别方法计算机可读指令预训练模型计算机设备

一种柔性电路板缺陷检测方法、装置、设备以及存储介质

柔性电路板轮廓信息缺陷检测方法卷积特征缺陷类别

基于关键步骤的人类技能视频生成方法、设备及介质

站点导航

APP 下载