基于关键步骤的人类技能视频生成方法、设备及介质

AITNT
正文
推荐专利
基于关键步骤的人类技能视频生成方法、设备及介质
申请号:CN202510117823
申请日期:2025-01-24
公开号:CN120166236A
公开日期:2025-06-17
类型:发明专利
摘要
基于关键步骤的人类技能视频生成方法、设备及介质,首先,利用多模态大语言模型结合检索机制生成关键步骤描述;其次,通过关键步骤图像生成器处理关键步骤间的不连续性,生成关键步骤图像;最后,利用视频生成模型基于描述和关键步骤图像生成具有高时间一致性的视频片段。本发明提出了一种创新的视频生成方法,用于解决人类复杂技能生成的难题。本发明通过引入关键步骤技能生成任务,简化了人类技能视频的生成过程,以初始状态图和技能描述为输入,生成技能完成所需关键步骤的视频片段,而完整技能视频。本发明能为人类技能学习和智能体经验积累提供有力支撑,同时推动复杂技能生成领域的研究与应用发展。
技术关键词
视频生成方法 图像生成器 视频生成模型 人类 解码器 文本编码器 图像编码器 场景 颜色直方图特征 生成视频序列 大语言模型 视频生成设备 预测特征 计算机可执行程序 生成工作 语义 数据
系统为您推荐了相关专利信息
1
一种语义分割网络和语义分割方法
融合特征 语义分割网络 特征提取单元 语义分割方法 上采样
2
一种基于变分自编码器的轴承小样本数据扩充方法及系统
数据扩充方法 编码器 粒子群算法优化 高斯混合模型 协方差矩阵
3
基于图像表型匹配的大豆表型识别方法、电子设备、介质
图像编码器 表型特征 大豆 识别方法 解码器
4
语音识别方法、装置、计算机设备及存储介质
语音识别模型 语音识别方法 计算机可读指令 预训练模型 计算机设备
5
一种柔性电路板缺陷检测方法、装置、设备以及存储介质
柔性电路板 轮廓信息 缺陷检测方法 卷积特征 缺陷类别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号