视频生成方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
视频生成方法、装置、电子设备及存储介质
申请号:CN202510984025
申请日期:2025-07-17
公开号:CN120475234B
公开日期:2025-10-31
类型:发明专利
摘要
本公开关于一种视频生成方法、装置、电子设备及存储介质,方法包括:获取当前特征序列;在当前输出帧为首个视频帧,将当前特征序列输入至大语言模型,获得当前输出帧的隐式视频特征;以及,将当前输出帧的隐式视频特征输入至扩散模型,输出当前输出帧的视频帧编码,并根据当前输出帧的视频帧编码,生成当前输出帧的视频帧图像;在当前输出帧为任一非首个视频帧,将扩散模型输出的,当前输出帧的上一个输出帧的视频帧编码,作为当前输出帧的视频帧特征,并将当前输出帧的视频帧特征添加至当前特征序列中,得到更新后特征序列,将更新后特征序列作为当前特征序列;重复前述步骤,生成当前输出帧的视频帧图像,提高了视频生成质量。
技术关键词
视频帧特征 视频生成方法 序列 大语言模型 噪声图像 电子设备 噪声级别 对象 计算机程序产品 视频生成装置 处理器 可读存储介质 编码器 指令 多模态
系统为您推荐了相关专利信息
1
一种未登录地名发现与空间位置推理方法及相关装置
推理方法 地理实体 序列标注模型 图谱 关系
2
一种基于贝叶斯模型和深度学习的脑电磁脑源成像系统
贝叶斯模型 电磁 概率生成模型 精度 数据生成模型
3
非标资产现金流预测的机器学习估值模型的链上定价方法
定价方法 资产 多源异构数据 集成机器学习 非结构化文本
4
一种基于人工智能的用于电视棒的语音识别方法及系统
语音识别方法 电视棒 构建语音识别模型 指令推理 离散余弦变换
5
非玩家角色的播报方法、装置、设备、介质及产品
非玩家角色 环境感知信息 三维虚拟环境 自然语言 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号