视频生成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510850716

申请日期：2025-06-24

公开号：CN120856951A

公开日期：2025-10-28

类型：发明专利

摘要

本发明实施例涉及一种视频生成方法、装置、计算机设备及存储介质，通过针对训练样本集合中的多个目标文本和对应的目标视频计算全局语义相似度、局部语义相似度矩阵和时序语义相似度，以用于计算综合对比学习损失函数；根据目标文本和对应的文本语义结构表示、以及目标视频和对应的视频语义结构表示计算语义保持对比损失函数；根据综合对比学习损失函数和语义保持对比损失函数计算总损失函数；根据总损失函数对目标模型进行训练。由此，可以通过融合全局、局部与时序语义相似度构建综合对比学习损失函数，并结合语义结构保持机制，引入语义保持对比损失，实现多层次、结构化的语义对齐，增强了文本驱动视频生成的准确性与可控性。

技术关键词

语义结构视频生成方法文本时序特征计算机设备矩阵视频生成装置融合全局生成程序样本处理器模块多层次存储器参数机制

系统为您推荐了相关专利信息

一种基于情感交互的上肢运动康复系统

运动康复系统上肢康复机器人上肢康复训练大语言模型视觉交互设备

基于跨领域迁移学习的新能源车保费预测方法、装置、计算机设备及存储介质

新能源车燃油车数据训练特征融合计算机设备

基于物理约束嵌入的机器人控制方法、装置、设备及介质

机器人控制方法物理多模态特征知识图谱构建机器人控制装置

一种多模态多视角目标检测及匹配方法及系统

编码特征多视角深度特征融合多模态图像编码器

基于多源数据融合的冰冻圈流域水文预测方法及系统

多层感知机门控循环单元数据融合特征气象

视频生成方法、装置、计算机设备及存储介质

站点导航

APP 下载