文生视频方法、装置、计算机设备和存储介质

正文

推荐专利

申请号：CN202510880805

申请日期：2025-06-27

公开号：CN120856953A

公开日期：2025-10-28

类型：发明专利

摘要

本申请涉及一种文生视频方法、装置、计算机设备和存储介质。所述方法包括：通过将样本视频分割成多个语义连贯的视频片段后，对每个视频片段进行说话对象检测，筛选出包含有清晰可见说话对象的视频片段作为筛选片段，以确保参与模型训练的人脸样本清晰度较高、人脸姿态自然，避免了传统数据集中的人脸闪烁问题，并针对筛选片段中的说话对象进行人脸占比的调整得到裁剪片段，确保所有样本视频中人脸比例的一致性，避免传统数据集中人脸过大或过小，更符合实际应用场景，利用裁剪片段和说话对象的音频数据来参与文生视频模型的训练，以确保说话对象的口型可以与音频同步，令训练后的文生视频模型针对文生视频请求生成的视频内容中人脸表现良好。

技术关键词

人脸图像序列人脸姿态对象识别模型人脸特征样本语义视频帧计算机设备音频特征人脸检测算法滑动窗口裁剪模块追踪算法视频装置

系统为您推荐了相关专利信息

用于复合冲压模具的优化加工方法及系统

压力控制参数复合冲压模具系统误差模型训练样本集分析模块

一种用于自动驾驶赛车的轨迹引导强化学习方法

网络转向角轨迹强化学习方法参数

一种元件装配异常检测方法

检测元件字符识别模型异常检测方法图像计算机视觉技术

一种切削加工参数优化方法、装置、设备及存储介质

参数优化方法机器学习模型粒子群优化算法数据样本

一种水环境水质状态感知与预测方法、装置、设备及介质

模糊神经网络模型重构误差生化需氧量变量环境监测站

文生视频方法、装置、计算机设备和存储介质

站点导航

APP 下载