一种基于文案生成视频的方法、装置、设备及介质

正文

推荐专利

申请号：CN202411477972

申请日期：2024-10-22

公开号：CN119364107A

公开日期：2025-01-24

类型：发明专利

摘要

本发明涉及人工智能领域，公开了一种基于文案生成视频的方法、装置、设备及介质，包括：通过获取待生成视频文案，并通过预设语义理解模型提取对应的关键语义特征，通过预设语音转换模型将待生成视频文案转换为对应的音频数据，并采用文本到语音算法对音频数据标记时间戳，将关键语义特征与预设素材库进行匹配获取图片素材，并生成带有时间戳的图文视频，采用预设动态谈话人脸视频模型对音频数据进行预设口型同步渲染，生成带有时间戳的虚拟人视频，根据图文视频的时间戳与虚拟人视频的时间戳，合并图文视频与虚拟人视频，生成最终视频并上传，解决了目前由于过于模板化的视频生成无法满足不同客户的需求，影响了客户体验的技术问题。

技术关键词

视频语义理解模型语义特征图文语音算法声学特征音频特征人脸可读存储介质文本动态脸部特征处理器生成算法标记注意力机制数据模块

系统为您推荐了相关专利信息

一种基于边缘信息辅助双光谱融合的目标检测方法

特征提取模块多光谱可见光 sigmoid函数注意力

一种基于深度学习的会议大屏音视频自优化方法和系统

音视频分布式麦克风阵列 PID控制器人脸关键点参数

基于追踪的眼前节影像处理方法和系统、设备及介质

影像加权特征编码特征结构三维模型数据

一种基于深度学习的普通话发音评估系统

发音视频特征向量运动特征评估系统曲线

一种基于多模态MRI脑肿瘤图像的自动分割系统及方法

脑肿瘤图像自动分割系统多模态模态特征卷积模块

一种基于文案生成视频的方法、装置、设备及介质

站点导航

APP 下载