用于数字人直播素材的生成方法、装置、系统及电子设备

正文

推荐专利

申请号：CN202510700035

申请日期：2025-05-28

公开号：CN120568086A

公开日期：2025-08-29

类型：发明专利

摘要

本申请公开了一种用于数字人直播素材的生成方法，包括：根据数字人直播素材生成请求，获取用于生成数字人直播素材对应的对象信息数据，所述对象信息数据至少包括文字、图像或视频中的一种；对所述对象信息数据进行多模态理解，并生成直播文案；对所述直播文案的不同部分与相应图像或视频进行匹配，作为第一匹配信息；将所述直播文案转换为语音数据，并生成所述直播文案与时间戳的匹配信息，作为第二匹配信息；将所述语音数据生成唇部驱动视频素材；其中，所述唇部驱动视频素材、第一匹配信息和第二匹配信息作为数字人直播素材。本申请提供的方案能够自动获取素材、切换素材、文案与素材融合，从而提高自动化直播程度、降低开播成本。

技术关键词

生成数字人生成方法视频对象画面渲染方法计算机执行指令计算机程序指令文字转语音模块分段图像大语言模型关系多模态数据获取单元处理器可读存储介质商品特征

系统为您推荐了相关专利信息

一种基于哈希映射的无监督场景相关视频异常检测方法

视频异常检测方法立方体编码器参数条目分类器

基于对称对比学习与轮廓感知的脊柱侧弯辅助筛查方法

语义特征轮廓边缘样本编解码器网络

一种自适应头皮脑电运动想象信号识别方法及相关装置

头皮脑电信号识别方法分类器原始脑电信号预训练模型

基于局部信息的对抗点云的生成方法、装置、介质及设备

协方差矩阵坐标生成方法特征值度量

一种训练数据集版本管理方法及系统

版本管理方法对象快照版本管理系统哈希算法

用于数字人直播素材的生成方法、装置、系统及电子设备

站点导航

APP 下载