一种数字人直播视频合成方法及系统

正文

推荐专利

一种数字人直播视频合成方法及系统

申请号：CN202510152783

申请日期：2025-02-11

公开号：CN119922391A

公开日期：2025-05-02

类型：发明专利

摘要

本发明属于图像处理领域，提供一种数字人直播视频合成方法及系统，包括接收用户的多模态数据输入，所述多模态数据包括：语音、文本以及图像；从所述多模态数据中提取关键特征；将所述关键特征进行融合，形成融合条件；利用神经网络模型，根据所述融合条件生成对应的辐射场表示；根据实时输入微调所述辐射场参数；将生成的辐射场转换为视频输出。

技术关键词

视频管理系统资源管理系统用户多模态语音特征提取神经网络模型系统管理模块保障系统数据加密低延迟文本特征提取模块图像处理面部校正参数

系统为您推荐了相关专利信息

基于视觉语言预训练的开放词汇时空动作检测方法及装置

动作检测方法计算机可读取存储介质解析器视觉动作检测装置

时序验证方法、装置、设备、介质及产品

时序验证方法信号视频帧模式可变刷新率

基于Real-ESRGAN和改进YOLOv5的道路小目标检测算法

超分辨率算法模型样本分类方法数据表达式

一种机场安全管理方法及系统

管理方法风险评估模型资源调度优化分级响应机制多源异构数据

一种基于暗光路侧泊车场景的视频语义分割方法及系统

视频语义分割方法泊车场景运动特征事件特征语义分割系统

一种数字人直播视频合成方法及系统

站点导航

APP 下载