摘要
本公开提供了基于数字人的直播图像生成方法、装置及电子设备,涉及计算机技术领域,尤其涉及人工智能、计算机视觉、增强现实、自然语言处理、大模型、数字直播等技术领域。具体实现方案为:获取目标场景的人流信息、设置于目标场景下的交互设备的操作数据、场景环境图像和环境质量信息中的至少一种第一监测信息;根据第一监测信息生成目标提示词;将目标提示词输入语言模型中,得到语言模型输出的讲解内容;根据讲解内容,生成数字人的第一直播图像;对场景环境图像和数字人的第一直播图像进行融合,以得到数字人直播场景的第二直播图像。
技术关键词
场景
图像生成方法
情绪状态信息
融合策略
画面
数据处理方式
交互设备
风格
图像生成装置
视觉
特色
电子设备
处理器
分词
文本
直播平台
计算机程序产品
系统为您推荐了相关专利信息
仿真测试方法
交通流
计算机程序指令
车辆行驶信息
仿真测试装置
智能控制组件
储电装置
发电技术
储能组件
发电组件