摘要
本申请公开了一种数字人直播方法、装置、设备及存储介质,涉及人工智能技术领域,包括:基于待直播商品的关键词向量在预设向量数据库中进行匹配,得到关键词匹配信息,基于关键词匹配信息与预设提示词模板生成文案;利用语音合成模型并基于文案生成第一语音流,利用数字人模型并基于第一语音流和初始数字人形象生成第一视频帧,并将第一语音流与第一视频帧发送至显示设备;判断用户评论是否满足预设条件,若满足,则基于用户评论的评论向量进行匹配,处理得到的评论匹配信息与用户评论,得到评论答案,并利用语音合成模型基于评论答案生成第二语音流,利用数字人模型基于第二语音流生成第二视频帧。这样能够提高数字人直播效率。
技术关键词
关键词
直播方法
视频帧
生成文案
生成数字人
显示设备
编码
答案
语义
全局特征提取
局部特征提取
直播装置
模板
克隆技术
人工智能技术
生成语音
风格
注意力机制
系统为您推荐了相关专利信息
自动分配方法
CRM系统
分析模块
关键词
优劣解距离法
大语言模型
分析仪器
人机交互方法
知识图谱数据库
意图
变电站光缆
识别方法
应力
误差系数
计算机执行指令
虚拟演播厅
影像生成方法
骨骼关键点
影像生成系统
矩阵