摘要
本发明涉及一种基于大模型的数字人直播互动方法和系统,属于人工智能技术领域,解决了现有技术中互动质量差和实时性差的问题。基于大模型的数字人直播互动方法包括:根据用户意向配置数字人主播;获取用户发起的互动请求,并实时传输互动内容;通过大模型分析所述互动内容,以生成回复指令;根据所述回复指令生成相匹配的音频内容,并根据音频内容生成带有同步口型的图像序列;对所述图像序列和音频内容进行时序对齐处理后推流至直播平台,以动态调整数字人主播的直播内容。
技术关键词
直播互动方法
直播平台
视频互动
序列
生成音频内容
直播互动系统
动态时间规整算法
图像
指令
分布式队列
时序
骨骼模型
可视化界面
人工智能技术
补偿算法
文本
语音
身份验证
系统为您推荐了相关专利信息
图像检查装置
机器学习模型
图像提取特征
得分计算方法
对象
联邦学习激励方法
通信效率
两阶段
序列二次规划算法
车联网环境
序列
电场
大地电磁信号
数值模拟方法
信号处理方法
机器人专用
摩擦补偿方法
机器人关节
机器人动力学模型
力矩
人声识别方法
语音识别模型
机舱
样本
非瞬时性计算机可读存储介质