摘要
基于智能数字人模型的直播推流方法,采用前端部分实时采集用户的语音进行识别,完成将语言转化为文字的识别,识别成功后发送至推流接口,通过推流接口获取对话ID并创建子线程,子线程内调用语音合成接口将回复文本转为语音,完成实时生成语音并结合语音和预处理,生成语音匹配的视频画面,视频流再通过RTMP服务器实时推送至前端部分,有效的完成直播推流技术与智能人机交互系统的结合,实现用户通过自然的语音交互方式,获取实时的影像回应,从而大幅增强用户体验,提升了用户的交互体验,且当用户想要终止回答时,可以通过终止推流接口操作,及时停止视频的推送,避免了不必要的资源浪费。
技术关键词
直播推流方法
文本
智能人机交互系统
接口
直播推流技术
视频流
神经网络模型
生成语音
语音交互方式
人物模型
实时语音
接收前端
服务器
中子
数据
画面
影像
资源
系统为您推荐了相关专利信息
模态特征
动态情感识别方法
多模态对话
节点
听觉
情感特征
计算机执行指令
工单生成方法
模板
生成业务
板对板连接器
转接装置
主机连接器
Type‑C接口
电源转换器
模式切换功能
USB接口模块
电信号
USB集线器
切换开关