基于智能数字人模型的直播推流方法

正文

推荐专利

基于智能数字人模型的直播推流方法

申请号：CN202510055273

申请日期：2025-01-14

公开号：CN119946313A

公开日期：2025-05-06

类型：发明专利

摘要

基于智能数字人模型的直播推流方法，采用前端部分实时采集用户的语音进行识别，完成将语言转化为文字的识别，识别成功后发送至推流接口，通过推流接口获取对话ID并创建子线程，子线程内调用语音合成接口将回复文本转为语音，完成实时生成语音并结合语音和预处理，生成语音匹配的视频画面，视频流再通过RTMP服务器实时推送至前端部分，有效的完成直播推流技术与智能人机交互系统的结合，实现用户通过自然的语音交互方式，获取实时的影像回应，从而大幅增强用户体验，提升了用户的交互体验，且当用户想要终止回答时，可以通过终止推流接口操作，及时停止视频的推送，避免了不必要的资源浪费。

技术关键词

直播推流方法文本智能人机交互系统接口直播推流技术视频流神经网络模型生成语音语音交互方式人物模型实时语音接收前端服务器中子数据画面影像资源

系统为您推荐了相关专利信息

一种基于关系子图交互的多模态对话动态情感识别方法

模态特征动态情感识别方法多模态对话节点听觉

工单生成方法、装置、设备、存储介质及程序产品

情感特征计算机执行指令工单生成方法模板生成业务

一种显示转接装置及显示系统

板对板连接器转接装置主机连接器 Type‑C接口电源转换器

多USB接口的具有USB模式切换功能的系统、多USB接口装置、车辆和设备

模式切换功能 USB接口模块电信号 USB集线器切换开关

用于训练规划模型的计算机实现的方法和系统

规划模拟训练场景模拟模型交通计算机

基于智能数字人模型的直播推流方法

站点导航

APP 下载