基于智能数字人模型的直播推流方法

AITNT
正文
推荐专利
基于智能数字人模型的直播推流方法
申请号:CN202510055273
申请日期:2025-01-14
公开号:CN119946313A
公开日期:2025-05-06
类型:发明专利
摘要
基于智能数字人模型的直播推流方法,采用前端部分实时采集用户的语音进行识别,完成将语言转化为文字的识别,识别成功后发送至推流接口,通过推流接口获取对话ID并创建子线程,子线程内调用语音合成接口将回复文本转为语音,完成实时生成语音并结合语音和预处理,生成语音匹配的视频画面,视频流再通过RTMP服务器实时推送至前端部分,有效的完成直播推流技术与智能人机交互系统的结合,实现用户通过自然的语音交互方式,获取实时的影像回应,从而大幅增强用户体验,提升了用户的交互体验,且当用户想要终止回答时,可以通过终止推流接口操作,及时停止视频的推送,避免了不必要的资源浪费。
技术关键词
直播推流方法 文本 智能人机交互系统 接口 直播推流技术 视频流 神经网络模型 生成语音 语音交互方式 人物模型 实时语音 接收前端 服务器 中子 数据 画面 影像 资源
系统为您推荐了相关专利信息
1
一种基于关系子图交互的多模态对话动态情感识别方法
模态特征 动态情感识别方法 多模态对话 节点 听觉
2
工单生成方法、装置、设备、存储介质及程序产品
情感特征 计算机执行指令 工单生成方法 模板 生成业务
3
一种显示转接装置及显示系统
板对板连接器 转接装置 主机连接器 Type‑C接口 电源转换器
4
多USB接口的具有USB模式切换功能的系统、多USB接口装置、车辆和设备
模式切换功能 USB接口模块 电信号 USB集线器 切换开关
5
用于训练规划模型的计算机实现的方法和系统
规划 模拟训练场景 模拟模型 交通 计算机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号