数字人语音交互的处理方法、装置、电子设备和介质

正文

推荐专利

申请号：CN202411613352

申请日期：2024-11-12

公开号：CN119495298B

公开日期：2025-09-23

类型：发明专利

摘要

本公开提供了一种数字人语音交互的处理方法、装置、电子设备和介质，涉及自然语言处理技术领域，尤其涉及语音识别、语义识别、智能体和生成式搜索技术领域。实现方案为：响应于接收到第一音频数据，获取数字人的第一声纹数据，其中，第一音频数据指示用户向数字人发起语音交互请求，第一声纹数据指示数字人当前进行语音播报所使用的声纹数据；响应于接收到第二音频数据，基于第一声纹数据对第二音频数据进行第一降噪处理，得到第三音频数据，其中，接收到第二音频数据的时间在接收到第一音频数据的时间之后；以及响应于根据第三音频数据确定用户发出指示中断语音交互的第一指令，生成停止指令并发送至数字人以控制数字人停止语音播报。

技术关键词

音频数据语音识别模型文本深度学习网络模型指令降噪模块显示设备识别模块电子设备搜索技术计算机程序产品子模块处理器通信自然语言输出模块

系统为您推荐了相关专利信息

一种基于DFEM与PINNs的热力管道泄漏检测方法

多任务学习策略热力管道三维有限元模型物理应力场

一种基于多模态大模型的复合场景多摄安保系统

安保系统多模态数据采集风险场景因子

一种诊断蜡型数字化制作方法、系统、产品及介质

控制点数字化制作方法三维口腔扫描仪贴面面部特征

一种液晶面板的色彩校正方法及系统

色彩校正方法色彩传感器 Gamma曲线检测液晶面板机器学习模型

一种考虑复杂地形效应的地震动强度参数预测方法

参数预测方法效应地震动参数场地条件全球数字高程模型

数字人语音交互的处理方法、装置、电子设备和介质

站点导航

APP 下载