摘要
本公开提供了一种数字人语音交互的处理方法、装置、电子设备和介质,涉及自然语言处理技术领域,尤其涉及语音识别、语义识别、智能体和生成式搜索技术领域。实现方案为:响应于接收到第一音频数据,获取数字人的第一声纹数据,其中,第一音频数据指示用户向数字人发起语音交互请求,第一声纹数据指示数字人当前进行语音播报所使用的声纹数据;响应于接收到第二音频数据,基于第一声纹数据对第二音频数据进行第一降噪处理,得到第三音频数据,其中,接收到第二音频数据的时间在接收到第一音频数据的时间之后;以及响应于根据第三音频数据确定用户发出指示中断语音交互的第一指令,生成停止指令并发送至数字人以控制数字人停止语音播报。
技术关键词
音频
数据
语音识别模型
文本
深度学习网络模型
指令
降噪模块
显示设备
识别模块
电子设备
搜索技术
计算机程序产品
子模块
处理器通信
自然语言
输出模块
系统为您推荐了相关专利信息
多任务学习策略
热力管道
三维有限元模型
物理
应力场
控制点
数字化制作方法
三维口腔扫描仪
贴面
面部特征
色彩校正方法
色彩传感器
Gamma曲线
检测液晶面板
机器学习模型
参数预测方法
效应
地震动参数
场地条件
全球数字高程模型