数字人语音交互的处理方法、装置、电子设备和介质

AITNT
正文
推荐专利
数字人语音交互的处理方法、装置、电子设备和介质
申请号:CN202411613352
申请日期:2024-11-12
公开号:CN119495298B
公开日期:2025-09-23
类型:发明专利
摘要
本公开提供了一种数字人语音交互的处理方法、装置、电子设备和介质,涉及自然语言处理技术领域,尤其涉及语音识别、语义识别、智能体和生成式搜索技术领域。实现方案为:响应于接收到第一音频数据,获取数字人的第一声纹数据,其中,第一音频数据指示用户向数字人发起语音交互请求,第一声纹数据指示数字人当前进行语音播报所使用的声纹数据;响应于接收到第二音频数据,基于第一声纹数据对第二音频数据进行第一降噪处理,得到第三音频数据,其中,接收到第二音频数据的时间在接收到第一音频数据的时间之后;以及响应于根据第三音频数据确定用户发出指示中断语音交互的第一指令,生成停止指令并发送至数字人以控制数字人停止语音播报。
技术关键词
音频 数据 语音识别模型 文本 深度学习网络模型 指令 降噪模块 显示设备 识别模块 电子设备 搜索技术 计算机程序产品 子模块 处理器通信 自然语言 输出模块
系统为您推荐了相关专利信息
1
一种基于DFEM与PINNs的热力管道泄漏检测方法
多任务学习策略 热力管道 三维有限元模型 物理 应力场
2
一种基于多模态大模型的复合场景多摄安保系统
安保系统 多模态数据采集 风险 场景 因子
3
一种诊断蜡型数字化制作方法、系统、产品及介质
控制点 数字化制作方法 三维口腔扫描仪 贴面 面部特征
4
一种液晶面板的色彩校正方法及系统
色彩校正方法 色彩传感器 Gamma曲线 检测液晶面板 机器学习模型
5
一种考虑复杂地形效应的地震动强度参数预测方法
参数预测方法 效应 地震动参数 场地条件 全球数字高程模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号