一种数字人语音交互抗干扰方法、系统、设备及介质

正文

推荐专利

申请号：CN202411137303

申请日期：2024-08-19

公开号：CN118658478B

公开日期：2024-11-08

类型：发明专利

摘要

本发明属于自然语言处理技术领域，公开一种数字人语音交互抗干扰方法、系统、设备及介质，该方法包括：捕获音频信号，并通过语音预处理，优化音频信号的语音质量与采样率；基于文本数据，构建语言模型，并引入热词加权与自学习机制，训练语言模型的热词概率与泛化能力；实时识别音频信号中的流式语音，并提取流式语音中的关键词，捕捉及响应与关键词匹配的用户意图；将流式语音转换为文本字符串，通过动态滑动窗口匹配，识别意图匹配成功率，并在匹配成功后，下发数字人控制命令。本发明通过先进技术的集成和优化，提高语音识别的准确性和鲁棒性，显著改善数字人在噪声环境下的语音交互性能，从而提供更加流畅和自然的用户体验。

技术关键词

抗干扰方法动态滑动窗口构建语言模型训练语言模型关键词文本音频采样率信号抗干扰系统语音识别模块机制命令实时语音训练集意图识别数据

系统为您推荐了相关专利信息

基于电力安全培训知识图谱多任务学习大模型推荐方法

模型推荐方法员工大语言模型电力列表

基于物联网的档案信息安全追踪与实时监控系统及方法

关键词分类档案实时监控系统神经网络模型检测设备

一种用于短视频图像的关键词提取方法、装置及存储介质

关键词提取方法短视频滑动窗口语义 DBSCAN算法

一种数据集获取方法、装置、设备及可读存储介质

数据集获取方法视频生成模型数据格式关键帧文本

一种工艺图纸数据化的处理方法及系统

图元图纸局部统计信息动态滑动窗口逻辑

一种数字人语音交互抗干扰方法、系统、设备及介质

站点导航

APP 下载