一种基于视听骨融合的语音增强方法和装置

正文

推荐专利

一种基于视听骨融合的语音增强方法和装置

申请号：CN202411847711

申请日期：2024-12-16

公开号：CN119851678A

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开了一种基于视听骨融合的语音增强方法和装置,所述方法包括：获取语音增强训练数据集；利用所述语音增强训练数据集，对预设的语音增强模型进行训练处理，得到训练完毕的语音增强模型；采集得到用户在讲话状态下的多模态数据集；所述多模态数据集，包括视频数据、气导数据和骨导数据；所述多模态数据集，是基于同一时间基准采集得到；利用所述训练完毕的语音增强模型，对所述多模态数据集进行处理，得到增强语音信息。本发明能够有效利用三模态的信息应对高噪声环境下的语音增强挑战，在特定说话人增强和说话人分离方面取得显著成效。此外，本发明还克服了在视听语音增强中光照变化和人体头部姿态运动带来的干扰，以及气骨语音增强中高频信息缺失的挑战，进一步优化了语音增强的稳定性和准确性。

技术关键词

归一化模块输出口注意力语音输入端网络模块输出端子模块视听输出模块输入模块计算机可存储介质信息数据处理终端变量多模态编码模块可执行程序代码

系统为您推荐了相关专利信息

一种车窗投影系统及方法

智能座舱投影仪乘员车窗投影系统场景

基于多模型人工智能的前列腺癌内分泌治疗耐药预测系统

内分泌数据预测系统多模型标签

独立操控装置与烹饪机器的控制方法和装置

烹饪机器操控装置散热模块设备底座控制面板

基于AI驱动的异常交易智能监测与分析系统及方法

账户非结构化特征画像节点异构

一种面向上下文语义感知的数据准备管道推荐方法及系统

自动化管道推荐方法大语言模型深度强化学习注意力机制

一种基于视听骨融合的语音增强方法和装置

站点导航

APP 下载