一种基于视听骨融合的语音增强方法和装置

AITNT
正文
推荐专利
一种基于视听骨融合的语音增强方法和装置
申请号:CN202411847711
申请日期:2024-12-16
公开号:CN119851678A
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开了一种基于视听骨融合的语音增强方法和装置,所述方法包括:获取语音增强训练数据集;利用所述语音增强训练数据集,对预设的语音增强模型进行训练处理,得到训练完毕的语音增强模型;采集得到用户在讲话状态下的多模态数据集;所述多模态数据集,包括视频数据、气导数据和骨导数据;所述多模态数据集,是基于同一时间基准采集得到;利用所述训练完毕的语音增强模型,对所述多模态数据集进行处理,得到增强语音信息。本发明能够有效利用三模态的信息应对高噪声环境下的语音增强挑战,在特定说话人增强和说话人分离方面取得显著成效。此外,本发明还克服了在视听语音增强中光照变化和人体头部姿态运动带来的干扰,以及气骨语音增强中高频信息缺失的挑战,进一步优化了语音增强的稳定性和准确性。
技术关键词
归一化模块 输出口 注意力 语音 输入端 网络模块 输出端 子模块 视听 输出模块 输入模块 计算机可存储介质 信息数据处理终端 变量 多模态 编码模块 可执行程序代码
系统为您推荐了相关专利信息
1
一种车窗投影系统及方法
智能座舱 投影仪 乘员 车窗投影系统 场景
2
基于多模型人工智能的前列腺癌内分泌治疗耐药预测系统
内分泌 数据 预测系统 多模型 标签
3
独立操控装置与烹饪机器的控制方法和装置
烹饪机器 操控装置 散热模块 设备底座 控制面板
4
基于AI驱动的异常交易智能监测与分析系统及方法
账户 非结构化特征 画像 节点 异构
5
一种面向上下文语义感知的数据准备管道推荐方法及系统
自动化管道 推荐方法 大语言模型 深度强化学习 注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号