一种多模态自适应拾音方法、系统、耳机及存储介质

正文

推荐专利

申请号：CN202410876346

申请日期：2024-07-01

公开号：CN118764765A

公开日期：2024-10-11

类型：发明专利

摘要

本发明涉及耳机技术领域，公开了一种多模态自适应拾音方法、系统、耳机及存储介质，方法包括：获取语音数据、噪声数据、骨传导数据及唇动图像数据并进行预处理，得到语音时频图、噪声时频图、骨传导时频图及唇动裁切图；利用环境场景识别模型，确定各数据的权重系数；根据对应的权重系数对语音数据、骨传导数据及唇动图像数据进行加权处理，将加权后的结果输入预设多模态融合模型，得到融合输出数据。本发明通过自适应识别周围环境场景，并根据周围环境场景为不同通道数据分配权重系数，利用权重系数将多个通道数据进行融合得到最终的输出数据，能够在极度静谧至喧嚣高噪声等各类复杂环境条件下均能实现优异的音频捕捉效能。

技术关键词

语音噪声数据多模态拾音方法骨导麦克风场景计算机耳罩图像传感器耳机噪音值拾音系统频率模式降噪模型可读存储介质

系统为您推荐了相关专利信息

院前急救大数据分析应用系统

急救站大数据可视化智能语音热力图语音识别模型

一种基于GIL多维感知的伸缩节动态感知系统

感知系统监测单元神经网络模型数据采集模块多模态深度学习

一种基于火电厂的可视化仿真培训方法和系统

可视化仿真培训系统仿真模型数据处理模块数据采集模块异构传感器

一种基于双域建模与量子计算的可信AI系统解决方案

AI系统路径优化算法工程优化技术数学工具医疗机器人

有效语音识别方法及装置

音频特征声纹特征语音识别模型语音识别方法语音标签

一种多模态自适应拾音方法、系统、耳机及存储介质

站点导航

APP 下载