一种基于人工智能的语音识别方法及系统

正文

推荐专利

一种基于人工智能的语音识别方法及系统

申请号：CN202510484618

申请日期：2025-04-17

公开号：CN120388575A

公开日期：2025-07-29

类型：发明专利

摘要

本发明提供一种基于人工智能的语音识别方法及系统，涉及语音识别技术领域，本发明实时采集语音信号，对语音信号进行降噪后通过梅尔频率倒谱系数提取语音信号特征，组合梅尔倒谱系数、梅尔倒谱系数的一阶差分和二阶差分形成语音特征向量。同时采集唇动图像作为视觉信号，对图像进行灰度化处理之后，通过计算图像中像素点的LBP值生成图像特征向量，通过跨模态注意力机制动态调整语音特征向量和图像特征向量的权重，生成融合权重矩阵，不同的融合权重矩阵对应不同的语音指令，将语音原始信号和视觉原始图像作为训练集，融合权重矩阵对应的语音指令作为标签训练深度学习网络模型，最后使用将实时采集的数据输入训练好的模型进行实时语音识别。

技术关键词

语音识别方法像素点梅尔频率倒谱系数图像特征向量语音特征梅尔倒谱系数矩阵信号深度学习网络模型直方图构建深度学习网络滤波器邻域注意力机制视觉

系统为您推荐了相关专利信息

一种Mini LED产品的返修方法

返修方法激光器芯片封装结构返修平台

一种用于覆膜砂加热固化过程的模拟分析方法及系统

覆膜砂图像分析模型模拟分析方法裂缝分析模块

基于数据采集的动态生产管控系统及方法

明文管控方法数据采集网关密钥映射算法

图像背景虚化方法及装置

图像背景虚化方法背景图像素点图像语义分割模型缩略图

一种内窥镜实时二维转三维的方法和系统

生成对抗网络模型深度估计算法图像采集模块深度图图像特征信息

一种基于人工智能的语音识别方法及系统

站点导航

APP 下载