一种基于人工智能的语音识别方法及系统

AITNT
正文
推荐专利
一种基于人工智能的语音识别方法及系统
申请号:CN202510484618
申请日期:2025-04-17
公开号:CN120388575A
公开日期:2025-07-29
类型:发明专利
摘要
本发明提供一种基于人工智能的语音识别方法及系统,涉及语音识别技术领域,本发明实时采集语音信号,对语音信号进行降噪后通过梅尔频率倒谱系数提取语音信号特征,组合梅尔倒谱系数、梅尔倒谱系数的一阶差分和二阶差分形成语音特征向量。同时采集唇动图像作为视觉信号,对图像进行灰度化处理之后,通过计算图像中像素点的LBP值生成图像特征向量,通过跨模态注意力机制动态调整语音特征向量和图像特征向量的权重,生成融合权重矩阵,不同的融合权重矩阵对应不同的语音指令,将语音原始信号和视觉原始图像作为训练集,融合权重矩阵对应的语音指令作为标签训练深度学习网络模型,最后使用将实时采集的数据输入训练好的模型进行实时语音识别。
技术关键词
语音识别方法 像素点 梅尔频率倒谱系数 图像特征向量 语音特征 梅尔倒谱系数 矩阵 信号 深度学习网络模型 直方图 构建深度学习网络 滤波器 邻域 注意力机制 视觉
系统为您推荐了相关专利信息
1
一种Mini LED产品的返修方法
返修方法 激光器 芯片 封装结构 返修平台
2
一种用于覆膜砂加热固化过程的模拟分析方法及系统
覆膜砂 图像分析模型 模拟分析方法 裂缝 分析模块
3
基于数据采集的动态生产管控系统及方法
明文 管控方法 数据采集网关 密钥 映射算法
4
图像背景虚化方法及装置
图像背景虚化方法 背景图 像素点 图像语义分割模型 缩略图
5
一种内窥镜实时二维转三维的方法和系统
生成对抗网络模型 深度估计算法 图像采集模块 深度图 图像特征信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号