基于人工智能的语音控制方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510219544

申请日期：2025-02-26

公开号：CN120032647A

公开日期：2025-05-23

类型：发明专利

摘要

本发明提供了一种基于人工智能的语音控制方法、装置、设备及存储介质，该方法包括：对采集的语音信号进行预处理，得到梅尔频谱图；利用两个预设的集成深度学习模型对梅尔频谱图进行特征提取，得到联合特征向量；对联合特征向量进行注意力加权融合和降维，得到融合特征表示；对融合特征表示进行分块、线性投影和位置编码处理，得到编码序列；将编码序列输入Transformer编码器，经全局平均池化得到固定长度向量表示；利用多层感知机进行分层分类，得到指令类别和关键参数；生成标准化控制指令并发送至智能设备。本方法能有效处理非标准语音，提高识别准确率和实时性，增强系统泛化能力，适用于多样化语音输入场景。

技术关键词

集成深度学习语音控制方法融合特征全局平均池化多层感知机语音控制设备编码器前馈神经网络投影特征局部特征提取梅尔频率倒谱系数序列智能设备指令语音控制装置注意力机制多尺度特征

系统为您推荐了相关专利信息

一种基于强化学习的自适应PID温度控制算法

PID温度控制温度控制元件动作策略温度控制算法模糊推理

一种交通标志检测方法、装置、电子设备及介质

交通标志识别交通标志检测方法融合特征语义特征重叠面积

高心墙堆石坝坝顶裂缝的早期识别方法和系统

高心墙堆石坝早期识别方法指标三维激光扫描数据统计特征

一种服装合体性预测方法

人体关键部位三维人体模型性预测方法三维服装模型空气层

一种基于残差状态空间模块的遥感图像船舶语义分割方法

空间模块语义分割方法船舶输出特征离散状态空间

基于人工智能的语音控制方法、装置、设备及存储介质

站点导航

APP 下载