摘要
本发明涉及声音识别技术领域,公开了一种录音笔关键词声音识别方法、装置及设备,该方法包括:对录音笔采集的原始声音信号进行傅里叶变换和时域随机化处理,得到目标时域声音信号;提取目标时域声音信号中音调特征、音色特征和响度特征,生成目标声音特征向量;基于多个标准语音样本建立标准基线特征库;对目标声音特征向量进行加权k‑means聚类分析,生成动态特征权重矩阵;将目标声音特征向量和所述动态特征权重矩阵输入图结构多任务学习模型进行关键词识别,输出初始关键词识别结果;根据标准基线特征库,对初始关键词识别结果进行加权优化,生成目标关键词识别结果,本发明提升了录音笔的关键词声音识别结果的准确性。
技术关键词
关键词
多任务学习模型
声音识别方法
录音笔
声音特征提取
矩阵
音色特征
识别置信度
信号
声音识别装置
高斯分布模型
卷积特征提取
基线
信噪比参数
信噪比数据
概率密度函数
动态
双向长短期记忆网络
分支
系统为您推荐了相关专利信息
持久化存储方法
记忆
关键词
预训练语言模型
文本
关键词
数据
长短期记忆网络
自然语言
构建知识图谱
大语言模型
命名实体识别模型
场景
关键词
JSON结构