摘要
本申请属于人工智能技术领域,涉及一种语音对象识别方法、装置、计算机设备及存储介质,该方法包括:采用语音对象识别模型对待识别语音进行特征提取,得到语音特征向量;将语音特征向量与语音对象识别模型中的注册特征向量进行相减,得到目标差值向量,注册特征向量是指采用目标语音对象的单独语音对语音对象识别模型进行注册嵌入所生成的特征向量;为目标差值向量添加位置编码,采用编码器对位置编码后的目标差值向量进行处理,得到目标差值向量编码;采用多层感知机和预设的激活函数,根据目标差值向量编码计算验证分数,根据验证分数确定目标语音对象出现在待识别语音中的概率。本申请能够提升语音对象验证的准确性和鲁棒性。
技术关键词
语音对象识别方法
对象识别模型
多层感知机
计算机可读指令
特征提取网络
编码器
格式化
元素
计算机设备
对象识别装置
前馈神经网络
可读存储介质
人工智能技术
注意力机制
编码模块
处理器
系统为您推荐了相关专利信息
特征提取模块
嵌入特征
识别方法
多任务
编码特征
特征提取网络
噪声图像
噪声预测
解码器
图像压缩
风险识别方法
企业
识别码
计算机可读指令
硬盘序列号