语音对象识别方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
语音对象识别方法、装置、计算机设备及存储介质
申请号:CN202510251872
申请日期:2025-03-04
公开号:CN120089129A
公开日期:2025-06-03
类型:发明专利
摘要
本申请属于人工智能技术领域,涉及一种语音对象识别方法、装置、计算机设备及存储介质,该方法包括:采用语音对象识别模型对待识别语音进行特征提取,得到语音特征向量;将语音特征向量与语音对象识别模型中的注册特征向量进行相减,得到目标差值向量,注册特征向量是指采用目标语音对象的单独语音对语音对象识别模型进行注册嵌入所生成的特征向量;为目标差值向量添加位置编码,采用编码器对位置编码后的目标差值向量进行处理,得到目标差值向量编码;采用多层感知机和预设的激活函数,根据目标差值向量编码计算验证分数,根据验证分数确定目标语音对象出现在待识别语音中的概率。本申请能够提升语音对象验证的准确性和鲁棒性。
技术关键词
语音对象识别方法 对象识别模型 多层感知机 计算机可读指令 特征提取网络 编码器 格式化 元素 计算机设备 对象识别装置 前馈神经网络 可读存储介质 人工智能技术 注意力机制 编码模块 处理器
系统为您推荐了相关专利信息
1
多芯片设备、数据传输方法、电子装置和介质
监控计数器 数据传输方法 屏障 多芯片 存储器
2
一种基于多任务自监督框架的群体行为识别方法和装置
特征提取模块 嵌入特征 识别方法 多任务 编码特征
3
一种基于CLIP损失与感知损失的扩散模型LoRA微调优化方法及系统
特征提取网络 噪声图像 噪声预测 解码器 图像压缩
4
围标串标风险识别方法、装置、计算机设备及存储介质
风险识别方法 企业 识别码 计算机可读指令 硬盘序列号
5
基于双重预测的内存受限设备MoE大模型推理优化系统及方法
推理系统 调度器 内存 受限 多层感知机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号