一种语音识别方法及相关装置、设备和存储介质

AITNT
正文
推荐专利
一种语音识别方法及相关装置、设备和存储介质
申请号:CN202411007495
申请日期:2024-07-25
公开号:CN118982986A
公开日期:2024-11-19
类型:发明专利
摘要
本申请公开了一种语音识别方法及相关装置、设备和存储介质,其中,语音识别方法包括:基于待识别语音的语音特征,得到声学编码特征、帧级发音特征和段级发音特征;基于声学编码特征进行预测,得到待识别语音的预测发音序列,并基于预测发音序列,提取得到文本编码特征;获取声学编码特征与帧级发音特征的第一融合特征,并获取文本编码特征与段级发音特征的第二融合特征;基于第一融合特征和第二融合特征进行解码,得到待识别语音的语音识别文本。上述方案,能够提升语音识别的准确性。
技术关键词
编码特征 发音特征 融合特征 语音识别模型 样本 语音识别文本 语音识别方法 序列 语音特征 解码模型 度量 嵌入特征 交叉注意力机制 元素 语音识别装置
系统为您推荐了相关专利信息
1
基于自监督对比学习的数字电网资产分类与演化监控方法、系统、设备及存储介质
监控方法 网络流量数据 滑动时间窗口 序列 电网智能化技术
2
基于约束贝叶斯推理的水电高边坡响应更新方法及装置
高边坡 更新方法 抽样算法 水电站 样本
3
人脸部位分类方法、系统、设备及存储介质
人脸模型 分类方法 人脸图像数据 分类程序 样本
4
一种基于深度学习的数据处理方法及系统
网络流量分类模型 数据处理方法 分类模型训练 实时数据采集 深度学习算法
5
一种基于宏基因组学标志物用于水中尸体法医学鉴定的方法及应用
细菌检测试剂 生物标志物 豚鼠气单胞菌 原始测序数据 随机森林
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号