语音识别方法、装置、相关设备及计算机程序产品

AITNT
正文
推荐专利
语音识别方法、装置、相关设备及计算机程序产品
申请号:CN202510383600
申请日期:2025-03-28
公开号:CN120220663A
公开日期:2025-06-27
类型:发明专利
摘要
本申请公开了一种语音识别方法、装置、相关设备及计算机程序产品,本申请所采用的语音识别模型包括共享编码器、支持流式解码处理的第一类解码器和支持非流式解码处理的第二类解码器,共享编码器采用同时支持流式和非流式识别任务的编码网络。待识别语音可以是流式识别任务中由音频块组成的语音数据流,也可以是非流式识别任务中的整段语音,由共享编码器对待识别语音的声学特征进行编码,编码特征送入目标解码器进行解码,基于解码结果得到最终语音识别结果。流式识别任务中目标解码器为第一类解码器,非流式识别任务中目标解码器为第二类解码器。本申请通过统一的语音识别模型,可以适应于流式识别任务及非流式识别任务,提高了使用的便捷性。
技术关键词
解码器 编码特征 语音识别模型 语音识别方法 声学特征 编码器 计算机程序产品 语音识别装置 特征提取单元 多任务 语种识别 音频块 处理器 注意力机制 可读存储介质 网络
系统为您推荐了相关专利信息
1
一种基于预训练模型的招生智能问答系统
智能问答系统 网络模块 转换器 预训练模型 转换编码器
2
一种基于轻量化SAM的图像实例分割方法及装置
图像编码器 图像实例分割方法 解码器 实例分割模型 蒸馏方法
3
基于深度学习的攻击痕迹识别分析方法
识别分析方法 时域特征 频域特征 指数 痕迹特征
4
一种基于对比学习的天然气需求预测方法和系统
需求预测模型 样本 天然气 预训练模型 序列
5
基于记忆-边缘引导的弱监督视频显著性目标检测方法及系统
时空上下文信息 记忆 分支 输入解码器 门控结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号