语音识别方法、装置、电子设备、存储介质及产品

AITNT
正文
推荐专利
语音识别方法、装置、电子设备、存储介质及产品
申请号:CN202410984541
申请日期:2024-07-22
公开号:CN118782025A
公开日期:2024-10-15
类型:发明专利
摘要
本申请提出一种语音识别方法、装置、电子设备、存储介质及产品,该方法对待识别音频帧的音频帧特征进行编码,得到待识别音频帧的初始编码特征;通过语音识别模型的基于混合多专家编码器的编码网络层,对待识别音频帧的初始编码特征进行编码,得到待识别音频帧的目标编码特征;语音识别模型的参数是通过复用语音识别基模型的参数并进行训练后确定的,语音识别基模型的编码网络层包括单个编码器;基于待识别音频帧的目标编码特征,确定待识别音频帧对应的识别文本。本方案,语音识别模型的参数复用了语音识别基模型的参数,继承了语音识别基模型的语音识别能力,能减少训练和计算成本,在对训练和计算成本有限制时,能保证语音识别模型的性能。
技术关键词
语音识别模型 编码特征 音频 编码器 语音识别方法 语音识别训练 参数 计算机程序指令 文本 样本 编码模块 语音识别装置 处理器 电子设备 计算机程序产品 存储器 网络 标识
系统为您推荐了相关专利信息
1
一种以文本驱动使图像和音频协同增强的多模态融合方法
音频特征提取 语义向量 图像特征提取 文本 网络
2
基于扩散模型的轴承故障诊断方法
轴承故障诊断方法 模块 频域特征 代表 故障轴承
3
直播内容审核方法、装置、计算设备及计算机存储介质
云端规则 内容审核方法 直播视频数据 直播封面 弹幕数据
4
医疗资产管理大数据分析方法及系统
大数据分析方法 命名实体识别 资产 预训练语言模型 资源分配
5
文件命名方法及其装置
关键词 文件命名方法 音频 视频帧 场景分类
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号