摘要
本发明提供一种基于策略评估网络学习的半监督训练方法、语音识别方法及装置。该半监督训练方法包括:采用有标注语音数据对初始化的RNN‑T进行训练,得到已训练的RNN‑T模型;在已训练的RNN‑T模型中引入策略评估网络,将相同时间步下编码器的输出和预测网络的输出组合为输出对作为状态,将需要预测的文本符号作为动作,采用有标注语音数据对所述策略评估网络进行训练,得到训练好的策略评估网络;其中,所述策略评估网络用于计算语音识别过程中在给定策略函数下每个状态‑动作对的动作值函数,所述策略函数用于计算RNN‑T输出下一个文本符号的概率;根据训练好的策略评估网络,采用无标注语音数据对初始化的RNN‑T进行训练,得到最终训练好的RNN‑T模型。
技术关键词
策略
网络
语音识别方法
非暂态计算机可读存储介质
符号
文本
数据
编码器
错误率
梯度下降法
处理器
样本
训练装置
时间段
无监督
存储器
电子设备
模块
程序
系统为您推荐了相关专利信息
异构计算架构
矩阵奇异值分解
内存管理模块
状态机
资源调度算法
能耗预测模型
能耗控制方法
神经网络模型
物联网设备
数据
电压无功
多时间尺度协调
注意力参数
调控方法
节点特征
黏弹性材料
单轴
深度神经网络模型
BFGS算法
应力
管理分析系统
管理分析方法
电力
神经网络模型
分析模块