摘要
本申请公开了一种语音处理和模型训练方法及装置,该语音处理方法包括:获得语音信号;基于语音信号中的上下文语义信息,利用语音处理模型中的语音编码子模型确定语音信号的语音特征;基于语音特征,利用语音处理模型中的文本转换子模型确定语音信号对应的目标文本。该模型训练方法包括:获得第一语音信号样本及其对应的正确文本;利用语音编码子模型处理第一语音信号样本,得到第一特征;利用文本转换子模型处理第一特征,生成预测文本;基于预测文本中各字符的上下文信息,利用语义理解模型处理预测文本,得到第二特征;基于第一特征与第二特征之间的第一差距及预测文本与正确文本之间的第二差距,调整语音编码子模型和文本转换子模型的参数。
技术关键词
语音编码
文本
模型训练方法
语义理解模型
上下文语义信息
语音特征
样本
字符
信号
模型训练装置
参数
校验模型
语音处理单元
网络
基础
系统为您推荐了相关专利信息
均衡分配方法
通用图形处理单元
策略
神经处理单元
芯片设计技术
部署业务系统
后台服务系统
自然语言
认证令牌
数据处理模型