一种语音处理和模型训练方法及装置

正文

推荐专利

一种语音处理和模型训练方法及装置

申请号：CN202511135872

申请日期：2025-08-13

公开号：CN120748385A

公开日期：2025-10-03

类型：发明专利

摘要

本申请公开了一种语音处理和模型训练方法及装置，该语音处理方法包括：获得语音信号；基于语音信号中的上下文语义信息，利用语音处理模型中的语音编码子模型确定语音信号的语音特征；基于语音特征，利用语音处理模型中的文本转换子模型确定语音信号对应的目标文本。该模型训练方法包括：获得第一语音信号样本及其对应的正确文本；利用语音编码子模型处理第一语音信号样本，得到第一特征；利用文本转换子模型处理第一特征，生成预测文本；基于预测文本中各字符的上下文信息，利用语义理解模型处理预测文本，得到第二特征；基于第一特征与第二特征之间的第一差距及预测文本与正确文本之间的第二差距，调整语音编码子模型和文本转换子模型的参数。

技术关键词

语音编码文本模型训练方法语义理解模型上下文语义信息语音特征样本字符信号模型训练装置参数校验模型语音处理单元网络基础

系统为您推荐了相关专利信息

客服工单回复处理方法、装置、计算机设备及可读存储介质

客服工单客户语义计算机设备样本

一种交错扩散优化生成内容对提示词遵从程度的训练方法

生成网络模型图片噪声数据文本

一种基于AI大模型的综合管廊运维系统及方法

序列语义分割网络置信度阈值图像视觉

基于MOE场景的数据均衡分配方法、电子设备及存储介质

均衡分配方法通用图形处理单元策略神经处理单元芯片设计技术

一种在私有部署业务系统下使用AI智能体实现业务数据请求的方法及系统

部署业务系统后台服务系统自然语言认证令牌数据处理模型

一种语音处理和模型训练方法及装置

站点导航

APP 下载