一种语音处理和模型训练方法及装置

AITNT
正文
推荐专利
一种语音处理和模型训练方法及装置
申请号:CN202511135872
申请日期:2025-08-13
公开号:CN120748385A
公开日期:2025-10-03
类型:发明专利
摘要
本申请公开了一种语音处理和模型训练方法及装置,该语音处理方法包括:获得语音信号;基于语音信号中的上下文语义信息,利用语音处理模型中的语音编码子模型确定语音信号的语音特征;基于语音特征,利用语音处理模型中的文本转换子模型确定语音信号对应的目标文本。该模型训练方法包括:获得第一语音信号样本及其对应的正确文本;利用语音编码子模型处理第一语音信号样本,得到第一特征;利用文本转换子模型处理第一特征,生成预测文本;基于预测文本中各字符的上下文信息,利用语义理解模型处理预测文本,得到第二特征;基于第一特征与第二特征之间的第一差距及预测文本与正确文本之间的第二差距,调整语音编码子模型和文本转换子模型的参数。
技术关键词
语音编码 文本 模型训练方法 语义理解模型 上下文语义信息 语音特征 样本 字符 信号 模型训练装置 参数 校验模型 语音处理单元 网络 基础
系统为您推荐了相关专利信息
1
客服工单回复处理方法、装置、计算机设备及可读存储介质
客服工单 客户 语义 计算机设备 样本
2
一种交错扩散优化生成内容对提示词遵从程度的训练方法
生成网络模型 图片 噪声 数据 文本
3
一种基于AI大模型的综合管廊运维系统及方法
序列 语义分割网络 置信度阈值 图像 视觉
4
基于MOE场景的数据均衡分配方法、电子设备及存储介质
均衡分配方法 通用图形处理单元 策略 神经处理单元 芯片设计技术
5
一种在私有部署业务系统下使用AI智能体实现业务数据请求的方法及系统
部署业务系统 后台服务系统 自然语言 认证令牌 数据处理模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号