跨模态对抗生成的中文声调纠错系统及其方法

正文

推荐专利

申请号：CN202510907537

申请日期：2025-07-02

公开号：CN120412556B

公开日期：2025-08-26

类型：发明专利

摘要

本发明涉及语音处理技术领域，特别是涉及跨模态对抗生成的中文声调纠错系统及其方法，系统包括多通道声调频谱特化分解模块，用于并行处理语音信号，提取多尺度声调特征；自适应频谱注意力掩码模块，生成频谱增强掩码，对与声调特征相关的频率区域进行动态增强；声调表征模块，通过对比学习生成声调表征向量；声调错误检测模块，分析声调表征向量确定声调错误类型和错误模式；多模态反馈模块，基于声调错误类型和错误模式生成声调发音与舌位动作综合指导反馈，提高声调错误检测准确率，该系统通过多通道声调频谱特化分解和自适应频谱注意力掩码技术，将声调错误检出率提升至95%，准确率达92%，特别是对第三声的检测准确率显著提高。

技术关键词

错误检测模块频谱特征纠正策略纠错系统低频段多通道发音跨模态注意力机制多尺度特征提取多模态声调轮廓语音编码器单元生成多尺度样本

系统为您推荐了相关专利信息

一种风力发电机组电缆寿命测量装置及控制方法

动力电缆风力发电机组电缆振动特征参数数据采集层模式识别

运用LLM的外呼话术智能生成方法、系统、设备及介质

智能生成方法意图识别模型情感分析模型关键词文本

故障预测模型构建方法、故障预测方法、设备和介质

水泵设备故障预测模型故障预测方法历史运行数据噪声

一种船用智能脱缆钩控制系统及方法

智能脱缆钩环境状态预测深度循环神经网络永磁电磁结构动作策略

基于人机交互的英语教学辅助系统及方法

英语教学辅助系统学生优化缩放因子文本频谱特征提取

跨模态对抗生成的中文声调纠错系统及其方法

站点导航

APP 下载