跨模态对抗生成的中文声调纠错系统及其方法

AITNT
正文
推荐专利
跨模态对抗生成的中文声调纠错系统及其方法
申请号:CN202510907537
申请日期:2025-07-02
公开号:CN120412556B
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及语音处理技术领域,特别是涉及跨模态对抗生成的中文声调纠错系统及其方法,系统包括多通道声调频谱特化分解模块,用于并行处理语音信号,提取多尺度声调特征;自适应频谱注意力掩码模块,生成频谱增强掩码,对与声调特征相关的频率区域进行动态增强;声调表征模块,通过对比学习生成声调表征向量;声调错误检测模块,分析声调表征向量确定声调错误类型和错误模式;多模态反馈模块,基于声调错误类型和错误模式生成声调发音与舌位动作综合指导反馈,提高声调错误检测准确率,该系统通过多通道声调频谱特化分解和自适应频谱注意力掩码技术,将声调错误检出率提升至95%,准确率达92%,特别是对第三声的检测准确率显著提高。
技术关键词
错误检测模块 频谱特征 纠正策略 纠错系统 低频段 多通道 发音 跨模态 注意力机制 多尺度特征提取 多模态 声调轮廓 语音 编码器单元 生成多尺度 样本
系统为您推荐了相关专利信息
1
一种风力发电机组电缆寿命测量装置及控制方法
动力电缆 风力发电机组电缆 振动特征参数 数据采集层 模式识别
2
运用LLM的外呼话术智能生成方法、系统、设备及介质
智能生成方法 意图识别模型 情感分析模型 关键词 文本
3
故障预测模型构建方法、故障预测方法、设备和介质
水泵设备 故障预测模型 故障预测方法 历史运行数据 噪声
4
一种船用智能脱缆钩控制系统及方法
智能脱缆钩 环境状态预测 深度循环神经网络 永磁电磁结构 动作策略
5
基于人机交互的英语教学辅助系统及方法
英语教学辅助系统 学生 优化缩放因子 文本 频谱特征提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号