一种基于GAN网络的模糊语义识别方法

AITNT
正文
推荐专利
一种基于GAN网络的模糊语义识别方法
申请号:CN202410945566
申请日期:2024-07-15
公开号:CN118658476A
公开日期:2024-09-17
类型:发明专利
摘要
本发明公开了一种基于GAN网络的模糊语义识别方法,属于语音识别技术领域,该方法首先通过预处理步骤,如预加重和加窗分帧,将语音信号分段并提取特征。接着,采用两个参数相同的生成器进行多阶段的增强映射,以改善语音质量,并在每个生成器模型中引入自注意力层以提升模型性能。判别器模型利用音频特征如音节、半音节、音素和词来判断重建语音与原始语音的相似度。最后利用标准重建语音进行语义识别。仿真结果显示,相较于基准测试方案,该算法在低信噪比环境下的模糊语义识别任务中表现更优。
技术关键词
模糊语义 识别方法 噪声语音 语音信号特征 序列 生成对抗网络 样本 矩阵 频域特征 编码器 注意力机制 语音信号处理 信噪比 解码器 语音识别技术 二分类器
系统为您推荐了相关专利信息
1
一种煤矿井下不安全行为识别方法
煤矿井下 融合特征 实时视频流 识别方法 降维特征
2
一种桥梁板式橡胶支座的图像识别方法、系统及设备
桥梁板式橡胶支座 图像识别方法 纹理特征 筛选方法 语义分割模型
3
一种基于预测的有约束飞行员模型及建模方法
偏差 模型建模方法 观测噪声 模糊集合 模糊推理
4
一种基于数字孪生的虚拟权益运营可视化监控平台
数字孪生模型 可视化监控平台 可视化监控方法 归一化算法 指标
5
一组转座子基因嵌合转录本来源的肝癌新抗原的鉴定方法及其应用
转录组测序数据 基因 序列 预测肝癌 原发性肝癌患者
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号