摘要
本发明涉及一种基于语言规则知识引导的无监督语音单元边界查找方法,属语音识别领域。本发明设计了语音段级表征提取模块、音素级生成对抗学习模块、语言知识主导的评分奖励模块;语音段级表征提取模块从原始语音输入中提取连续的语音特征,通过迭代训练的分割模型获取语音单元边界预测信息,基于边界信息对同一分段内降维后的语音特征序列进行均值池化操作,以获取语音的段级表征;音素级生成对抗学习模块生成器生成的输出序列交给判别器进行判别;语言知识主导的评分奖励模块用于生成奖励信号,以指导分割模型学习语音中的潜在结构模式。本发明能够有效的提高语音单元边界检测的能力和跨模态对齐的准确性。
技术关键词
查找方法
序列
语音特征
生成对抗学习
预训练模型
语音活动检测方法
文本
非暂态计算机可读存储介质
一维卷积神经网络
模块
语音语料库
分段
状态转换器
语音编码器
主成分分析法
平滑度
数据
查找系统
规则设计
系统为您推荐了相关专利信息
深度信念网络模型
评估指标体系
风险评估方法
数据
斑块特征
风险评估方法
风险评估模型
指标
机器学习方法
字段
充电器控制方法
离线语音识别模型
曲线
待机
指令
智慧环保系统
孤立森林算法
节点
Kubernetes集群
边缘计算方法