一种基于语言规则知识引导的无监督语音单元边界查找方法

正文

推荐专利

申请号：CN202510646219

申请日期：2025-05-20

公开号：CN120412555A

公开日期：2025-08-01

类型：发明专利

摘要

本发明涉及一种基于语言规则知识引导的无监督语音单元边界查找方法，属语音识别领域。本发明设计了语音段级表征提取模块、音素级生成对抗学习模块、语言知识主导的评分奖励模块；语音段级表征提取模块从原始语音输入中提取连续的语音特征，通过迭代训练的分割模型获取语音单元边界预测信息，基于边界信息对同一分段内降维后的语音特征序列进行均值池化操作，以获取语音的段级表征；音素级生成对抗学习模块生成器生成的输出序列交给判别器进行判别；语言知识主导的评分奖励模块用于生成奖励信号，以指导分割模型学习语音中的潜在结构模式。本发明能够有效的提高语音单元边界检测的能力和跨模态对齐的准确性。

技术关键词

查找方法序列语音特征生成对抗学习预训练模型语音活动检测方法文本非暂态计算机可读存储介质一维卷积神经网络模块语音语料库分段状态转换器语音编码器主成分分析法平滑度数据查找系统规则设计

系统为您推荐了相关专利信息

基于清淤检测的管道淤积风险评估方法及系统

深度信念网络模型评估指标体系风险评估方法数据斑块特征

一种病原体在动物中流行生态的溢出风险评估方法及设备

风险评估方法风险评估模型指标机器学习方法字段

基于语音识别的充电器控制方法、装置、设备及介质

充电器控制方法离线语音识别模型曲线待机指令

影视视频剪辑处理方法、设备和计算机存储介质

视频计算机程序指令轨迹图谱计算机存储介质

面向智慧环保领域的云原生边缘计算方法、装置、电子设备和介质

智慧环保系统孤立森林算法节点 Kubernetes集群边缘计算方法

一种基于语言规则知识引导的无监督语音单元边界查找方法

站点导航

APP 下载