一种基于预训练自动语音识别模型的跨语言语音文本检索方法

正文

推荐专利

申请号：CN202510257096

申请日期：2025-03-05

公开号：CN120086354A

公开日期：2025-06-03

类型：发明专利

摘要

本发明公开了一种基于预训练自动语音识别模型的跨语言语音文本检索方法。该方法将预训练自动语音识别模型拓展到语音文本检索系统中，并结合对比学习和低秩自适应方法对模型进行微调，实现高效的跨语言语音文本检索功能。本发明基于预训练模型初始化的编码器‑解码器结构，首先，语音数据和文本数据分别通过编码模块转换为高维特征向量，映射到统一的嵌入空间。随后，模型在嵌入空间中最小化匹配的语音与文本嵌入距离。最后，通过相似性匹配算法，模型能够将查询语音与文本库中的文本高效匹配，从而返回最相关的文本数据。实验结果表明，本发明在测试数据集上的检索精度和效率均接近或超越现有公开模型，证明其具有广泛的应用前景和显著的实用价值。

技术关键词

自动语音识别文本检索方法音频编码器文本检索系统预训练模型令牌交叉注意力机制数据高维特征向量编码模块更新模型参数网络结构随机梯度下降解码器结构双塔结构

系统为您推荐了相关专利信息

一种基于预训练的开放世界语义分割自动概念补全方法

补全方法预训练模型编码特征语义学生

一种基于计量语言学与LLM的智能体裁转换方法及系统

平行语料库文本转换方法编码器适配器

一种天地协同山洪灾害预报方法

山洪预警山洪灾害无人机遥感图像预报方法空间感知技术

数据合成方法、模型预训练方法、装置、介质及设备

数据大语言模型种子预训练模型预训练方法

面向多类信息融合的事件抽取方法

事件抽取方法事件触发词焦点损失函数句法信息实体

一种基于预训练自动语音识别模型的跨语言语音文本检索方法

站点导航

APP 下载