一种基于大语言模型的声纹比对方法、装置及可读介质

正文

推荐专利

申请号：CN202510608005

申请日期：2025-05-13

公开号：CN120496537A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种基于大语言模型的声纹比对方法、装置及可读介质，包括：获取分别采集到的待比对的第一语音和待比对的第二语音并拼接成合并语音；将合并语音和提示词输入到经训练的声纹比对模型中，合并语音先经过音频编码器，得到语音编码特征；提示词经过文本编码器，得到文本编码特征；将语音编码特征输入到适配器中，将语音编码特征进行维度转换，得到维度转换后的语音编码特征；文本编码特征和维度转换后的语音编码特征拼接后输入到改进的大语言模型的本体结构中，预训练的大语言模型的本体结构的输出特征和LoRA模块的输出特征相加得到输出token序列，输出token序列经过文本解码器，得到对应的输出文本，提升模型算法对声纹判别的鲁棒性和准确性。

技术关键词

大语言模型音频编码器比对方法文本编码器编码特征输出特征适配器语音编码器解码器序列处理器比对装置特征提取模块模型算法计算机程序产品编码模块

系统为您推荐了相关专利信息

面向专家画像的信息追踪方法及装置

信息追踪方法数据真实性验证大语言模型文本

基于视频图像的河流表面流速测量方法、系统及产品

流速测量方法多层感知机像素生成视频图像无人船

图像分类模型的元学习方法及装置、存储介质电子设备

图像分类模型图像分类器学习方法存储介质电子设备归一化模块

一种基于情感演变序列回溯学习的多模态共情回复生成方法

回复生成方法生成框架序列策略数据校准

融合大语言模型的机电设备知识图谱链接预测方法

知识图谱链接预测大语言模型机电设备三元组实体

一种基于大语言模型的声纹比对方法、装置及可读介质

站点导航

APP 下载