摘要
本发明公开了一种基于大语言模型的声纹比对方法、装置及可读介质,包括:获取分别采集到的待比对的第一语音和待比对的第二语音并拼接成合并语音;将合并语音和提示词输入到经训练的声纹比对模型中,合并语音先经过音频编码器,得到语音编码特征;提示词经过文本编码器,得到文本编码特征;将语音编码特征输入到适配器中,将语音编码特征进行维度转换,得到维度转换后的语音编码特征;文本编码特征和维度转换后的语音编码特征拼接后输入到改进的大语言模型的本体结构中,预训练的大语言模型的本体结构的输出特征和LoRA模块的输出特征相加得到输出token序列,输出token序列经过文本解码器,得到对应的输出文本,提升模型算法对声纹判别的鲁棒性和准确性。
技术关键词
大语言模型
音频编码器
比对方法
文本编码器
编码特征
输出特征
适配器
语音编码器
解码器
序列
处理器
比对装置
特征提取模块
模型算法
计算机程序产品
编码模块
系统为您推荐了相关专利信息
流速测量方法
多层感知机
像素
生成视频图像
无人船
图像分类模型
图像分类器
学习方法
存储介质电子设备
归一化模块
知识图谱链接预测
大语言模型
机电设备
三元组
实体