一种基于大语言模型的声纹比对方法、装置及可读介质

AITNT
正文
推荐专利
一种基于大语言模型的声纹比对方法、装置及可读介质
申请号:CN202510608005
申请日期:2025-05-13
公开号:CN120496537A
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种基于大语言模型的声纹比对方法、装置及可读介质,包括:获取分别采集到的待比对的第一语音和待比对的第二语音并拼接成合并语音;将合并语音和提示词输入到经训练的声纹比对模型中,合并语音先经过音频编码器,得到语音编码特征;提示词经过文本编码器,得到文本编码特征;将语音编码特征输入到适配器中,将语音编码特征进行维度转换,得到维度转换后的语音编码特征;文本编码特征和维度转换后的语音编码特征拼接后输入到改进的大语言模型的本体结构中,预训练的大语言模型的本体结构的输出特征和LoRA模块的输出特征相加得到输出token序列,输出token序列经过文本解码器,得到对应的输出文本,提升模型算法对声纹判别的鲁棒性和准确性。
技术关键词
大语言模型 音频编码器 比对方法 文本编码器 编码特征 输出特征 适配器 语音编码器 解码器 序列 处理器 比对装置 特征提取模块 模型算法 计算机程序产品 编码模块
系统为您推荐了相关专利信息
1
面向专家画像的信息追踪方法及装置
信息追踪方法 数据 真实性验证 大语言模型 文本
2
基于视频图像的河流表面流速测量方法、系统及产品
流速测量方法 多层感知机 像素 生成视频图像 无人船
3
图像分类模型的元学习方法及装置、存储介质电子设备
图像分类模型 图像分类器 学习方法 存储介质电子设备 归一化模块
4
一种基于情感演变序列回溯学习的多模态共情回复生成方法
回复生成方法 生成框架 序列 策略 数据校准
5
融合大语言模型的机电设备知识图谱链接预测方法
知识图谱链接预测 大语言模型 机电设备 三元组 实体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号