摘要
本申请涉及语音语义技术领域,公开了一种基于大模型的多特征语音鉴别方法,所述基于大模型的多特征语音鉴别方法包括根据初始语义特征和初始语音特征,生成语音融合特征;基于预设语音鉴别决策模型和所述语音融合特征,生成所述初始语音信息的语音鉴别结果。通过上述方式,本申请将语义特征和语音特征进行融合,生成语音融合特征,综合考虑语音的语义信息和声学信息,基于预设语音鉴别决策模型和语音融合特征生成的语音鉴别结果能够适应不同语言、不同说话风格、不同背景环境的语音数据,在金融科技、医疗健康养老等业务领域中,提高了语音鉴伪系统对语音信息进行鉴别的准确性。
技术关键词
语音鉴别方法
融合特征
语义特征模型
生成语音
语音关键词
音色特征
决策
语音语义技术
动态时间规整算法
交叉注意力机制
语音特征提取
计算机设备
可读存储介质
鉴别装置
置信度阈值
存储计算机程序
多层感知机