摘要
本申请实施例提供了基于音频分类模型的语音提取方法、装置及电子设备,属于金融科技技术领域。该方法包括:获取多个音频片段和音频数据集;将音频数据集输入预设的音频分类模型进行模型训练,得到预训练的音频分类模型;通过预设的声纹模型对所有音频片段进行特征提取,得到多个声纹特征向量;根据声纹特征向量对音频片段进行音频拼接,得到多个语音片段;基于预训练的音频分类模型对所有语音片段进行语音排序,得到语音序列;提取语音序列中预设位置的语音片段作为目标语音片段。本申请实施例能够降低噪声对音频的影响,提取出纯净的语音片段。
技术关键词
语音提取方法
声纹模型
音频组
活性检测
聚类
人声
序列
金融科技技术
电子设备
模型训练模块
可读存储介质
特征提取模块
数据获取模块
训练集
拼接模块
处理器
存储器
系统为您推荐了相关专利信息
信息集成方法
集成管理系统
数据交换协议
指标
数据质量检验
综合评价方法
综合评价体系
指标
综合评价模型
组网