摘要
本发明实施例涉及自然语言处理技术领域,公开了一种语音摘要的提取方法、装置及计算机可读存储介质,该方法包括:获取待转换语音;基于音频编码器对所述待转换语音进行提取,获得音频词元;其中,基于知识蒸馏算法生成所述音频编码器;基于所述音频词元,通过预设的语音摘要生成模型,生成所述待转换语音对应的语音摘要;其中,所述语音摘要生成模型是根据音频词元样本和语音摘要样本,对语言处理模型进行训练而获得。应用本发明的技术方案,通过涉及知识蒸馏技术改进的音频编码器,挖掘待转换语音的特征信息,使得提取获得的音频词元更具有音频特征,从而提高语音摘要模型提取待转换语音对应摘要的准确性。
技术关键词
摘要
音频编码器
语音
文本
样本
生成特征
知识蒸馏技术
可读存储介质
通信接口
数据获取模块
音频特征
序列
存储器
计算机
自然语言
处理器
指令
算法
系统为您推荐了相关专利信息
图像识别方法
多模态协同
学习特征
医学影像辅助诊断
文本编码器