一种语音摘要的提取方法、装置及计算机可读存储介质

AITNT
正文
推荐专利
一种语音摘要的提取方法、装置及计算机可读存储介质
申请号:CN202411527178
申请日期:2024-10-30
公开号:CN119400185A
公开日期:2025-02-07
类型:发明专利
摘要
本发明实施例涉及自然语言处理技术领域,公开了一种语音摘要的提取方法、装置及计算机可读存储介质,该方法包括:获取待转换语音;基于音频编码器对所述待转换语音进行提取,获得音频词元;其中,基于知识蒸馏算法生成所述音频编码器;基于所述音频词元,通过预设的语音摘要生成模型,生成所述待转换语音对应的语音摘要;其中,所述语音摘要生成模型是根据音频词元样本和语音摘要样本,对语言处理模型进行训练而获得。应用本发明的技术方案,通过涉及知识蒸馏技术改进的音频编码器,挖掘待转换语音的特征信息,使得提取获得的音频词元更具有音频特征,从而提高语音摘要模型提取待转换语音对应摘要的准确性。
技术关键词
摘要 音频编码器 语音 文本 样本 生成特征 知识蒸馏技术 可读存储介质 通信接口 数据获取模块 音频特征 序列 存储器 计算机 自然语言 处理器 指令 算法
系统为您推荐了相关专利信息
1
一种多模态增强表示协同学习的肺炎图像识别方法
图像识别方法 多模态协同 学习特征 医学影像辅助诊断 文本编码器
2
一种基于零阶优化的扩散模型艺术版权保护方法和装置
版权保护方法 样本 图像 协方差矩阵 黑盒模型
3
一种时序感知的多视图聚类方法及系统
编码器结构 游戏人物 聚类方法 时序 KNN算法
4
一种基于表达感知最近邻的信息抽取方法
元素 信息抽取方法 编码器 索引 自然语言文本
5
一种知识图谱与多模态融合的政务信息推荐方法及设备
政务 文本特征向量 多模态 语义向量 推荐方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号