一种针对输入的语音生成语音答复的方法和装置

正文

推荐专利

申请号：CN202510422174

申请日期：2025-04-03

公开号：CN120452439A

公开日期：2025-08-08

类型：发明专利

摘要

本说明书实施例提供了一种针对输入的语音生成语音答复的方法和装置，该方法包括：获取用户输入的第一语音，将第一语音输入语音编码器，得到第一特征；通过预设大语言模型，基于第一特征，得到第二特征；通过依次串连的语音解码器和N个语音预测器，基于第二特征得到顺序排列的N+1个第一词元特征，其中，语音解码器基于第二特征输出N+1个第一词元特征中的第一个第一词元特征，N个语音预测器中的第i个语音预测器基于N+1个第一词元特征中的第i个第一词元特征输出第i+1个第一词元特征；基于N+1个第一词元特征，生成语音答复。

技术关键词

语音解码器生成语音大语言模型语音编码器语音适配器处理单元标签计算机可读存储介质文本存储器处理器网络参数

系统为您推荐了相关专利信息

基于因果推理和LLM的代码质量优化方法、装置及存储介质

因果关系模型复杂度指标核心密度

基于大模型的交互方法、装置、智能体以及电子设备

对象交互方法 AI助手输入模块电子设备

一种自动化业务办理方法、装置、设备和存储介质

大语言模型业务办理方法控件文本业务办理装置

一种多Agent协作的游戏制作系统

生成游戏游戏制作系统计划图像生成模型自然语言

一种基于大语言模型自适应融合的实体对齐方法

实体对齐方法多模态大语言模型语义特征数据

一种针对输入的语音生成语音答复的方法和装置

站点导航

APP 下载