一种针对输入的语音生成语音答复的方法和装置

AITNT
正文
推荐专利
一种针对输入的语音生成语音答复的方法和装置
申请号:CN202510422174
申请日期:2025-04-03
公开号:CN120452439A
公开日期:2025-08-08
类型:发明专利
摘要
本说明书实施例提供了一种针对输入的语音生成语音答复的方法和装置,该方法包括:获取用户输入的第一语音,将第一语音输入语音编码器,得到第一特征;通过预设大语言模型,基于第一特征,得到第二特征;通过依次串连的语音解码器和N个语音预测器,基于第二特征得到顺序排列的N+1个第一词元特征,其中,语音解码器基于第二特征输出N+1个第一词元特征中的第一个第一词元特征,N个语音预测器中的第i个语音预测器基于N+1个第一词元特征中的第i个第一词元特征输出第i+1个第一词元特征;基于N+1个第一词元特征,生成语音答复。
技术关键词
语音解码器 生成语音 大语言模型 语音编码器 语音适配器 处理单元 标签 计算机 可读存储介质 文本 存储器 处理器 网络 参数
系统为您推荐了相关专利信息
1
基于因果推理和LLM的代码质量优化方法、装置及存储介质
因果关系模型 复杂度 指标 核心 密度
2
基于大模型的交互方法、装置、智能体以及电子设备
对象 交互方法 AI助手 输入模块 电子设备
3
一种自动化业务办理方法、装置、设备和存储介质
大语言模型 业务办理方法 控件 文本 业务办理装置
4
一种多Agent协作的游戏制作系统
生成游戏 游戏制作系统 计划 图像生成模型 自然语言
5
一种基于大语言模型自适应融合的实体对齐方法
实体对齐方法 多模态 大语言模型 语义特征 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号