一种原生语音模态的语言模型训练方法

正文

推荐专利

一种原生语音模态的语言模型训练方法

申请号：CN202410911342

申请日期：2024-07-09

公开号：CN118471202B

公开日期：2024-09-13

类型：发明专利

摘要

本发明公开一种原生语音模态的语言模型训练方法，涉及语言模型训练技术领域，所述方法包括：利用传统语音模型构建训练数据集；基于训练数据集中的语音文本对构建语音语义编解码器；使用语音语义编解码器对大语言模型进行第一次微调使其具备语音理解能力；基于人类偏好对大语言模型进行第二次微调，使其具备对语音语调以及人类情感的感知；将微调后的大语言模型进行量化及流式部署。本发明以较小的训练成本，把文本大语言模型转换成具备端到端语音理解与生成的多模态大模型，能够直接处理语音输出，而无需依赖于多个分离的阶段，从而提高了交互的自然性、效率和实时性。

技术关键词

语言模型训练方法语音对话数据编解码器语言模型训练系统大语言模型文本人类语义解码器架构子模块样本编码器模型训练技术编解码模块多模态注意力机制

系统为您推荐了相关专利信息

一种基于知识图谱的发电领域设备问答方法及系统

问答方法知识图谱查询多源异构数据关系抽取模型大语言模型

一种基于知识推理的药食同源个性化推荐方法

个性化推荐方法个性化建议数据三元组广度优先搜索算法

一种基于大语言模型的机器视觉解决方案自动生成方法

大语言模型自动生成系统工作流引擎自动生成方法视觉

大语言模型回复内容的处理方法、相关硬件及程序产品

指纹特征大语言模型文本人机交互机器人关键词

基于大语言模型的金融融资规划方案提供系统

金融大语言模型规划矩阵文本

一种原生语音模态的语言模型训练方法

站点导航

APP 下载