一种原生语音模态的语言模型训练方法

AITNT
正文
推荐专利
一种原生语音模态的语言模型训练方法
申请号:CN202410911342
申请日期:2024-07-09
公开号:CN118471202B
公开日期:2024-09-13
类型:发明专利
摘要
本发明公开一种原生语音模态的语言模型训练方法,涉及语言模型训练技术领域,所述方法包括:利用传统语音模型构建训练数据集;基于训练数据集中的语音文本对构建语音语义编解码器;使用语音语义编解码器对大语言模型进行第一次微调使其具备语音理解能力;基于人类偏好对大语言模型进行第二次微调,使其具备对语音语调以及人类情感的感知;将微调后的大语言模型进行量化及流式部署。本发明以较小的训练成本,把文本大语言模型转换成具备端到端语音理解与生成的多模态大模型,能够直接处理语音输出,而无需依赖于多个分离的阶段,从而提高了交互的自然性、效率和实时性。
技术关键词
语言模型训练方法 语音对话数据 编解码器 语言模型训练系统 大语言模型 文本 人类 语义 解码器架构 子模块 样本 编码器 模型训练技术 编解码模块 多模态 注意力机制
系统为您推荐了相关专利信息
1
一种基于知识图谱的发电领域设备问答方法及系统
问答方法 知识图谱查询 多源异构数据 关系抽取模型 大语言模型
2
一种基于知识推理的药食同源个性化推荐方法
个性化推荐方法 个性化建议 数据 三元组 广度优先搜索算法
3
一种基于大语言模型的机器视觉解决方案自动生成方法
大语言模型 自动生成系统 工作流引擎 自动生成方法 视觉
4
大语言模型回复内容的处理方法、相关硬件及程序产品
指纹特征 大语言模型 文本 人机交互机器人 关键词
5
基于大语言模型的金融融资规划方案提供系统
金融 大语言模型 规划 矩阵 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号