语言模型训练方法、对话答复生成方法、装置及介质

正文

推荐专利

申请号：CN202410830618

申请日期：2024-06-25

公开号：CN119377660A

公开日期：2025-01-28

类型：发明专利

摘要

本发明公开了一种语言模型的训练方法，包括：获取初始训练数据和预训练语言模型；其中，所述初始训练数据包括第一训练数据和第二训练数据，第一训练数据包括指令训练文本和对应的回复训练文本，第二训练数据包括第一训练文本和多个关联训练文本，所述多个关联训练文本与所述第一训练文本是相关关联的；基于所述初始训练数据对预训练语言模型进行训练。通过训练使语言模型具备了思维联想的能力，这样训练得到的语言模型就可以根据对话内容输出更有意义的答复内容。

技术关键词

文本生成方法数据预训练语言模型语言模型训练方法关键词训练装置指令多轮对话程序生成装置输入模块输出模块处理器电子设备图谱存储器偏差

系统为您推荐了相关专利信息

集成SAO与贝叶斯模型的词语语义相似性度量方法、装置

词语贝叶斯模型平滑算法拉普拉斯相似性计算技术

一种飞行操作提示方法和系统

提示方法飞机策略强化学习模型强化学习算法

基于词级别交互和逐词情感量加权的多模态情感分析方法

语句双模态文本语音矩阵

一种玻璃隔音系数测定方法及其反馈系统

隔音玻璃表面缺陷玻璃缺陷检测有效值系数测定方法

一种基于GAT和改进PKO-ELM算法的交通流预测方法

交通流预测方法路段 ELM算法节点特征拥堵指数

语言模型训练方法、对话答复生成方法、装置及介质

站点导航

APP 下载