学术问答模型训练方法、答案生成方法、装置及相关产品

正文

推荐专利

申请号：CN202411117898

申请日期：2024-08-15

公开号：CN119311813A

公开日期：2025-01-14

类型：发明专利

摘要

本公开涉及自然语言处理技术领域，公开了一种学术问答模型训练方法、答案生成方法、装置及相关产品；其方法包括：获取开源预训练数据集和学术预训练数据集；学术预训练数据集中的文本数据包含至少一个标签，标签用于表征文本数据中结构化文本的含义；利用开源预训练数据集和学术预训练数据集，对初始问答模型进行训练，得到预训练好的问答模型；获取为下游学术任务构建的指令微调数据集；基于指令微调数据集，对预训练好的问答模型进行微调训练，得到目标问答模型。本公开将开源数据和学术数据共同作为预训练数据；并在学术预训练数据中加入表征结构化文本含义的标签，从而可以使模型能够更好的理解学术内容，确保生成的答案更具有学术专业性。

技术关键词

问答模型训练方法答案生成方法文本数据标签计算机程序产品中文关键词指令电子设备可读存储介质摘要封闭式识别算法训练装置模块生成装置自然语言

系统为您推荐了相关专利信息

一种全景图生成方法及装置

全景图空间结构训练样本集风格生成方法

一种工艺知识和交互语义驱动的主动式人机协作方法

人机协作语义控制机器人运动主动式动态场景

一种基于图神经网络的结构化数据自学习方法

嵌入特征节点神经网络模型学习方法字段

国内生产总值空间化方法和装置

格网夜间灯光强度土地利用数据夜间灯光数据空间化方法

一种安检行为评价方法、装置、计算机设备及存储介质

标签读取记录探照设备评价方法轨迹图像采集设备

学术问答模型训练方法、答案生成方法、装置及相关产品

站点导航

APP 下载