基于大语言模型的问题生成方法

正文

推荐专利

基于大语言模型的问题生成方法

申请号：CN202411098663

申请日期：2024-08-12

公开号：CN119088917A

公开日期：2024-12-06

类型：发明专利

摘要

本发明涉及基于大语言模型的问题生成方法，包括以下步骤：S1、获取文本数据，组成包含段落‑问题‑答案的训练集；S2、自动标注训练集上的复制词，具体方法为：遍历段落中的词语，如果某词语不在停词表中，且出现在问题中，则将其标注为复制词；S3、复制词分类模型得到段落中每个分词的复制词或非复制词概率；S4、对复制词分类模型输出结果进行后处理；S5、基于问题生成模型，在输入层添加复制词特征，生成高价值的问题。本发明涉及大语言模型的技术领域。本发明在问题生成模型的输入层中融合了复制词特征，限制生成结果中所包含的从段落原文中复制的词，可以提升复制的准确性，复制更关键的信息，减少正确但不重要的问题的生成，减少浪费算力。

技术关键词

大语言模型生成方法词特征语义向量解码器答案注意力编码器数据生成模型词语停用词表分词训练集传播算法解码模块编码模块评价方法

系统为您推荐了相关专利信息

一种藏文新闻生成方法、系统、设备及存储介质

生成方法输入解码器编码器策略文本

文本处理方法、装置、电子设备以及存储介质

编辑文本处理方法大语言模型字段语义标签

一种单切片半监督3D医学图像分割方法

医学图像分割方法切片动态相关性特征多粒度特征教师

语义引导与纹理先验的双分支表面缺陷分割方法及介质

缺陷分割方法特征融合网络分支特征提取网络注意力

一种基于交互语言模型的学习资源推送方法及应用

学习资源推送方法知识点标签大语言模型文本认证设备

基于大语言模型的问题生成方法

站点导航

APP 下载