摘要
本发明涉及一种数据生成方法、装置、计算机设备及存储介质。该方法包括:从目标知识图谱中选择目标子图,目标子图涉及至少一个三元组;利用目标问题生成网络,根据至少一个三元组和目标子图中第一答案,生成第一问题,其中,目标问题生成网络是经过训练的神经网络,目标问题生成网络的训练数据包括:用于训练的知识图谱中用于训练的子图涉及的三元组、所述用于训练的子图中用于训练的答案、用于训练的答案对应的标注问题、标注问题的难度信息,标注问题的难度信息表示所述标注问题的难度,标注问题的难度信息根据标注问题中实体的可信度、用于训练的子图中与标注问题中实体匹配的其他实体的数量而确定;根据第一问题和第一答案,生成第一问答对。
技术关键词
三元组
答案
训练语言模型
数据生成方法
图谱
实体
计算机设备
网络
可读存储介质
指令
计算机程序产品
存储器
处理器
关键词
系统为您推荐了相关专利信息
流量分析方法
异常流量
模糊逻辑算法
强化学习算法
图论算法
自然语言理解方法
预训练语言模型
答案
标签类别
标记