摘要
本申请涉及一种文档的问答对生成和问答方法、装置、计算机设备和可读存储介质,涉及数据生成技术领域,文档的问答对生成方法包括获取文档的多个文本切片;将文本切片输入预训练的知识图谱模型,并指示知识图谱模型基于文本切片的格式特征和文本类型,输出文本切片对应的至少一个目标问题;知识图谱模型中嵌入有关联于文档的知识领域的知识图谱;将同一目标问题多次输入预训练的问答模型,得到问答模型多次输出的多个待选答案;确定多个待选答案中出现概率最大的待选答案,为相应的目标问题所匹配的目标答案;基于各匹配的目标问题和目标答案,生成文档的多个问答对;有利于提升各问答对的匹配准确度。
技术关键词
知识图谱模型
答案
问答对生成方法
问答模型
文本
聚类算法
切片
问答方法
计算机设备
数据生成技术
问答装置
生成文档
轮廓系数
数据获取模块
实体
格式
生成装置
处理器