摘要
本申请提出一种数据获取方法、装置、电子设备及产品,应用于模型训练技术领域。该方法包括:从知识文本中提取多个第一问题以及多个知识内容,并根据各个所述知识内容构建多个第二问题;对各个所述第二问题以及各个所述第一问题进行优化,得到多个目标问题;确定每个所述目标问题对应的至少一个所述知识内容,所述目标问题对应的至少一个所述知识内容包含所述目标问题的答案;根据每个所述目标问题以及对应的至少一个所述知识内容,构建每个所述目标问题对应的问答数据,所述问答数据用于训练模型。
技术关键词
数据获取方法
大语言模型
答案
问答对提取
文本
生成提示词
生成参数
格式化
深度学习模型
模型训练技术
数据获取装置
电子设备
计算机程序产品
处理器
存储器
模块
系统为您推荐了相关专利信息
医疗知识图谱
医学知识图谱
意图类别
问诊系统
文本