摘要
公开了用于生成问答数据的方法和装置、设备、介质和产品,涉及语言模型、大语言模型技术领域。该方法包括在从日志提取的问题之中,基于问题的问题清楚性选择第一问题。还包括在第一问题之中,基于第一问题的问题元信息选择第二问题,第二问题的数目小于等于第一问题的数目。还包括基于来自数据库的真值答案项,为第二问题指派真值答案。还包括基于由语言模型生成的模型答案项,为第二问题生成模型答案。还包括基于真值答案与模型答案之间的比较,将第二问题与真值答案和模型答案中答案差异性满足差异性阈值的一个或多个答案相关联存储以生成问答集。如此,能够自动生成高质量的标注数据集,保证问题清晰且具有针对性以及答案的覆盖面和准确性。
技术关键词
答案
语句
统一资源定位
处理器
机器可读存储介质
指派
日志
大语言模型
计算机程序产品
数据
指令
模块
存储器
电子设备
频率
系统为您推荐了相关专利信息
图像分割模型
图像分割方法
补丁
滑动窗口
卷积模块
睡眠特征
可穿戴设备
时序特征
睡眠阶段分类
序列
训练预测模型
车辆电池
参数
荷电状态预测
预测误差