摘要
本申请涉及一种大模型问答知识库的生成方法及电子设备。其中,该方法包括:对获取的多源语料数据进行预处理,得到预处理后的多源语料数据;基于预处理后的多源语料数据的数据结构对预处理后的多源语料数据进行知识抽取,得到多源语料知识;将多源语料知识转换成问答对;对问答对进行去重与冲突消解,生成大模型问答知识库。本申请解决了现阶段生成用于大模型训练的问答知识库的技术对多源语料知识的解析与处理能力较差的技术问题。
技术关键词
表格
问答知识库
语义向量
数据
节点
层级
模板
答案
生成方法
符号
文本
机器可读介质
三元组
电子设备
索引
生成向量
关系
计算机
处理器
系统为您推荐了相关专利信息
设备启停控制
控制系统
设备状态监控
指令模块
仿真模拟技术
电子束检测设备
缺陷检测方法
光学邻近修正
图像处理模型
热点
预热器
随机森林模型
像素点
纹理特征
分类回归树算法