摘要
本发明公开了一种结合生成式语言模型与语义文档图谱的多文档问答检索方法,所述方法进一步完善和优化了文档知识图谱的构建与遍历方式,分别设计基于bert类模型去构建图谱构建,设计KGP3算法优化检索遍历方式。在图谱遍历过程中,结合主问题及已获得节点,生成涉及下一个需要节点信息的子问题,从邻居节点中精确挑选出最合适的文档节点,并判断该节点与初始问题的相关性,若不相关,则不列入后续检索列表。这种方法不仅高效且具备可追溯性和可解释性,同时抽象概括了模型在图谱遍历中选择下一跳节点的整体过程。为了降低成本,还对小型编码器‑解码器T5模型进行了改进,并在该模型中引入对比学习机制,进一步提升了小型模型的检索性能。
技术关键词
问答检索方法
节点
图谱
预训练语言模型
小型编码器
解码器模型
文本
分词
遍历方式
邻居
语义特征提取
算法
代表
表达式
词语
样本
大语言模型
系统为您推荐了相关专利信息
交直流混联电网
辨识方法
故障诊断模型
多头注意力机制
运维策略
电缆敷设方法
附属设备
蚁群算法
客户机架构
机电工程设备
复合材料结构
MonteCarlo方法
参数
结构失效概率
复材结构
负荷预测方法
负荷预测模型
前馈神经网络
三元组
模型预测值