摘要
本发明公开一种基于RAG的电气协议书信息提取方法,包括:根据已知的电气文本及收集的电气概念生成训练数据集,并基于所述训练数据集对文本嵌入模型进行调整;在提取电气协议书中的信息时,基于调整后的所述文本嵌入模型,以及预定的规则拒答机制及预定的不确定性的检测机制,识别并拒绝错误答案,筛选获得符合要求的回答作为提取获得的电气协议书信息。本发明的实现可以对文本嵌入模型进行调整,使其在处理电气相关文本时具有更高的准确性和有效性。同时,本发明实施例中还引入了回答质量检测机制,以确保最终输出的答案准确且可信。
技术关键词
文本
电气
信息提取方法
生成训练数据
答案
机制
概念
有效性
语义
格式
定义