摘要
本发明提出一种水利行业大模型的问答准确度提升方法,包括如下步骤:收集多源数据,对多源数据进行预处理;对预处理后的数据进行深度挖掘并提取水利设施信息,同步识别各类水文要素,构建水利知识图谱;根据水利知识图谱模拟生成洪水场景下水利的数据,同时采用文本数据增强技术进行句子重组,改变句子结构但保持语义不变;通过历史的水利数据与更新后的新数据对比分析,结合数据的重要性权重评估,筛选出权重高的新数据优先纳入水利知识图谱更新;利用检索增强生成技术对检索到的知识、生态环境标准以及深度学习模型学习到水利知识图谱的知识,和语义深度融合进行综合分析,在水利行业大模型中准确生成水利工程建设对生态环境影响问题的回答。
技术关键词
深度学习模型
图谱
生态环境影响
多模态交互
非暂态计算机可读存储介质
语义
水利设施
生成技术
模拟模型
数据清洗算法
自然语言文本
遥感影像数据
对齐技术
处理器
水文
检索算法
计算机程序产品
跨模态