摘要
本发明公开了一种基于思维链的电力大语言模型增强方法及系统,包括采集海量电力问答文本数据。本发明通过将图片类型的非结构化数据转化为文本类型数据,并对其进行异常值去除,使得文本数据更加的准确;本发明基于思维链技术,模拟人类解决问题时的思考过程,对于用户提出的问题数据,分析出问题的关键词,对每一个关键词对应的问题以及解答综合建立问答索引,思维链中的每个步骤都是有逻辑关系的,确保推理的连贯性和准确性,事实上,关键词也会有对应的同义词,使得用户提出的问题本质属于同一种问题,例如“电价是涨了吗”和“电费最近上升了吗”具备极高的相似度,通过这种方式,细化索引,增强检索能力。
技术关键词
大语言模型
文本
同义词
电力
关键词特征
海量历史
处理单元
数据建立索引
异常数据
模块
矩阵
网格
意图
度量
自然语言
实体
参数
系统为您推荐了相关专利信息
夜间灯光数据
空间聚类算法
土地利用数据
碳排放管理
排放量
语义分割模型
拼接模块
图像编码器
文本编码器
视觉特征
饮食推荐方法
大语言模型
注意力模型
生理
画像特征