一种面向能源电力领域知识检索模型的数据构造及微调方法

正文

推荐专利

申请号：CN202510252833

申请日期：2025-03-05

公开号：CN120179781A

公开日期：2025-06-20

类型：发明专利

摘要

本发明公开了一种面向能源电力领域知识检索模型的数据构造及微调方法，其中方法包括：对能源电力领域的文档数据，进行预处理，将文档数据切分为适合检索模型输入的文档片段；执行基于大语言模型的问题生成，依据文档片段，生成问题‑文档对正样本集，采样生成问题‑文档对负样本集；结合正样本集和负样本集对比学习及LoRA参数微调，训练检索模型，利用训练后检索模型进行问题检索。本发明通过生成高质量的问题‑文档对和具有挑战性的负样本，结合对比学习技术，优化检索模型，显著提升向量模型在该领域的检索准确率，能够深刻理解能源电力领域的特定检索需求，生成高度可靠且符合该领域习惯的检索建议。

技术关键词

微调方法样本文本切分方法电力能源数据文本段落非暂态计算机可读存储介质大语言模型文本关键信息高维向量空间语义关键词行业术语生成高度矩阵处理器生成规则参数

系统为您推荐了相关专利信息

多模态数据的数字标签生成方法、设备、存储介质及产品

标签生成方法文本编码器多模态重构图像数据

一种基于人工智能的计算机数据安全防护方法

代码结构机器学习模型样本监控日志数据

无创产前胎儿染色体检测方法、装置及试剂盒

拷贝数样本基因组测序数据磁珠纯化无创产前胎儿

一种用于滑雪度假区地表覆盖分类的三分支语义分割方法

地表覆盖分类语义分割方法分支语义分割网络多尺度特征

一种基于动态等时圈和车辆轨迹的货车超范围营运研判方法

货车研判方法交通监控设备车辆轨迹预测交通运行状态

一种面向能源电力领域知识检索模型的数据构造及微调方法

站点导航

APP 下载