一种面向能源电力领域知识检索模型的数据构造及微调方法

AITNT
正文
推荐专利
一种面向能源电力领域知识检索模型的数据构造及微调方法
申请号:CN202510252833
申请日期:2025-03-05
公开号:CN120179781A
公开日期:2025-06-20
类型:发明专利
摘要
本发明公开了一种面向能源电力领域知识检索模型的数据构造及微调方法,其中方法包括:对能源电力领域的文档数据,进行预处理,将文档数据切分为适合检索模型输入的文档片段;执行基于大语言模型的问题生成,依据文档片段,生成问题‑文档对正样本集,采样生成问题‑文档对负样本集;结合正样本集和负样本集对比学习及LoRA参数微调,训练检索模型,利用训练后检索模型进行问题检索。本发明通过生成高质量的问题‑文档对和具有挑战性的负样本,结合对比学习技术,优化检索模型,显著提升向量模型在该领域的检索准确率,能够深刻理解能源电力领域的特定检索需求,生成高度可靠且符合该领域习惯的检索建议。
技术关键词
微调方法 样本 文本切分方法 电力 能源 数据 文本段落 非暂态计算机可读存储介质 大语言模型 文本关键信息 高维向量空间 语义 关键词 行业术语 生成高度 矩阵 处理器 生成规则 参数
系统为您推荐了相关专利信息
1
多模态数据的数字标签生成方法、设备、存储介质及产品
标签生成方法 文本 编码器 多模态 重构图像数据
2
一种基于人工智能的计算机数据安全防护方法
代码结构 机器学习模型 样本 监控日志 数据
3
无创产前胎儿染色体检测方法、装置及试剂盒
拷贝数 样本 基因组测序数据 磁珠纯化 无创产前胎儿
4
一种用于滑雪度假区地表覆盖分类的三分支语义分割方法
地表覆盖分类 语义分割方法 分支 语义分割网络 多尺度特征
5
一种基于动态等时圈和车辆轨迹的货车超范围营运研判方法
货车 研判方法 交通监控设备 车辆轨迹预测 交通运行状态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号