基于Embedding-FineTuning的检索增强生成改进方法

正文

推荐专利

申请号：CN202411689335

申请日期：2024-11-25

公开号：CN119621896A

公开日期：2025-03-14

类型：发明专利

摘要

本发明提出一种基于Embedding‑FineTuning的检索增强生成改进方法，对电力电网的大规模多源异构数据进行预处理和清洗，确保数据的一致性和质量，并基于LumberChunker技术对处理后的文本数据进行动态划分，根据语义转折点划分文本块，生成适合微调训练的文本块；然后，采用T5模型基于文本块进行多轮问答的问答对生成，形成用于微调的问答对数据集；针对电力电网领域的实际应用场景，设计定制化的prompt模板，以引导模型生成过程；在问答对数据集上进行Embedding‑FineTuning微调训练，通过优化模型参数，提升模型在电力电网领域中的嵌入表示性能和准确性。

技术关键词

问答对数据文本多源异构数据非暂态计算机可读存储介质语义修正错别字电力脱敏策略句法结构多轮对话检索系统处理器生成方式动态数据格式模板存储器训练集核心

系统为您推荐了相关专利信息

大模型语义编码的BIM数据与工程实体匹配系统和方法

实体间关系预训练语言模型实体匹配方法知识图谱构建大语言模型

一种基于超轻量实时分割网络的皮肤病变图像分割方法

图像分割方法超轻量输出特征编码器解码

读数识别方法和装置、网络训练方法和装置、设备及介质

数字仪表图像数字仪表读数图像分割网络样本网络训练方法

应用于铀浓缩辅控工艺的闭环控制器参数优化方法与系统

系统控制参数闭环控制器参数优化方法精简系统场景

系统数据的迁移方法及装置

数据项迁移方法数据存储节点公钥

基于Embedding-FineTuning的检索增强生成改进方法

站点导航

APP 下载