一种基于检索增强生成的端到端的大模型微调方法和系统

正文

推荐专利

申请号：CN202411581799

申请日期：2024-11-07

公开号：CN119719268A

公开日期：2025-03-28

类型：发明专利

摘要

本发明提出一种基于检索增强生成的端到端的大模型微调方法和系统，包括：读取用户历史问题的文本信息；利用分词器模型的语义提取模块对文本信息进行深层语义抽取得到关键语义输出；从数据库中获取编码后的语义向量，利用BGE检索模型和利用M3E向量模型对深层语义信息进行编码并召回相似信息，将两路召回后的向量语义信息进行合并；分别计算深度语义信息向量和文本信息向量在语义空间中与目标向量的KL散度，选取代价较小的输入到审查模块；将偏好数据利用DPO算法对模型进行训练，得到符合人类偏好的模型。该方法得到的微调后的模型在推理的过程中无需经过预处理，缓解因检索不精确而导致的模型幻觉，毒性等问题。

技术关键词

微调方法语义向量文本模块微调系统编码向量数据时间序列模型前馈神经网络词性信息融合策略处理器人类算法样本存储装置可读存储介质

系统为您推荐了相关专利信息

基于多模态数据融合的铁路智能运维安全传输方法及应用

多模态数据融合传输方法运维铁路服务端

新闻报道生成方法、装置及相关设备

机器人生成方法图像采集装置生成装置处理器

一种用于数据治理成效评估的数据质量监测系统

数据存储策略监测系统节点数据安全时间段数据访问

一种超宽带射频对消电路与方法

模块信号射频雷达回波

一种铌酸锂调制器驱动电路

光电调制器数模转换芯片电阻电解电容数模转换单元

一种基于检索增强生成的端到端的大模型微调方法和系统

站点导航

APP 下载