一种基于检索增强生成的端到端的大模型微调方法和系统

AITNT
正文
推荐专利
一种基于检索增强生成的端到端的大模型微调方法和系统
申请号:CN202411581799
申请日期:2024-11-07
公开号:CN119719268A
公开日期:2025-03-28
类型:发明专利
摘要
本发明提出一种基于检索增强生成的端到端的大模型微调方法和系统,包括:读取用户历史问题的文本信息;利用分词器模型的语义提取模块对文本信息进行深层语义抽取得到关键语义输出;从数据库中获取编码后的语义向量,利用BGE检索模型和利用M3E向量模型对深层语义信息进行编码并召回相似信息,将两路召回后的向量语义信息进行合并;分别计算深度语义信息向量和文本信息向量在语义空间中与目标向量的KL散度,选取代价较小的输入到审查模块;将偏好数据利用DPO算法对模型进行训练,得到符合人类偏好的模型。该方法得到的微调后的模型在推理的过程中无需经过预处理,缓解因检索不精确而导致的模型幻觉,毒性等问题。
技术关键词
微调方法 语义向量 文本 模块 微调系统 编码向量 数据 时间序列模型 前馈神经网络 词性信息 融合策略 处理器 人类 算法 样本 存储装置 可读存储介质
系统为您推荐了相关专利信息
1
基于多模态数据融合的铁路智能运维安全传输方法及应用
多模态数据融合 传输方法 运维 铁路 服务端
2
新闻报道生成方法、装置及相关设备
机器人 生成方法 图像采集装置 生成装置 处理器
3
一种用于数据治理成效评估的数据质量监测系统
数据存储策略 监测系统 节点数据安全 时间段 数据访问
4
一种超宽带射频对消电路与方法
模块 信号 射频 雷达 回波
5
一种铌酸锂调制器驱动电路
光电调制器 数模转换芯片 电阻 电解电容 数模转换单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号