基于RAG与DPO的生化实验自动化脚本训练生成方法

正文

推荐专利

申请号：CN202510516552

申请日期：2025-04-23

公开号：CN120633819A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了基于RAG与DPO的生化实验自动化脚本训练生成方法，方法包括：收集生化实验技术文档作为外部知识库；融合BM25和Faiss构建混合检索器；利用大型语言模型生成实验流程描述，确定设备、协议及材料，以此为依据从知识库检索相关文档；基于检索结果生成实验脚本，经平台模拟验证，验证失败的脚本进行迭代优化；将成功与失败脚本标记为偏好数据对，构建训练集；采用直接偏好优化对本地大型语言模型进行LoRA微调；根据用户输入的目标及器具提示，使用经过直接偏好优化训练后的大型语言模型生成验证通过的实验脚本。本发明显著提升脚本生成自动化水平与通过率，降低人工干预成本，为生化实验的自动化提供高效解决方案。

技术关键词

生成方法脚本标记适配器实验室器具文本模板 sigmoid函数语义向量消息数据自然语言分割器构建训练集线性模块列表格式检索方法注意力矩阵

系统为您推荐了相关专利信息

风格图像生成方法、装置、计算机设备和可读存储介质

位置编码信息融合编码信息像素点风格图像生成方法图像编码

基于大语言模型的排水设施调度系统及方法

大语言模型排水设施分析单元调度系统关键字

一种基于可信数据空间的数据交换安全验证方法

验证方法数据元素风险单体

基于多源数据融合的智慧文档生成方法

权重更新方法融合规则阶段文档生成方法动态优先级排序

一种基于阅读理解的违规数据检测方法

数据检测方法大语言模型生成文本内容预测类别文本分类模型

基于RAG与DPO的生化实验自动化脚本训练生成方法

站点导航

APP 下载