摘要
本发明公开了基于RAG与DPO的生化实验自动化脚本训练生成方法,方法包括:收集生化实验技术文档作为外部知识库;融合BM25和Faiss构建混合检索器;利用大型语言模型生成实验流程描述,确定设备、协议及材料,以此为依据从知识库检索相关文档;基于检索结果生成实验脚本,经平台模拟验证,验证失败的脚本进行迭代优化;将成功与失败脚本标记为偏好数据对,构建训练集;采用直接偏好优化对本地大型语言模型进行LoRA微调;根据用户输入的目标及器具提示,使用经过直接偏好优化训练后的大型语言模型生成验证通过的实验脚本。本发明显著提升脚本生成自动化水平与通过率,降低人工干预成本,为生化实验的自动化提供高效解决方案。
技术关键词
生成方法
脚本标记
适配器
实验室器具
文本
模板
sigmoid函数
语义向量
消息
数据
自然语言
分割器
构建训练集
线性模块
列表
格式
检索方法
注意力
矩阵
系统为您推荐了相关专利信息
位置编码信息
融合编码信息
像素点
风格图像生成方法
图像编码
权重更新方法
融合规则
阶段
文档生成方法
动态优先级排序
数据检测方法
大语言模型
生成文本内容
预测类别
文本分类模型