摘要
一种面向航天控制软件表格数据的序列化处理和检索方法,属于航空航天技术领域,包括:读取航天控制软件表格数据,将表格元素用占位符表示;根据数据清洗后的表格数据构造LLM的输入,将LLM的输出回填至对应占位符处,并将回填后的表格数据存储至知识库中;根据预处理后的表格数据构建数据集,并在此数据集的基础上对LLM进行继续预训练;根据所述知识库离线部署检索增强生成大模型检索框架。本发明提取软件文档中的表格数据,利用大模型推理得到和原始的文本数据融合来训练领域大模型,并利用检索增强技术提升大模型对表格知识的理解和应用,提升软件开发人员对航天嵌入控制软件领域内以表格形式所承载的软件资产内容的理解。
技术关键词
表格
检索方法
文本段落
大语言模型
预训练语言模型
软件开发人员
自然语言文本
预训练方法
航空航天技术
编码器
检索设备
数据存储
可读存储介质
离线
处理器
度函数
系统为您推荐了相关专利信息
后门
大语言模型
视觉触发器
生成对抗网络
有效性
风险报告生成方法
对象
风险点
报告生成装置
电子设备