摘要
本发明公开了一种基于微调大语言模型的代码静态审查方法及系统,属于软件静态测试技术领域。该方法包括:收集并预处理代码静态规则集,根据编程语言和项目需求筛选标准规则,分级归类并去重;通过开源代码分析、故障植入及大语言模型生成三种方式构建正反示例程序数据集,结合模板整合为结构化训练数据;选择适配代码推理任务的基座模型,采用LoRA微调方法优化模型参数,通过输出层设计预测代码规则违例情况;基于指标评估模型性能。本发明增强了静态审查的效率,包括报告的可读性,友好的交互与可扩展性,通过提升代码上下文理解的能力减少误报和漏报,并实现跨语言跨平台的便携性。
技术关键词
大语言模型
软件静态测试技术
微调方法
规则集
生成结构化数据
矩阵分解技术
引入注意力机制
程序
模板
覆盖率
开源项目
裁剪技术
生成规则
生成方式
模块
基座
批量
优化器
冗余
系统为您推荐了相关专利信息
大语言模型
数据处理方法
列表
特征值
非对称加密算法
自动编排方法
智能体模型
大语言模型
时间序列预测模型
强化学习模型
大语言模型
邮件服务器
原始邮件内容
模板
电子邮件系统
图像特征向量
答案生成方法
大语言模型
多模态
分层