一种基于AST抽象语法树同义替换的代码大模型等价数据增强方法

AITNT
正文
推荐专利
一种基于AST抽象语法树同义替换的代码大模型等价数据增强方法
申请号:CN202510077454
申请日期:2025-01-17
公开号:CN120010852A
公开日期:2025-05-16
类型:发明专利
摘要
本发明属于智能软件工程的数据增强方法领域,尤其涉及一种基于AST抽象语法树同义替换的代码大模型等价数据增强方法。首先进行数据筛选和静态语法分析检查,之后通过AST抽象语法树提取其代码所含变量名、函数名、类名建立词库进行筛选,在此基础上采用四种等价替换方法进行数据增强,最终将其与原始数据合并,获得最后的增强代码数据集。本发明可用于自动增强代码大模型训练语料,以微调提升大语言模型在垂直领域的性能。
技术关键词
抽象语法树 数据 智能软件工程 卷积神经网络训练 大语言模型 同义词 自然语言 检查工具 种子 模板 英语 字母 字符 文本 规模 格式 逻辑 定义 工业 接口
系统为您推荐了相关专利信息
1
一种基于智能化的建筑对比分析方法
三维空间模型 分析方法 建筑外立面 建筑材料 许可
2
高准确率的户型图内轮廓分割方法、系统及设备
多层特征融合 轮廓分割方法 多尺度特征金字塔 解码器 卷积神经网络提取
3
一种应用于燃气炉的控制电路
主控模块 燃气炉 控制电路 三端稳压器 感应模块
4
健康管理方案的生成方法、相关装置及计算机存储介质
生成方法 融合特征提取 计算机存储介质 风险评估模型 多标签分类算法
5
刚柔耦合结构的打磨机器人智能打磨头及墙面检测方法
墙面检测方法 测距传感器 打磨机器人 压力传感器阵列 耦合结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号