摘要
本发明提出片段级对齐数据自动构建方法、设备及可读存储介质,属于数据处理技术领域,为解决现有数据对齐方法中构建的程序级对齐数据,不利于模型学习语法对齐知识,且未提及如何构建片段级对比数据的问题,包括:S1:基于大模型对源语言程序插入注释;S2:根据插入注释后的源语言程序对目标程序进行改写,在目标程序中生成和源语言程序内容和顺序一致的注释;S3:将源语言程序和目标程序分割为包含对应注释的若干个代码片段,根据代码片段的注释对源语言程序和目标程序的代码片段进行一一匹配,得到片段级对齐数据。
技术关键词
自动构建方法
程序
数据对齐方法
大语言模型
数据处理技术
处理器
计算机设备
可读存储介质
存储器
系统为您推荐了相关专利信息
火电机组碳排放
遗传算法
深度Q网络
监测方法
机组运行约束
微血栓检测
分析系统
凸透镜
声光调制器
微流控装置
数据推送方法
风电
多用户
构建用户画像
LSTM模型
亲本
高产花生
种质资源
计算机存储介质
选育方法