摘要
本申请公开了一种训练数据的生成方法和电子设备,涉及模型数据训练技术领域,通过训练后解析树模型的精准符号追踪和跨文件引用解析,生成的结构化数据更准确地反映了代码库中符号的使用情况和语义关系,为后续生成的训练数据提供了坚实的基础。关联结构化数据与技术规范文档,生成的知识库包含了代码符号的官方定义和功能描述,这能够极大地增强大模型对底层系统代码的理解能力。全局符号表的构建考虑到了条件编译和多架构支持,这使得生成的训练数据能够覆盖不同的编译配置和架构,增强了模型的泛化能力和实用性。因此,可以解决现有方案难以在复杂场景下生成有效训练数据的问题。
技术关键词
生成方法
符号
关系
对源代码
定义
生成训练数据
节点
编辑距离算法
逻辑
目录
电子设备
代码库
标记
参数
程序
文本
列表
变量
存储器
系统为您推荐了相关专利信息
低位发热量
对象
煤质化验
监测方法
模糊控制算法
历史交互信息
信息变更
二维码生成方法
基准
文本识别
管理优化方法
协同进化算法
序列
需求预测模型
AGV调度管理