摘要
本申请公开了一种训练数据集的处理方法以及运价文件的解析方法。涉及数据处理领域,该方法包括:获取航空运输价单数据,并获取航空机构使用的运价数据接口文档,从运价数据接口文档中提取基础运输价单数据;对航空运输价单数据进行拆解,得到M组运价数据,并将M组运价数据进行标注,得到标注后的运价数据,其中,标注后的运价数据至少包括:规则类型、通用规则类型以及注释类型;根据标注后的运价数据和基础运输价单数据生成用于模型训练的数据集,其中,模型数据集包括文档集合和文档关联的数据集合。通过本申请,解决了相关技术中人工标注训练数据集存在的成本高、效率低和准确度受限的技术问题。
技术关键词
数据接口
基础
字段
解析方法
客户端
管理系统
数据生成模型
脚本
航空
计算机程序产品
数据存储
内存
处理器
电子设备
指令
受限
格式
存储器
系统为您推荐了相关专利信息
多路径优化方法
低空无人机
送货系统
无人机飞行数据
送货无人机
卫星终端
射频芯片
车载语音模块
天线单元
SIM卡
三次样条插值算法
刷新率
客户端
信号处理方法
队列
统一数据结构
数据清洗算法
解析器
标准化接口
路由器