摘要
本发明公开了一种基于特征工程的智能海关商品归类模型的建立方法,包括根据商品规范申报目录梳理目标税号的归类特征要素;使用正则表达式对特征做初步提取;人工校正和标注程序提取的特征;对特征进行数字化标注;将Bert和CRF结合,构建人工智能训练模型并使用标注数据开展特征识别训练;对训练结果进行评估,直到识别准确率达标,停止训练;使用Bert模型作为基座进行训练,选择合适的损失函数、定义梯度更新策略,设计训练循环与停止策略,并采用早停等技术防止过拟合,提升模型的泛化能力。本发明不仅可保证较高的查全率和查准率,其算法和流程设计保持了对算力的较低要求,实测显示8G显存即可满足要求,并且推理速度达到每小时15‑18万条。
技术关键词
特征工程
标签编码器
数据
语义特征
样本
正则化技术
文本
CRF模型
字典结构
机器学习模型
特征提取器
策略
数字型
目录
处理器
调度器
序列
定义
优化器
系统为您推荐了相关专利信息
情景
预测模型构建方法
动态调整机制
LEAP模型
蒙特卡洛模拟方法
客户端
联邦学习系统
拍卖机制
标签
联邦学习方法
控制决策方法
辅助定位技术
环境感知数据
车载传感器
蜂窝车联网
电成像测井
实时数据采集
孔隙度分析
坐标系
单层
水肥一体化系统
样本采集装置
调控方法
肥料
泵送机构