摘要
本发明公开了基于垂直领域大模型的交通运输数据分类方法及装置,涉及交通运输数据处理与分析相关领域,该方法包括:配置垂直领域训练数据源链接,采集垂直领域预训练数据集并与5‑10倍于它的数据量的通用预训练数据集混合生成预训练数据集,构建包含多种数据集的大模型微调训练数据集,基于预训练数据集生成交通运输数据分类预训练模型,用特定数据集对其微调训练得到交通运输数据分类大模型,最终用该大模型进行交通运输数据分类。解决了现有交通运输数据分类技术中数据采集困难、质量欠佳、分类标准不精细全面、模型单一且适应性不足导致分类精准度和可靠性低的技术问题,达到了提高交通运输数据分类的准确性和可靠性的技术效果。
技术关键词
分类模型构建
数据分类方法
预训练模型
验证码图片
字段
数据接口
序列
链接模块
数据分类技术
数据分类装置
语义
频率
汉明距离
冗余
标识
图表