摘要
本发明属于电子数据处理的领域,具体涉及基于大模型微调与向量嵌入的商品自动分类方法;本发明的方法通过选取如BERT、GPT等预训练模型,并在商品名称与描述等文本上进行微调,可在保持通用语义理解的同时强化商品领域特征识别。主要包括数据收集与清洗、建立通用大模型、向量嵌入微调、分类推理与评估优化等步骤,利用联合损失函数将预训练损失与分类损失加权融合,并通过向量化手动标签聚合度指标对自动分类结果进行迭代评估与调整。该方法能显著提升商品分类的准确度与鲁棒性,降低人工标注成本,并具备良好的迁移性与可部署性。
技术关键词
商品自动分类方法
联合损失函数
标签
样本
超参数
消费品
高维向量空间
训练集
梯度下降算法
文本
编码
数据嵌入
分类特征
指标
序列
数据存储
分类器
鲁棒性
系统为您推荐了相关专利信息
交通流量预测
动态交互方法
预测交通流量
交通流量监测
三维动态模型
对话生成方法
编码器
关系
上下文特征
预训练语言模型
集成特征选择方法
位点
隐马尔可夫模型
机器可读指令
图形化操作界面
分配控制方法
设备监测系统
增广拉格朗日
电能消耗量
燃料消耗量