摘要
本发明提供了一种基于多模型协作的数据标注方法,所述方法包括对原始数据进行清洗和格式转换,生成结构化数据;采用预训练模型对所述结构化数据进行筛选,并对筛选出的目标数据进行人工复核,得到训练数据集;基于所述训练数据集对标注模型进行训练;在测试数据集上运行训练后的标注模型,对错误标注的数据进行筛查和人工修正,并将修正后的数据用于模型的再次训练;对新增数据集进行二分类筛选,并基于向量化处理和相似度计算筛选低相似度数据,将所述低相似度数据回流至所述训练数据集。本发明通过多模型协作优化数据标注过程,提升数据处理效率与准确性,减少人工干预,确保模型训练高效进行,适应多样化数据。
技术关键词
数据标注方法
多模型
生成结构化数据
预训练模型
数据标注系统
格式
通信接口
模型训练模块
服务器集群
可读存储介质
数据处理模块
处理器
样本
存储器
计算机
指令
在线
噪声
系统为您推荐了相关专利信息
馈电链路
模式
性能预测模型
故障预测模型
终端通信方法
三维模型构建方法
二维图像信息
点云模型
训练神经网络
建筑物
亲和力
药物
多模态特征融合
节点特征
靶标相互作用
文本情感分析方法
句法依存关系
三元组
词语依存关系
情感分析模型