大模型数据智能标注方法及系统

AITNT
正文
推荐专利
大模型数据智能标注方法及系统
申请号:CN202411949511
申请日期:2024-12-27
公开号:CN119378564B
公开日期:2025-04-25
类型:发明专利
摘要
本申请涉及数据标注技术领域,其具体地公开了一种大模型数据智能标注方法及系统,其采用基于深度学习的自然语言处理技术对未标注文本数据集中的各个未标注文本数据进行置信度评估,选择最小置信度对应的文本数据作为代表样本数据,并对所述代表样本数据进行语料扩充,进而,通过对所述代表样本数据和语料扩充后的代表样本数据进行语义特征提取和补偿式交互融合,以充分利用两者之间的共有信息和独特信息,从而实现对所述代表样本数据的全面语义理解和智能标注。通过这种方式,可以显著提高数据标注的效率和准确性,同时大幅度减少人工干预的需求,降低标注成本。
技术关键词
样本 代表 智能标注方法 文本 补偿式 编码向量 特征提取网络 扩充模块 Sigmoid函数 数据标注技术 语义特征提取 标注系统 大语言模型 分类器 特征值 自然语言
系统为您推荐了相关专利信息
1
一种基于U盾和SIMKey的个人移动去中心化AI社交方法
粉丝 服务端 云端 关系型数据库 问答模型
2
电子元器件分类预测方法及装置
三维电路板 电子元器件 深度学习模型 神经网络模型 分类预测方法
3
基于高光谱与生理生化参数的鼠害油松受害程度判定方法
反射率数据 辐射仪 判定方法 森林模型 平滑方法
4
基于因果大语言模型的强化学习决策优化方法、系统及设备
大语言模型 决策优化方法 动态修正结构 策略 融合语义
5
时序知识图谱预测模型的训练方法及装置
神经网络预测模型 时序 图谱 样本 马尔可夫逻辑网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号