大模型数据筛选方法、设备和存储介质

AITNT
正文
推荐专利
大模型数据筛选方法、设备和存储介质
申请号:CN202510315007
申请日期:2025-03-18
公开号:CN119848257A
公开日期:2025-04-18
类型:发明专利
摘要
本发明涉及模型数据处理领域,公开了一种大模型数据筛选方法、设备和存储介质,该方法包括:获取各待筛选数据,针对每条待筛选数据,确定至少一个对应的质量评估指标,并根据各待筛选数据的各质量评估指标,确定各第一过滤数据;将各第一过滤数据输入至预先确定的专业性评估大语言模型中,确定各第一过滤数据对应的专业评估指标,并根据各第一过滤数据的专业评估指标,确定各第二过滤数据;对各第二过滤数据进行聚类分析,确定类别数据标准差,并根据所述类别数据标准差,对各第二过滤数据进行均衡处理,得到用于大模型微调的专业数据。通过本发明的技术方案,实现了为模型微调提供高质量的数据的效果,显著提升了数据处理效率。
技术关键词
数据筛选方法 指标 专业 大语言模型 指令 可读存储介质 矩阵 电子设备 计算机 核心 语义 程序 存储器 处理器 元素
系统为您推荐了相关专利信息
1
基于GNSS垂直位移反演地表质量负荷的方法、计算机系统
反演地表 计算机程序模块 反演模型 非暂时性计算机可读 负荷
2
一种大型模块顶升系统的控制方法、设备及介质
顶升系统 建筑模块 受力 复杂度 系统控制技术
3
基于KAN改进的yolo10n模型、图像识别方法、系统及存储介质
图像识别方法 实时图像信息 降维特征 尺寸 图像识别系统
4
一种非在运电缆数字化在线监测方法
在线监测方法 监测终端 实时监测数据 电缆 参数
5
数据处理的方法、装置、设备及介质
噪声系数 传感器 算法 惯性导航系统 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号