基于大模型的训练语料质量评估方法、装置、设备及存储介质

AITNT
正文
推荐专利
基于大模型的训练语料质量评估方法、装置、设备及存储介质
申请号:CN202510372121
申请日期:2025-03-27
公开号:CN120162432A
公开日期:2025-06-17
类型:发明专利
摘要
本申请公开了一种基于大模型的训练语料质量评估方法、装置、设备及存储介质,应用于包括数据集加载中心、文件预处理中心、文件预检中心与文件质检中心的评估系统架构,涉及人工智能技术领域,包括:基于预设质检模式在预设文件数据库中加载待质检数据集目录,并基于预设文件路径查询待质检数据集目录中的数据文件;处理各数据文件,得到待处理文件,并将各待处理文件封装为文件列表;对文件列表中的各待处理文件进行预过滤,并判断待处理文件是否需要进行格式转换,若需要,则转化待处理文件格式,得到待质检文件;利用文件质检器对待质检文件进行文件质检,得到质检结果,以评估质检结果,得到评估结果。这样能够提高质量评估训练语料的速度。
技术关键词
目录 列表 评估系统 分片 质检方法 模式 分布式文件 解析器 过滤器 人工智能技术 表格 封装模块 评估装置 检测工具 过滤模块 数据格式 编码 可读存储介质
系统为您推荐了相关专利信息
1
基于分段提取推理学习的PET报告生成系统
报告生成系统 列表 正电子发射断层扫描 模型超参数 分段
2
一种电力巡检行为的合规性评估方法、系统、介质及设备
电力巡检 合规性 卷积神经网络模型 运动特征 序列
3
一种用于皮带输送机的智能清扫评估方法
随机森林模型 清扫模块 控制中心 数据采集模块 图像采集传感器
4
一种基于区块链的动态分片脱敏隐私保护方法
隐私保护方法 多层次隐私保护 数据一致性验证 零知识证明 动态
5
一种车联网中安全高效的车况预测联邦学习方法
联邦学习方法 云服务器 区块链系统 节点 分布式文件管理系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号