基于大模型的训练语料质量评估方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510372121

申请日期：2025-03-27

公开号：CN120162432A

公开日期：2025-06-17

类型：发明专利

摘要

本申请公开了一种基于大模型的训练语料质量评估方法、装置、设备及存储介质，应用于包括数据集加载中心、文件预处理中心、文件预检中心与文件质检中心的评估系统架构，涉及人工智能技术领域，包括：基于预设质检模式在预设文件数据库中加载待质检数据集目录，并基于预设文件路径查询待质检数据集目录中的数据文件；处理各数据文件，得到待处理文件，并将各待处理文件封装为文件列表；对文件列表中的各待处理文件进行预过滤，并判断待处理文件是否需要进行格式转换，若需要，则转化待处理文件格式，得到待质检文件；利用文件质检器对待质检文件进行文件质检，得到质检结果，以评估质检结果，得到评估结果。这样能够提高质量评估训练语料的速度。

技术关键词

目录列表评估系统分片质检方法模式分布式文件解析器过滤器人工智能技术表格封装模块评估装置检测工具过滤模块数据格式编码可读存储介质

系统为您推荐了相关专利信息

基于分段提取推理学习的PET报告生成系统

报告生成系统列表正电子发射断层扫描模型超参数分段

一种电力巡检行为的合规性评估方法、系统、介质及设备

电力巡检合规性卷积神经网络模型运动特征序列

一种用于皮带输送机的智能清扫评估方法

随机森林模型清扫模块控制中心数据采集模块图像采集传感器

一种基于区块链的动态分片脱敏隐私保护方法

隐私保护方法多层次隐私保护数据一致性验证零知识证明动态

一种车联网中安全高效的车况预测联邦学习方法

联邦学习方法云服务器区块链系统节点分布式文件管理系统

基于大模型的训练语料质量评估方法、装置、设备及存储介质

站点导航

APP 下载