摘要
本申请公开了一种基于大模型的训练语料质量评估方法、装置、设备及存储介质,应用于包括数据集加载中心、文件预处理中心、文件预检中心与文件质检中心的评估系统架构,涉及人工智能技术领域,包括:基于预设质检模式在预设文件数据库中加载待质检数据集目录,并基于预设文件路径查询待质检数据集目录中的数据文件;处理各数据文件,得到待处理文件,并将各待处理文件封装为文件列表;对文件列表中的各待处理文件进行预过滤,并判断待处理文件是否需要进行格式转换,若需要,则转化待处理文件格式,得到待质检文件;利用文件质检器对待质检文件进行文件质检,得到质检结果,以评估质检结果,得到评估结果。这样能够提高质量评估训练语料的速度。
技术关键词
目录
列表
评估系统
分片
质检方法
模式
分布式文件
解析器
过滤器
人工智能技术
表格
封装模块
评估装置
检测工具
过滤模块
数据格式
编码
可读存储介质
系统为您推荐了相关专利信息
报告生成系统
列表
正电子发射断层扫描
模型超参数
分段
电力巡检
合规性
卷积神经网络模型
运动特征
序列
随机森林模型
清扫模块
控制中心
数据采集模块
图像采集传感器
隐私保护方法
多层次隐私保护
数据一致性验证
零知识证明
动态
联邦学习方法
云服务器
区块链系统
节点
分布式文件管理系统