摘要
本发明涉及大语言模型技术领域,具体为一种清洗大语言模型训练图片的方法及系统,包括自动检查并删除损坏图像,加载并处理图像以删除模糊图像,并行处理任务且采用流式处理,删除重复图像,最终验证与存储;有益效果为:实现图像数据的自动化清洗,减少人工干预,提高处理效率。通过去噪、去模糊、格式统一等操作,显著提高图像质量,增强模型训练效果。提高算力资源利用率,避免因低质量数据导致的资源浪费。适用于多种大语言模型训练场景,可根据需求灵活调整参数和流程。
技术关键词
大语言模型
图片
优化系统资源
评估图像清晰度
模糊阈值
拉普拉斯
图像处理
列表
训练场景
有效性
数据
存储模块
专业
样本
格式
参数
系统为您推荐了相关专利信息
智能匹配方法
配镜
无框眼镜
全自动磨边机
眼镜参数
智能合约代码
审计方法
抽象语法树
大语言模型
漏洞
敏感信息检测方法
图片
信息检测系统
信息检测模块
文本编码器