一种清洗大语言模型训练图片的方法及系统

AITNT
正文
推荐专利
一种清洗大语言模型训练图片的方法及系统
申请号:CN202511029254
申请日期:2025-07-25
公开号:CN120953109A
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及大语言模型技术领域,具体为一种清洗大语言模型训练图片的方法及系统,包括自动检查并删除损坏图像,加载并处理图像以删除模糊图像,并行处理任务且采用流式处理,删除重复图像,最终验证与存储;有益效果为:实现图像数据的自动化清洗,减少人工干预,提高处理效率。通过去噪、去模糊、格式统一等操作,显著提高图像质量,增强模型训练效果。提高算力资源利用率,避免因低质量数据导致的资源浪费。适用于多种大语言模型训练场景,可根据需求灵活调整参数和流程。
技术关键词
大语言模型 图片 优化系统资源 评估图像清晰度 模糊阈值 拉普拉斯 图像处理 列表 训练场景 有效性 数据 存储模块 专业 样本 格式 参数
系统为您推荐了相关专利信息
1
一种用于私人定制的无框眼镜的智能匹配方法
智能匹配方法 配镜 无框眼镜 全自动磨边机 眼镜参数
2
一种基于超图结构知识表示的检索增强生成的问答方法
实体 自然语言 问答方法 计算机可执行指令 答案
3
智能合约代码审计方法、装置、计算机设备和存储介质
智能合约代码 审计方法 抽象语法树 大语言模型 漏洞
4
图片敏感信息检测方法及系统
敏感信息检测方法 图片 信息检测系统 信息检测模块 文本编码器
5
幻灯片展示方向切换方法及装置
大语言模型 元素 语义主题 页面尺寸 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号