一种基于形状大模型的样本均衡方法

正文

推荐专利

一种基于形状大模型的样本均衡方法

申请号：CN202411949704

申请日期：2024-12-27

公开号：CN119785149A

公开日期：2025-04-08

类型：发明专利

摘要

本发明涉及一种基于形状大模型的样本均衡方法，包括以下步骤S1、对样貌特征进行提取；并将得到特征进行拼接，拼接得到的特征向量即为样貌特征；S2、类内聚类；将每一类中的样本，基于样貌特征，使用k‑means算法进行聚类；S3、类间子类聚类；每一类经过k‑means聚类后获得子类，将子类的中心再进行聚类；S4、计算各子类增删数量；S5、样本精简以及样本增强。本发明通过训练出基于形状的大模型，再结合文本与图像间相互转换的信息，生成具有较强可分性的特征，结合机器学习算法筛选样本，使得样本在类别与样貌上分布均匀；通过均衡各类别与样貌的样本，获得了质量更高，更具代表性的的样本，提升了训练数据的质量，从而提高了模型效果的上限。

技术关键词

均衡方法样本聚类预处理算法机器学习算法文本图像工位训练集远距离线状数据参数片状

系统为您推荐了相关专利信息

一种基于机器学习的键合机焊接质量检测方法

焊点聚类坐标系数据更新速率

一种低空组网邻区规划方法及设备

小区邻区规划方法组网神经网络模型节点

一种电力系统软件安全漏洞动静态结合检测方法

静态代码缺陷动静态分层卷积神经网络动态协议特征

一种航天遥感信息移动终端模拟系统

模拟系统移动终端智能识别模块神经网络模型构建基础

一种可替换外泌体提取芯片

缓冲垫片芯片滤膜外泌体提取技术密封圈

一种基于形状大模型的样本均衡方法

站点导航

APP 下载