一种基于形状大模型的样本均衡方法

AITNT
正文
推荐专利
一种基于形状大模型的样本均衡方法
申请号:CN202411949704
申请日期:2024-12-27
公开号:CN119785149A
公开日期:2025-04-08
类型:发明专利
摘要
本发明涉及一种基于形状大模型的样本均衡方法,包括以下步骤S1、对样貌特征进行提取;并将得到特征进行拼接,拼接得到的特征向量即为样貌特征;S2、类内聚类;将每一类中的样本,基于样貌特征,使用k‑means算法进行聚类;S3、类间子类聚类;每一类经过k‑means聚类后获得子类,将子类的中心再进行聚类;S4、计算各子类增删数量;S5、样本精简以及样本增强。本发明通过训练出基于形状的大模型,再结合文本与图像间相互转换的信息,生成具有较强可分性的特征,结合机器学习算法筛选样本,使得样本在类别与样貌上分布均匀;通过均衡各类别与样貌的样本,获得了质量更高,更具代表性的的样本,提升了训练数据的质量,从而提高了模型效果的上限。
技术关键词
均衡方法 样本 聚类 预处理算法 机器学习算法 文本 图像 工位 训练集 远距离 线状 数据 参数 片状
系统为您推荐了相关专利信息
1
一种基于机器学习的键合机焊接质量检测方法
焊点 聚类 坐标系 数据更新 速率
2
一种低空组网邻区规划方法及设备
小区 邻区规划方法 组网 神经网络模型 节点
3
一种电力系统软件安全漏洞动静态结合检测方法
静态代码缺陷 动静态 分层卷积神经网络 动态 协议特征
4
一种航天遥感信息移动终端模拟系统
模拟系统 移动终端 智能识别模块 神经网络模型构建 基础
5
一种可替换外泌体提取芯片
缓冲垫片 芯片 滤膜 外泌体提取技术 密封圈
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号