数据去重方法、电子设备及计算机可读存储介质

AITNT
正文
推荐专利
数据去重方法、电子设备及计算机可读存储介质
申请号:CN202511060453
申请日期:2025-07-30
公开号:CN121009897A
公开日期:2025-11-25
类型:发明专利
摘要
本申请实施例提供一种数据去重方法、电子设备及计算机可读存储介质。涉及人工智能领域,该方法包括:基于多个数据分别对应的语义特征,生成多个样本点;按照多个数据分别对应的语义特征之间的语义相似度,确定各样本点与其他样本点之间的转移概率信息;按照转移概率信息,模拟信息在各样本点中进行多步转移,得到各样本点的密度值,密度值表示各样本点经过多步转移后的信息累积程度的度量;按照转移概率信息,确定多个样本点之间的转移概率距离;依据多个样本点之间的转移概率距离,以及各样本点的密度值,对多个数据进行去重处理,得到去重结果。本申请解决了相关技术对冗余数据的去重能力有限,去重鲁棒性不佳的技术问题。
技术关键词
样本 邻居 数据去重方法 语义特征 密度 可读存储介质 电子设备 计算机 度量 处理器 存储器 鲁棒性 冗余 文本 图片 语音 代表 节点
系统为您推荐了相关专利信息
1
基于人工智能的网络安全威胁检测方法及系统
组合特征向量 顶级域 分块 BERT模型 统计特征
2
一种厂焊钢轨母材激光智能检测装备
激光传感器 移动架 检测机构 激光测距技术 图像识别技术
3
一种基于孤立森林与极端随机树用于高锰钢纵裂纹工艺控制的方法
高锰钢 裂纹缺陷 水口插入深度 工艺控制方法 关键工艺参数
4
一种电池包的参数设计方法、装置、设备和可读存储介质
车身结构 座椅安装点 变量 电池 参数设计方法
5
一种汇聚检测光线的光学检测系统
光学检测系统 基座 芯片 聚光 光学检测技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号