一种非结构化专利数据分类方法、装置及存储介质

正文

推荐专利

申请号：CN202510076514

申请日期：2025-01-17

公开号：CN119988609A

公开日期：2025-05-13

类型：发明专利

摘要

本发明涉及一种非结构化专利数据分类方法、装置及存储介质。其中的方法包括，获取包括非结构化专利数据的全部样本集；基于全部样本集，利用误差平方和最小化与轮廓系数法相结合获取最优K值；基于最优K值，利用基于方差最大化的决策树获取最优质心；基于最优K值和最优质心，利用K‑Means聚类算法获取最终的专利簇。与现有技术相比，本发明具有提升收敛速度和改善聚类效果，进而从专利文本非结构化数据中高效、准确地获取专利实质内容等优点。

技术关键词

数据分类方法轮廓系数样本误差结点数据分类装置构建决策树特征数程序聚类存储器策略处理器算法定义文本数值速度

系统为您推荐了相关专利信息

日志异常检测方法、图神经网络训练方法及相关设备

序列语义向量日志异常检测方法样本神经网络训练方法

一种基于深度学习的异构软件缺陷倾向预测方法

软件缺陷倾向预测方法空间变换模型项目异构多层感知机

一种低复杂度的面向未知分布的异常检测方法

异常检测方法复杂度聚类异常检测技术样本

一种齿轮传递误差的敏感性分析方法

安装误差敏感性分析方法错位齿轮计算机程序指令

生物标志物CCT7的食管癌诊断和治疗中的应用

生物标志物肿瘤突变负荷效能数据肿瘤微环境节点特征

一种非结构化专利数据分类方法、装置及存储介质

站点导航

APP 下载