用于经济大数据中文本数据的泛化处理保护方法

正文

推荐专利

申请号：CN202411545651

申请日期：2024-11-01

公开号：CN119046469B

公开日期：2024-12-27

类型：发明专利

摘要

本申请涉及数据泛化技术领域，具体涉及用于经济大数据中文本数据的泛化处理保护方法，该方法包括：获取文本数据；利用文本属性向量训练孤立森林，基于特征向量之间的类内差异确定特征向量的类内偏差值；基于类内偏差值的分布离散程度确定聚类簇的内容复杂度，结合聚类簇内特征向量的相似程度确定聚类簇之间的内容可转换度；基于内容可转换度确定孤立树的投票权重，得到文本属性向量的异常得分；基于异常得分筛选需要泛化处理的文本数据，得到泛化处理结果。本申请通过对同类内容下文本数据内容差异以及可互换组合出现在不同数据源经济大数据中特点的分析，优化孤立森林算法，提高泛化处理的效果，降低经济大数据中文本数据被攻击的风险。

技术关键词

保护方法文本大数据节点森林模型样本孤立森林算法复杂度匿名算法分布方差生成树阈值算法数据聚类算法 Prim算法偏差成分分析法代表特征值

系统为您推荐了相关专利信息

一种基于本地大语言模型和区块链技术的运维助手构建方法

大语言模型运维知识库区块链技术前端系统区块链网络节点

一种基于大数据的私域电商数据搜索方法及系统

语义特征偏好特征数据搜索方法商品特征信息关键词

一种基于分布式电源接入单元的检测方法和系统

分布式电源小波变换系数模拟检测平台测试主机滑动时窗

一种基于智能水务的污水处理工艺自动化管理系统

自动化管理系统智能水务污水处理工艺系统健康状态评估水务系统

一种基于大数据的个性化美术教育定制系统

绘画定制系统风格主题数据分析模块

用于经济大数据中文本数据的泛化处理保护方法

站点导航

APP 下载