一种跨域文案在线溯源方法和装置

正文

推荐专利

一种跨域文案在线溯源方法和装置

申请号：CN202510123506

申请日期：2025-01-26

公开号：CN120124633B

公开日期：2025-08-12

类型：发明专利

摘要

本发明提供一种跨域文案在线溯源方法和装置，包括：按照数据入库时间对获取的流式增量的互联网文案信息进行时间分片得到每个时间片内的数据，并从时间片内的数据中提取未计算的最早批次数据构成增量数据集；对不同时间片的增量数据集并行处理，在每个增量数据集内建立局部语义簇，并与历史聚类结果进行贪心合并得到聚类结果；引入活跃类动态监测机制，持续追踪聚类结果中成员数量发生变化的活跃类得到溯源结果；将聚类结果和溯源结果存入分布式搜索引擎中。本发明能够准确识别跨领域文案语义关联并且支持海量数据实时高效处理。

技术关键词

溯源方法分布式搜索引擎聚类在线查询机制贪心策略深度优先搜索算法非暂态计算机可读存储介质支持海量数据语义特征分片互联网处理器溯源装置文本计算机程序产品动态

系统为您推荐了相关专利信息

一种基于大数据应用的会计数据管理系统及方法

数据管理系统会计大数据密钥生成业务

一种基于OSM的立交桥识别和可导航性构建方法及系统

立交桥矩形节点地图匹配算法车辆轨迹信息

一种基于危险感知的设备状态智能预警方法

智能预警方法设备健康状态评估设备运行数据设备运行状态多源异构数据

基于多模态数据融合的生涯规划分析系统及方法

多模态数据融合兴趣职业学生模糊聚类算法

一种适用于胆道压力的实时在线检测系统

在线检测系统信号调理模块压力传感器组件数据处理模块生物相容性高分子材料

一种跨域文案在线溯源方法和装置

站点导航

APP 下载