摘要
本发明公开了一种应用于医疗数据的活动序列采样流程挖掘方法及系统,属于信息技术领域,方法步骤为:获取原始事件日志,并进行数据清洗;基于事件嵌入模型和DBSCAN算法将语义相似的事件活动聚类为同一个簇,并为每一个簇生成唯一的语义标识符;生成去冗余事件日志;基于轨迹的综合重要性得分对去冗余事件日志进行采样,得到样本事件日志;将样本事件日志输入归纳式挖掘算法生成对应的流程模型。系统包括数据采集与清洗模块、聚类模块、去冗余模块、采样模块、流程模型生成模块。本发明在保证日志代表性的同时,大幅提升处理效率,适用于医疗领域的大规模日志处理需求,为业务流程优化提供可靠支持。
技术关键词
日志
轨迹
DBSCAN算法
语义
挖掘方法
标识符
挖掘算法
序列
冗余
Petri网
医院信息系统
采样模块
业务流程优化
样本
聚类
采样率
滑动窗口方法
数据
系统为您推荐了相关专利信息
语义分割模型
语义分割方法
多尺度特征融合
通道注意力机制
扫描电子显微镜
跨域映射方法
生成对抗网络模型
翻译模型
卷积模块
多尺度
剔除方法
数据冗余
节点
高维特征向量
知识图谱构建
实体
作业管理器
溯源关系
知识图谱框架
溯源信息