摘要
本发明涉及数据处理技术领域,具体涉及一种基于HTML的网页划词注释生成方法、系统及设备,旨在解决现有划词标注方法存储效率低、动态网页适应性差、缺乏容错以及跨浏览器兼容性不足的问题。本方法包括:捕获选区;获取DOM节点路径数据及文本偏移量,生成定位数据;将路径数据递归存储,生成唯一指纹标识;以JSON格式存储为历史指纹数据;基于历史指纹数据进行匹配及定位;将历史指纹数据中的信息映射到HTML页面,以实现双向渲染。本发明通过节点路径记录DOM节点的标签名称、类名和层级关系,以构建指纹标识,通过JSON结构实现跨平台数据交换,进而实现高效、精准、容错性高且适应动态页面的网页标注。
技术关键词
注释生成方法
节点
指纹模型
文本
标签特征
补偿算法
索引
标识
JSON结构
序列比对算法
遍历方法
动态页面
动态网页
数据存储模块
数据处理技术
系统为您推荐了相关专利信息
模型研究方法
多模态
机器可读程序
节点
分层特征提取
电流源阵列
移位寄存器
逻辑控制模块
控制单元
电平
工艺参数优化方法
更新知识图谱
节点
断点
实体间关系