电子书的数据处理方法、装置、设备和存储介质

正文

推荐专利

申请号：CN202410961639

申请日期：2024-07-17

公开号：CN118940724A

公开日期：2024-11-12

类型：发明专利

摘要

本申请实施例提供一种电子书的数据处理方法、装置、设备和存储介质，获取电子书的原始HTML文件，对原始HTML文件进行解析得到原始DOM树，原始DOM树中包括多个元素节点，元素节点包括至少一个文本节点；遍历原始DOM树的文本节点，将电子书对应的标题匹配条件与每个文本节点进行匹配，得到匹配到的K个标题以及K个目标元素节点的位置，目标元素节点为匹配到的标题所在的元素节点；根据该K个目标元素节点的位置确定章节拆分位置，根据章节拆分位置对原始DOM树进行拆分，得到每个章节拆分位置对应的最终DOM树，将每个最终DOM树序列化为章节对应的HTML文件。该方法能够基于标题匹配条件自动识别到章节拆分位置，提高了电子书的章节拆分效率。

技术关键词

文档对象模型超文本标记语言节点电子书元素数据处理方法存储计算机程序编辑界面云端服务器数据处理装置模版存储器匹配模块控件可读存储介质处理器

系统为您推荐了相关专利信息

一种可解释抑郁症检测方法和系统

混合专家网络策略帖子大语言模型 Softmax函数

一种基于3D映射表的快速视频浓缩方法

视频浓缩方法碰撞面积图像融合算法像素点列表

精确安全的计算Jaccard系数的方法

同态加密算法私钥系数计算方法密钥生成算法公钥

基于标识解析的动态因果知识图谱构建方法、系统及设备

知识图谱构建方法实体识别模型时序传感器节点文本

一种基于台区异常状态预警的低压分布式储能调控方法及系统

分布式储能低压配电网调控方法调控系统智能融合终端

电子书的数据处理方法、装置、设备和存储介质

站点导航

APP 下载