电子书的数据处理方法、装置、设备和存储介质

AITNT
正文
推荐专利
电子书的数据处理方法、装置、设备和存储介质
申请号:CN202410961639
申请日期:2024-07-17
公开号:CN118940724A
公开日期:2024-11-12
类型:发明专利
摘要
本申请实施例提供一种电子书的数据处理方法、装置、设备和存储介质,获取电子书的原始HTML文件,对原始HTML文件进行解析得到原始DOM树,原始DOM树中包括多个元素节点,元素节点包括至少一个文本节点;遍历原始DOM树的文本节点,将电子书对应的标题匹配条件与每个文本节点进行匹配,得到匹配到的K个标题以及K个目标元素节点的位置,目标元素节点为匹配到的标题所在的元素节点;根据该K个目标元素节点的位置确定章节拆分位置,根据章节拆分位置对原始DOM树进行拆分,得到每个章节拆分位置对应的最终DOM树,将每个最终DOM树序列化为章节对应的HTML文件。该方法能够基于标题匹配条件自动识别到章节拆分位置,提高了电子书的章节拆分效率。
技术关键词
文档对象模型 超文本标记语言 节点 电子书 元素 数据处理方法 存储计算机程序 编辑界面 云端服务器 数据处理装置 模版 存储器 匹配模块 控件 可读存储介质 处理器
系统为您推荐了相关专利信息
1
一种可解释抑郁症检测方法和系统
混合专家网络 策略 帖子 大语言模型 Softmax函数
2
一种基于3D映射表的快速视频浓缩方法
视频浓缩方法 碰撞面积 图像融合算法 像素点 列表
3
精确安全的计算Jaccard系数的方法
同态加密算法 私钥 系数计算方法 密钥生成算法 公钥
4
基于标识解析的动态因果知识图谱构建方法、系统及设备
知识图谱构建方法 实体识别模型 时序 传感器节点 文本
5
一种基于台区异常状态预警的低压分布式储能调控方法及系统
分布式储能 低压配电网 调控方法 调控系统 智能融合终端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号