摘要
本发明提供了一种点读配置文件生成方法、装置、设备及介质,所述方法包括以下步骤:获取页面图像并对所述页面图像进行预处理;采用文本及语言处理技术,对预处理后的页面图像进行文本的分句定位及热区提取;根据提取的热区生成结构化点读配置文件。本发明通过获取页面图像并预处理,并采用文本及语言处理技术对文本进行分句定位及热区提取,实现了点读热区的自动化生成,取代了传统人工逐页逐句标定的繁琐操作,大幅提升电子教材开发效率,同时,避免了人工操作导致的热区定位偏差、遗漏等问题,且减少了大量人力和时间投入,有效降低制作成本;将自动生成的热区生成结构化配置文件,使得文本可供修改,当教材内容变动时,能快速更新配置文件。
技术关键词
配置文件生成方法
页面
配置文件生成装置
模板结构
条目
文本行
光学字符识别
电子教材
数据
可读存储介质
格式
处理器
图像增强
自然语言
计算机设备
语义
存储器
逻辑
系统为您推荐了相关专利信息
水性聚氨酯乳液
智能模型
性能预测方法
玻璃纤维
多通道
对象
文本
信息处理方法
语义向量
计算机可读指令
存储页面
数据存储装置
虚拟地址系统
存储控制器
数据缓冲器