摘要
本申请公开了一种基于深度学习的页面布局及元素分析方法,旨在解决机顶盒页面的复杂性使得现有的目标检测与字符识别方法通常无法满足对页面元素进行高效、准确分析的需求的问题。本申请基于第一深度学习模型对机顶盒页面图像进行目标检测,识别出页面中的图像元素区域,并生成对应的多个图像框,根据图像框的面积大小确定直播窗口区域和海报推荐位区域:其中面积最大的图像框为直播窗口区域,其余的图像框为海报推荐位区域;基于第二深度学习模型对机顶盒页面图像中的字符进行识别,生成多个文本框;通过判断文本框之间的重叠情况、距离关系以及文本框与图像框的重叠情况,对重叠或相邻的原始元素进行合并处理。
技术关键词
元素分析方法
机顶盒页面
深度学习模型
图像
DBSCAN算法
布局
海报
文本
标注工具
邻域
数据
字符识别方法
训练集
初始聚类中心
核心
系统为您推荐了相关专利信息
城市智慧交通
交通事故检测
身份验证模块
分析模块
视觉
医用棉签
控制调节系统
棉花
反馈控制模块
能源管理模块
图像生成模型
样本
图像超分辨率重建
特征提取网络
生成对抗网络
浪涌保护器
可靠性检测方法
可靠性检测装置
检测组件
管理分析装置