摘要
本申请涉及电数字数据处理技术领域,特别是涉及一种网页中人物识别的处理方法、装置、设备及介质。该方法包括:获取目标网页文档对应的文档对象模型树;按照从根节点向下的顺序依次判断文档对象模型树中的节点是否满足第一预设条件,若不满足,则继续判断下一节点;否则,停止判断;如果存在满足第一预设条件的节点,则获取其对应的子树集合;如果集合满足第二预设条件,则判断集合中每一子树是否满足第三预设条件;如果集合中每一子树均满足第三预设条件,则判定集合中每一子树对应一个人物,并对集合中每一子树进行解析,获取集合中每一子树对应的人物的信息。本发明能够从网页的HTML文档中提取网页展示的人物的相关信息。
技术关键词
文档对象模型
节点
图片
命名实体识别模型
字符串匹配算法
电数字数据处理技术
身份
可读存储介质
处理器
头像
中子
识别模块
年龄
存储器
计算机
电子设备
系统为您推荐了相关专利信息
多模态特征
视觉特征提取
跨模态
图片
特征提取模型
寿命预测模型
寿命预测方法
指标
特征值集合
系统误差