摘要
本申请涉及网表识别技术领域,公开一种类型识别模型的训练方法、确定表单类型的方法、设备。类型识别模型的训练方法包括:获取多个标注有表单类型的网页表单样本数据;从各网页表单样本数据中提取若干种表单特征;表单特征为描述表单设置情况的信息;构建综合识别模型,利用表单特征对综合识别模型进行训练,获得类型识别模型;类型识别模型用于识别网页表单的表单类型。这样,通过训练类型识别模型,使得用户利用该类型识别模型对网页表单进行识别时,能够提高识别表单的表单类型的效率。同时,即便表单在展现形式上做出调整,类型识别模型依然能够准确的识别出网页表单的表单类型,进而使得后续按照表单类型对网页表单进行分类的效果较好。
技术关键词
网页表单
表单特征
文本
计算机可执行指令
识别网页
样本
数值
处理器
标记
交互性
字段
存储器
数据
参数
电子设备
布局
算法
元素
网络
系统为您推荐了相关专利信息
检测食品
风险评估方法
BP神经网络模型
时序特征
指数加权移动平均值
智能交互方法
多模态
动态场景
调度算法
语音情感分析
多模态数据融合
维修方法
分析风电机组
动态知识图谱
时序数据预测
人脸图像处理方法
图像处理方式
融合人脸
编辑
人脸关键点检测