摘要
本申请涉及一种网站信息处理方法、装置、电子设备及存储介质,通过获取网站信息,并从网站信息中,提取候选关键字信息,基于候选关键字信息进行关键字提取,得到目标关键字信息,以依据目标关键字信息,结合预设的热点词表信息进行数据增强,得到目标关键字信息对应的嵌入向量信息,随后依据嵌入向量信息进行联合语义分析,得到目标关键字信息对应的联合特征向量信息,从而基于联合特征向量信息,生成网站信息对应的网站指纹信息,也即本申请通过对网站信息进行多重处理后生成其对应的网站指纹信息,使得网站信息即使发生部分变化仍然不会影响网站指纹信息的有效性,解决了现有相关技术中使用网站的原始字段信息作为网站指纹所存在有效性低的问题。
技术关键词
网站指纹
关键字
信息处理方法
热点
语义
通信接口
电子设备
信息处理装置
存储器
处理器
有效性
分析模块
数据
可读存储介质
字词
编码
字段
计算机
系统为您推荐了相关专利信息
多模态特征
情绪识别模型
数据处理方法
语音特征
语音识别模型
问答方法
关键词
文本
上下文查询
计算机程序产品