摘要
本发明提出一种基于大语言模型和对比学习的网络资产所有者识别方法和装置,属于网络空间测绘技术领域。所述方法包括:根据IP和域名列表,通过域名解析和网络爬虫获取与网络资产相关的数据内容;对与网络资产相关的数据内容进行重写;基于重写的数据内容,通过文本表示模型计算得到网络资产的向量表示,通过数据增强和融合层计算得到所有者的向量表示;通过多层级对比损失函数联合优化网络资产和所有者的向量表示;根据已知信息计算候选所有者的向量表示,同时计算未知所有者的网络资产的向量表示;通过相似性计算或聚类操作确定网络资产的所有者。本发明通过大语言模型和对比学习实现在特定信息缺失的情况下对网络资产所有者的识别。
技术关键词
大语言模型
识别方法
编码器
训练语言模型
网络空间测绘技术
参数
数据
网络资产信息
噪声信息
列表
聚类算法
命名实体识别
文本
爬虫
可读存储介质
处理单元
层级
系统为您推荐了相关专利信息
双目视觉平台
姿态估计方法
多分辨率融合
姿态估计算法
网络解码器
裂纹缺陷检测方法
IC板
编码器模块
解码器
深度学习网络模型
对话意图识别方法
标签
文本
语音语义技术
智能客服系统
异常数据检测方法
功能性磁共振成像
多层感知机
样本
计算机程序产品
多智能体协同
代码生成方法
框架
生成软件
大语言模型