基于中文文本多分类的涉诈网址识别方法

正文

推荐专利

基于中文文本多分类的涉诈网址识别方法

申请号：CN202410717877

申请日期：2024-06-04

公开号：CN118535735A

公开日期：2024-08-23

类型：发明专利

摘要

本发明的基于中文文本多分类的涉诈网址识别方法，属于互联网安全技术领域，包括以下步骤：S1：获取网址的多个中文文本并预处理；S2：对预处理后的中文文本进行中文分词与词嵌入，将分词后的结果编码并调整成长度一致的整数序列列表；S3：对整数序列列表进行编码并输出语言向量；S4：对语言向量进行特征提取，转化为语言特征向量；S5：将语言特征向量处理，输出隐状态特征向量；S6：将隐状态特征向量进行特征提取并输出结果；S7：将特征提取结果，传递给softmax激活函数转化为概率分布；S8：选择概率最大的类别，作为该中文文本的分类结果。该方法不仅对分词器进行了优化，还结合WoBERT和CRNN模型，通过多步骤的处理，实现了对中文文本的精准分类。

技术关键词

网址识别方法中文文本列表互联网安全技术中文分词序列词语 LSTM模型高层次模块编码规则语义编码器非线性数据

系统为您推荐了相关专利信息

一种智能分检终端与云端数据同步方法及系统

差异检测技术云端数据同步身份验证机制生成终端同步算法

一种基于多任务学习的SSD故障预测方法、设备及介质

关键特征值故障预测方法多任务学习模型列表程度计算方法

料箱库穿梭车的调度方法、装置、存储介质和电子设备

穿梭车提升机仿真模型货架策略列表

动态多端口敲门的网络服务访问方法及系统

网络服务访问方法多端口访问系统网络端口算法

一种面向全场景教学应用的智慧艺术教育资源推荐系统

教育资源推荐学习路径推荐推荐系统子模块数据模块

基于中文文本多分类的涉诈网址识别方法

站点导航

APP 下载