开源情报语义可信分析和Bi-LSTM-Atten模型的自优化标签提取方法

正文

推荐专利

申请号：CN202411829025

申请日期：2024-12-12

公开号：CN119848241A

公开日期：2025-04-18

类型：发明专利

摘要

本发明涉及自然语言处理领域，公开了一种开源情报语义可信分析和Bi‑LSTM‑Atten模型的自优化标签提取方法，包括开源情报收集和预处理，建立数据源价值评估模型；开源情报特征提取，对爬取的文本进行分词处理，计算每个分词权重，得到候选标签集合，使用BERT对选出的候选标签进行词嵌入；开源情报语义可信分析，构建可信情报分类器，筛选出可信情报集合；可信开源情报标签提取，构建标签评价模型，构建标签评分训练集，训练基于Bi‑LSTM‑Atten模型的标签质量打分器；利用标签质量打分器得到各标签的分数；根据打分器的评分结果对候选标签集中的所有标签打分，提取用户定义的前k个标签。通过本发明可以提升开源情报标签提取的准确性和可信性。

技术关键词

标签提取方法打分器随机森林模型深度信念网络分布式爬虫集群分词训练集服务器队列文本算法消息更新分类器语义特征非监督数据

系统为您推荐了相关专利信息

一种基于隐患数据集成分析的燃机电厂事故预警决策方法

燃烧室壁面预警决策方法判断冷却系统特征值随机森林模型

一种集成改进MTCNN、U-Net、RF的舌象检测、分割、识别方法

灰度共生矩阵识别方法随机森林模型图像金字塔 PWM信号控制舵机

一种基于污水处理的动态优化系统及方法

动态优化方法曲线参数优化模型动态优化系统时间段

一种基于多源时空遥感数据的水田质量评价方法与系统

水田随机森林模型植被净初级生产力评价方法指数

一种基于恢复力解析生态系统状态变化的方法

植被生态系统随机森林模型空间耦合关系指标

开源情报语义可信分析和Bi-LSTM-Atten模型的自优化标签提取方法

站点导航

APP 下载