摘要
本发明实施例提供了一种面向网络空间资产检索的关键词组提取方法和装置,所述方法包括:获取面向网络空间资产检索的目标站点的多个目标文本词条;通过预先训练的改进隐马尔可夫模型,对目标文本词条进行分词,得到每个目标文本词条对应的目标分词结果;对目标分词结果进行组合,生成多个目标词组;通过文本挖掘技术,根据多个目标文本词条,对多个目标词组进行挖掘统计,生成目标关键词组,基于改进马尔可夫模型和文本挖掘技术进行关键词组提取,提高分词结果的准确率,从而精准提取出目标关键词组,进一步提升资产检索结果的准确率。
技术关键词
词组提取方法
隐马尔可夫模型
文本挖掘技术
资产
分词
马尔可夫算法
指标
站点
样本
处理器
关键词
训练集
计算机程序产品
指令
频率
计算机设备
存储器
系统为您推荐了相关专利信息
隐马尔可夫模型
地图匹配方法
车道
转移概率矩阵
维特比算法
脱敏方法
大语言模型
脱敏策略
脱敏规则
检测敏感信息
实体关系抽取模型
实体关系抽取方法
语义向量
实体关系抽取系统
词语
信用数据处理方法
文本挖掘技术
分布式并行计算
分区
数据仓库工具