一种关键信息的搜索方法及装置

正文

推荐专利

一种关键信息的搜索方法及装置

申请号：CN202411933788

申请日期：2024-12-26

公开号：CN119669547A

公开日期：2025-03-21

类型：发明专利

摘要

本发明提供一种关键信息的搜索方法及装置，对目标网站进行爬取得到网页内容；从网页内容中提取出文本信息；判断网页内容是否通过特定关键词爬取得到；若是，则利用正则匹配公式，将文本信息与特定关键词进行匹配，得到文本信息对应的关键信息评价分；若否，则从文本信息中识别出多个预设的关键指标对应的关键指标值，基于每一关键指标的初始评分、每一关键指标对应的权重和加权值算法，计算得到关键信息评价分；若关键信息评价分大于评分阈值，则确定文本信息为关键信息。在本方案中，利用爬虫批量获取网页内容，对可能的关键信息进行判断打分，将关键信息评价分大于评分阈值的信息确定为关键信息，实现了提高效率和持续化搜索关键信息的目的。

技术关键词

分布式爬虫系统关键词文本报文指标搜索词文字识别技术明文多线程方式搜索方法图片层次分析法格式标签矩阵动态参数算法批量

系统为您推荐了相关专利信息

文案生成模型训练方法、装置、电子设备以及存储介质

训练样本集生成模型训练方法内容概括生成页面数据

用于电力信息物理融合系统的脆弱性分析处理方法及装置

节点命令监测电力系统支路关系

一种数据召回方法、装置及相关产品

结构化查询语言召回方法模版数据嵌入语义向量

一种提高召回率的数据搜索方法及装置

信息提取模型数据搜索方法实体搜索词中间层

基于数据驱动的城市交通仿真模型评估方法及系统

仿真模型场景仿真技术数据驱动优化多模态仿真数据

一种关键信息的搜索方法及装置

站点导航

APP 下载