一种关键信息的搜索方法及装置

AITNT
正文
推荐专利
一种关键信息的搜索方法及装置
申请号:CN202411933788
申请日期:2024-12-26
公开号:CN119669547A
公开日期:2025-03-21
类型:发明专利
摘要
本发明提供一种关键信息的搜索方法及装置,对目标网站进行爬取得到网页内容;从网页内容中提取出文本信息;判断网页内容是否通过特定关键词爬取得到;若是,则利用正则匹配公式,将文本信息与特定关键词进行匹配,得到文本信息对应的关键信息评价分;若否,则从文本信息中识别出多个预设的关键指标对应的关键指标值,基于每一关键指标的初始评分、每一关键指标对应的权重和加权值算法,计算得到关键信息评价分;若关键信息评价分大于评分阈值,则确定文本信息为关键信息。在本方案中,利用爬虫批量获取网页内容,对可能的关键信息进行判断打分,将关键信息评价分大于评分阈值的信息确定为关键信息,实现了提高效率和持续化搜索关键信息的目的。
技术关键词
分布式爬虫系统 关键词 文本 报文 指标 搜索词 文字识别技术 明文 多线程方式 搜索方法 图片 层次分析法 格式 标签 矩阵 动态 参数 算法 批量
系统为您推荐了相关专利信息
1
文案生成模型训练方法、装置、电子设备以及存储介质
训练样本集 生成模型训练方法 内容概括 生成页面 数据
2
用于电力信息物理融合系统的脆弱性分析处理方法及装置
节点 命令 监测电力系统 支路 关系
3
一种数据召回方法、装置及相关产品
结构化查询语言 召回方法 模版 数据嵌入 语义向量
4
一种提高召回率的数据搜索方法及装置
信息提取模型 数据搜索方法 实体 搜索词 中间层
5
基于数据驱动的城市交通仿真模型评估方法及系统
仿真模型 场景仿真技术 数据驱动优化 多模态 仿真数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号