网页信息的采集方法、装置、设备、介质及程序产品

AITNT
正文
推荐专利
网页信息的采集方法、装置、设备、介质及程序产品
申请号:CN202510656049
申请日期:2025-05-21
公开号:CN120541315A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及人工智能技术领域,公开了网页信息的采集方法、装置、设备、介质及程序产品。该方法包括:获取目标网页的统一资源定位符,并根据统一资源定位符,获取目标网页对应的网页内容数据;根据网页内容数据,获取多个初始网页主题词,并计算得到各初始网页主题词与各已存情感词之间的初始相似度;根据各初始网页主题词与各已存情感词之间的初始相似度,以及各预设情感词库对应的权重值,获取各初始网页主题词与各已存情感词之间的目标相似度;根据各初始网页主题词与各已存情感词之间的目标相似度,获取目标网页主题词。本实施例的方案,可以实现对获取网页内容数据的自动筛选,可以提升网页信息采集的效率和精准度,可以提升用户体验。
技术关键词
统一资源定位符 情感词库 数据中心 数据压缩策略 超文本标记语言 双向变换器 动态页面 静态页面 可读存储介质 人工智能技术 数据获取模块 计算机程序产品 电子设备 处理器通信 存储器
系统为您推荐了相关专利信息
1
一种数据中心电能表检测识别模型微调训练方法
预训练模型 数据中心 电能表 识别模型训练 检测模型训练
2
基于虚拟仿真诱捕环境的高校数据中心可信态势防御方法
马尔科夫模型 数据中心 关联规则挖掘技术 会话 转移概率矩阵
3
一种基于主动信任的渐进无损服务聚合与编排方法
编排方法 无人机设备 基准 报告 数据分析算法
4
广域环境中异构数据库的语义分析多级缓存机制
多级缓存机制 语句 识别模块 队列 语义
5
一种基于差分进化的土壤污染扩散预测方法
扩散预测方法 粒子群优化算法 进化算法 土壤污染防治技术 代表
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号