摘要
本发明提供了一种基于Agent的高校主页信息异动监控统计方法及系统,涉及数据处理技术领域,方法包括:抓取高等院校主页信息;对高等院校主页信息与上一次抓取的高等院校主页信息进行文本内容比对,确定出异动文本内容;通过LLM,对异动文本内容进行初步分析,识别出异动文本内容的类别;选取与类别对应的异动处理方式,对异动文本内容进行处理,形成异动数据;汇总异动数据,并生成异动报告;存储异动数据至数据库。本发明能够全面、自动化地来处理和分析高校主页上更新的内容,精确地识别和分类页面中的异动内容,提升高校主页信息异动识别的准确性和及时性。
技术关键词
监控统计方法
高等院校
文本
深度语义模型
精确地识别
可读存储介质
统计系统
爬虫技术
数据处理技术
页面内容
处理器
组织
报告
程序
教师
指令
存储器
标识
系统为您推荐了相关专利信息
数据处理服务器
地址标准化方法
搜索引擎服务器
数据库服务器
语义向量
智能识别系统
识别模块
电能表接线端子
字符识别
图像采集模块