摘要
本发明涉及基于人工智能大模型的互联网信息获取方法、系统和介质。所述方法包括:获取用户输入的关注点信息、用户设置的新闻网站;利用crawl4AI进入设置的新闻网站进行数据爬取;根据所述用户设置的新闻网站获取相关的网站链接,利用crawl4AI进入网站链接进行数据爬取;将爬取到的数据存储至本地pocketbase数据库;利用Dify大语言模型形成动态向量知识库;根据本地pocketbase数据库利用AI大模型形成爬取信息摘要,根据本地pocketbase数据库利用AI大模型与用户的交互。本发明提高了人工效率,实现了更加自动化的网页爬取,克服了现有技术中只能够基于本地保存的爬取内容的局限性,能够总结分析出爬取信息的摘要,利于用户快速了解爬取信息。
技术关键词
关注点
爬取信息
爬虫
社交平台
动态
摘要
数据存储
信息获取系统
生成短信
解析器
存储模块
互联网
介质
接口
语义
处理器
指令