摘要
本发明公开了一种基于LLM的公开源网页信息分析方法、装置、介质、产品,涉及开源情报分析领域。本发明充分利用LLM的语义理解能力、指令遵循能力,综合网页信息爬取领域常见的xpath表达式提取技术、统计学算法提取技术以及基于LLM的检索增强生成(RAG)技术,实现了有效的公开源网页信息挖掘分析,并设计了相应的开源情报分析应用流程框架,能够智能查询并生成热点事件的简报与研判报告,并提供报告所涉及的事实性参考信息,向用户展示有关事件、主题或个体的分析结果和洞察,帮助用户更好地了解情况,从而制定更为科学合理的决策方案,具有较好的工程应用效益。
技术关键词
信息分析方法
计算机终端
网页信息爬取
文本
生成结构化数据
生成技术
统计学算法
解析算法
标签模块
计算机程序产品
语义
指令
处理器通信
主题
报告
存储器
表达式
介质
系统为您推荐了相关专利信息
视频字幕提取
执行光学字符识别
文本
图像增强单元
特征提取单元
服装
重识别方法
文本编码器
行人重识别
计算机存储介质