一种基于LLM的公开源网页信息分析方法、装置、介质、产品

AITNT
正文
推荐专利
一种基于LLM的公开源网页信息分析方法、装置、介质、产品
申请号:CN202510447301
申请日期:2025-04-10
公开号:CN120296229A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种基于LLM的公开源网页信息分析方法、装置、介质、产品,涉及开源情报分析领域。本发明充分利用LLM的语义理解能力、指令遵循能力,综合网页信息爬取领域常见的xpath表达式提取技术、统计学算法提取技术以及基于LLM的检索增强生成(RAG)技术,实现了有效的公开源网页信息挖掘分析,并设计了相应的开源情报分析应用流程框架,能够智能查询并生成热点事件的简报与研判报告,并提供报告所涉及的事实性参考信息,向用户展示有关事件、主题或个体的分析结果和洞察,帮助用户更好地了解情况,从而制定更为科学合理的决策方案,具有较好的工程应用效益。
技术关键词
信息分析方法 计算机终端 网页信息爬取 文本 生成结构化数据 生成技术 统计学算法 解析算法 标签模块 计算机程序产品 语义 指令 处理器通信 主题 报告 存储器 表达式 介质
系统为您推荐了相关专利信息
1
一种基于多层次风格表征的语言模型风格后门防御方法
风格 样本 多层次 后门 预训练语言模型
2
一种用于视频字幕提取的丢字补偿处理装置和方法
视频字幕提取 执行光学字符识别 文本 图像增强单元 特征提取单元
3
一种物流智能客服交互的内容推荐方法及系统
内容推荐方法 智能客服 生成推荐内容 节点 语义
4
一种基于文本引导的服装可泛化行人重识别方法
服装 重识别方法 文本编码器 行人重识别 计算机存储介质
5
医疗问诊文本信息的处理方法、装置、及电子设备
信息处理模型 术语 对象 文本数据处理技术 生理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号