一种基于大模型和RAG技术的全局知识抽取方法及系统

AITNT
正文
推荐专利
一种基于大模型和RAG技术的全局知识抽取方法及系统
申请号:CN202510780643
申请日期:2025-06-12
公开号:CN120317353A
公开日期:2025-07-15
类型:发明专利
摘要
本发明公开了一种基于大模型和RAG技术的全局知识抽取方法及系统,属于大模型数据处理技术领域,本发明采用局部敏感哈希去重和动态阈值合并相似文本,减少冗余数据干扰;基于分隔符置信度的文本分割策略,确保分割后的文本块既保持语义完整,又适配大模型输入长度限制,融合相似性检索和全文检索,结合RRF算法对结果重排序,兼顾语义相关性和精准性,满足多场景知识构建需求,通过互信息筛选高相关性的实体对,结合RAG系统从向量数据库中检索上下文知识,利用大语言模型进行语义推理,生成实体间隐含的逻辑关系,实现从数据关联到知识生成的跃升。
技术关键词
文本 混合搜索策略 谱聚类算法 数据 实体 局部敏感哈希算法 矩阵 建立倒排索引 语义 拉普拉斯 非线性 关系 可读存储介质 抽取系统 生成向量 大语言模型
系统为您推荐了相关专利信息
1
虚拟机实例管理方法、装置、设备以及存储介质
虚拟机管理程序 管理虚拟机实例 指令 智能卡 数据迁移
2
一种不同软件版本参数兼容处理的方法
软件 参数 系统资源消耗 最小化系统 机制
3
一种基于光伏产业的多DNN技术无感分流方法
光伏设备 设备健康监测 分流方法 性能预测模型 DNN模型
4
一种基于分层取样的水质检测方法及相关装置
分布特征 水质检测方法 待测水体 参数 反射率数据
5
一种基于孔隙水压力的地下水位早期预警方法
孔隙水压力 早期预警方法 地下水动力学 记忆单元 水位预测值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号