摘要
本公开提供了一种数据生成方法和装置,涉及信息技术领域,具体涉及自然语言处理、大模型、检索增强生成RAG等技术领域,可应用于智能问答、智能医疗问诊、教育培训、法律咨询和新闻解读等领域。具体实现方案为:对获取的文档进行分片处理,得到文本单元集合;基于文本单元集合,得到问答对集合和图结构元素集合,并在图数据库中存储图结构映射关系;基于问答对集合和图结构元素集合,得到问题向量和图结构向量,将问题向量和图结构向量作为文本向量,并在向量数据库中存储文本向量和文本映射关系;基于图数据库,得到社区向量,并在向量数据库中存储社区映射关系和社区向量,社区映射关系用于表征社区向量与图结构元素集合之间的关系。
技术关键词
文本
关系
元素
数据生成方法
报告
数据查询方法
实体
摘要
列表
大语言模型
分片
社区检测算法
数据生成装置
数据查询装置
关键词
处理器
节点
计算机程序产品
聚类
系统为您推荐了相关专利信息
视频异常检测方法
运动特征
运动编码器
解码器
瓶颈结构
漏洞
测试报告生成方法
字典
测试报告生成系统
列表