一种基于多视图聚类的检索增强生成方法和系统

AITNT
正文
推荐专利
一种基于多视图聚类的检索增强生成方法和系统
申请号:CN202410853239
申请日期:2024-06-28
公开号:CN118394946B
公开日期:2024-08-23
类型:发明专利
摘要
本申请涉及一种基于多视图聚类的检索增强生成方法和系统。所述方法包括:构建图谱数据库、向量数据库和ES数据库;将图谱数据库、向量数据库和ES数据库中的数据进行多视图预处理得到多视图特征数据库,对用户输入的多视图特征和多视图特征数据库中的数据进行多视图聚类得到多个聚类簇和每一数据点的软聚类分数;选取与用户输入属于同一聚类簇的数据点放入候选池,对候选池中的每一数据点对应的原始数据进行多路召回得到召回结果;根据软聚类分数对召回结果进行融合重排得到重排结果,将重排结果和用户输入加载到提示词后输入大语言模型,输出对应的回答。采用本方法能够在保证检索效率的前提下进一步提高检索精度,实现高效文档检索。
技术关键词
特征数据库 图谱 关键字 文本 大语言模型 聚类 生成方法 编码 链接特征 词袋模型 排序模型 模块 嵌入特征 重构 生成系统 拉链 三元组 语义 实体
系统为您推荐了相关专利信息
1
一种基于多模态知识图谱的企业碳资产数字化方法及装置
资产数字化方法 实体 多模态信息 传感器 数据嵌入
2
基于大语言模型的肺结节恶性转化风险评价系统
风险评价系统 大语言模型 图像识别模块 空气监测设备 采集设备
3
基于深度学习和余弦相似度匹配的规程复述匹配方法及系统
关系分类器 注意力模型 字符 特征提取模块 语义
4
一种用于智慧视频生成的分镜数据分布式处理方法及系统
脚本 分布式计算节点 视频编辑软件 子模块 大语言模型
5
一种数据质量评估方法及系统
实体 清洗策略 评估系统 冗余度 时效性
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号