一种基于RAG技术的多模态数据检索增强生成方法和系统

AITNT
正文
推荐专利
一种基于RAG技术的多模态数据检索增强生成方法和系统
申请号:CN202411688615
申请日期:2024-11-25
公开号:CN119377386A
公开日期:2025-01-28
类型:发明专利
摘要
本发明公开了一种基于RAG技术的多模态数据检索增强生成方法和系统,该方法包括:使用自适应OCR识别策略对收集的图片数据进行文字识别;对收集的文档数据进行数据加载并处理为文本数据;对文本数据进行文本切块并向量化;使用向量数据库存储向量和文本块,并构建索引;对用户的输入文本进行向量化,并使用匹配算法进行向量匹配,查询对应文本;生成查询结果并展示。本发明通过对图片进行版面分析从而采用不同的OCR识别策略,提高文本识别的准确性;通过图片识别的文本和文档的文本,形成多模态数据,提高检索和生成的准确性。
技术关键词
生成方法 识别策略 图片 文本识别 切块 文本分割方法 数据 表格 算法 生成系统 格式 加载器 识别模块 存储模块 索引 多模态 字符
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号