支持多语言知识库的检索增强生成方法和系统

正文

推荐专利

申请号：CN202411463014

申请日期：2024-10-18

公开号：CN118964533B

公开日期：2025-01-21

类型：发明专利

摘要

本申请公开了一种支持多语言知识库的检索增强生成方法和系统，所述方法包括：获取待处理文档；识别待处理文档的语种类别，待处理文档包含第一语种的文本，且，第一语种的文本在待处理文档中的占比最大；利用针对第一语种的文档拆分模型对待处理文档进行拆分，以获得复数个文本片段；识别第一文本片段中的语种类别，第一文本片段包含第二语种的文本，且，第二语种的文本在第一文本片段中的占比大于预设阈值，第二语种与第一语种相同或者不同；将第一文本片段存储至与第二语种相对应的语种知识库中。本申请能够更好地保留文本片段的语义完整性，提升文本理解效果，大幅提升了对多语言文档处理的准确性和效率。

技术关键词

多语言生成方法排序融合算法关键词文本理解答案生成系统语义

系统为您推荐了相关专利信息

图像生成方法及其装置

格式化信息图像生成方法字形特征子模块图像生成装置

一种基于vicsek模型具有目标导向的无人机集群避障方法

无人机集群三维避障避障方法采集周围环境采样点

平导倒凹的自动生成方法、程序、存储介质和装置

自动生成方法端点面片网格计算机执行指令

基于论文关键词及语义的层次聚类的学科领域划分方法

关键词论文划分方法语义大数据技术

一种交互式学习活动动态优化方法及系统

交互式学习动态优化方法标签兴趣节点

支持多语言知识库的检索增强生成方法和系统

站点导航

APP 下载