摘要
本申请公开了一种支持多语言知识库的检索增强生成方法和系统,所述方法包括:获取待处理文档;识别待处理文档的语种类别,待处理文档包含第一语种的文本,且,第一语种的文本在待处理文档中的占比最大;利用针对第一语种的文档拆分模型对待处理文档进行拆分,以获得复数个文本片段;识别第一文本片段中的语种类别,第一文本片段包含第二语种的文本,且,第二语种的文本在第一文本片段中的占比大于预设阈值,第二语种与第一语种相同或者不同;将第一文本片段存储至与第二语种相对应的语种知识库中。本申请能够更好地保留文本片段的语义完整性,提升文本理解效果,大幅提升了对多语言文档处理的准确性和效率。
技术关键词
多语言
生成方法
排序融合算法
关键词
文本理解
答案
生成系统
语义
系统为您推荐了相关专利信息
格式化信息
图像生成方法
字形特征
子模块
图像生成装置
无人机集群
三维避障
避障方法
采集周围环境
采样点