支持多语言知识库的检索增强生成方法和系统

AITNT
正文
推荐专利
支持多语言知识库的检索增强生成方法和系统
申请号:CN202411463014
申请日期:2024-10-18
公开号:CN118964533B
公开日期:2025-01-21
类型:发明专利
摘要
本申请公开了一种支持多语言知识库的检索增强生成方法和系统,所述方法包括:获取待处理文档;识别待处理文档的语种类别,待处理文档包含第一语种的文本,且,第一语种的文本在待处理文档中的占比最大;利用针对第一语种的文档拆分模型对待处理文档进行拆分,以获得复数个文本片段;识别第一文本片段中的语种类别,第一文本片段包含第二语种的文本,且,第二语种的文本在第一文本片段中的占比大于预设阈值,第二语种与第一语种相同或者不同;将第一文本片段存储至与第二语种相对应的语种知识库中。本申请能够更好地保留文本片段的语义完整性,提升文本理解效果,大幅提升了对多语言文档处理的准确性和效率。
技术关键词
多语言 生成方法 排序融合算法 关键词 文本理解 答案 生成系统 语义
系统为您推荐了相关专利信息
1
图像生成方法及其装置
格式化信息 图像生成方法 字形特征 子模块 图像生成装置
2
一种基于vicsek模型具有目标导向的无人机集群避障方法
无人机集群 三维避障 避障方法 采集周围环境 采样点
3
平导倒凹的自动生成方法、程序、存储介质和装置
自动生成方法 端点 面片 网格 计算机执行指令
4
基于论文关键词及语义的层次聚类的学科领域划分方法
关键词 论文 划分方法 语义 大数据技术
5
一种交互式学习活动动态优化方法及系统
交互式学习 动态优化方法 标签 兴趣 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号