摘要
本发明提供了一种基于混合检索与检索增强生成的小语种专业问答方法,包括S1.构建多语言知识库:根据相关的小语种文档,使用多语言模型,构建向量索引库和术语知识图谱;S2.多层混合检索:通过多层混合检索模块实现跨语言文档召回,多层混合检索模块由关键词检索、语义检索和向量检索构成;S3.生成回答:利用检索增强生成模块,通过适配的多语言模型进行回答生成,在生成阶段引入规则约束解码和动态注意力机制提高回答的专业性和准确性;S4.自适应优化与知识更新:通过用户反馈强化学习模块,基于用户纠错数据优化模型并监督知识库的更新。本发明方法能够基于少量小语种专业资料,实现小语种专业问答,提升了小语种文档召回率、提升了生成质量。
技术关键词
问答方法
术语
多语言
注意力机制
语义
专业
关键词
图谱
索引
模块
光学字符识别
检索策略
解码
动态
纠错
通道
参数
编码
非标准
覆盖率
系统为您推荐了相关专利信息
生成系统
标记单元
Softmax函数
人脸身份
语义
风电设备
数据存储方法
异常数据
多源异构数据
数据存储系统
监测方法
车辆控制指令
神经网络模型
融合特征
车辆减速行驶