摘要
本发明属于大语言模型与信息检索领域,提供了一种面向行业大模型的多层次主题式检索增强生成方法及系统,本发明构建了基于语义主题演化学习的长文本分割模型,实现了文档知识的有效切分,避免了段落语义丢失和异常句式的出现。同时,基于主题模型的生成能力,在文档层次生成主题内容,实现文档‑段落两个层次的语义关联,对知识进行更好的管理。在此基础上,本发明构建了多层次主题相似检索方法,在文档‑段落两个层次上进行目标问题的相似检索,减少噪音段落的出现,优化大语言模型提示工程中的候选集内容,从而提高大语言模型应用在目标行业领域知识问答系统的专业性和可靠性。
技术关键词
双向长短期记忆网络
多层次
语义主题
大语言模型
生成方法
编码器
文本
度计算方法
知识问答系统
列表
生成主题
主题模型
模块
检索方法
信息检索
标识
生成系统
数据
系统为您推荐了相关专利信息
AI深度学习
碳纳米管
生长控制方法
参数
锂离子电池
大语言模型
评估系统
代码特征
文本
可读存储介质
图像分类方法
样本
融合特征
多层次
可执行程序代码
后台服务器
姿态识别模型
预演方法
姿态特征
VR设备