摘要
本申请涉及一种文档信息自动问答的方法、系统、设备及介质,涉及自然语言处理和信息检索技术领域;其包括将待处理的文档进行分段处理,并建立各段落之间的上下文关系;将每个段落内的句子向量化,形成多维的向量数组;使用支持向量机(SVM)作为分类算法,生成SVM分类模型;接收用户输入的问题;根据问题内容匹配SVM模型以及提取文档上下文;将筛选出的段落内容输入到大型预训练语言模型中,生成答案并返回给用户。本申请能够在不牺牲大模型强大能力的前提下,有效应对大型文档的处理难题。
技术关键词
SVM分类
生成答案
置信度阈值
输入模块
预训练语言模型
信息检索技术
特征提取方法
分类边界
可读存储介质
支持向量机
分段
自然语言
处理器
关系
输入端
存储器
计算机
系统为您推荐了相关专利信息
金属矿山巷道
BP神经网络构建
稳定性预测方法
巷道围岩稳定性
计算机可读取存储介质
链接预测方法
注意力机制
链接预测系统
节点特征
sigmoid函数
大语言模型
故障诊断算法
故障场景
支架
监控方法
置信度阈值
训练样本数据
敏感信息识别
信息处理
摘要
遥控控制系统
遥控终端
拖拉机
整车控制器
执行机构