摘要
本发明属于自然语言处理技术领域,具体涉及一种基于问题扩展的机器阅读理解候选答案抽取方法。为解决现有抽取方法存在外部知识利用不足和长文本处理不当等问题,本发明主要包括(1)基于大语言模型抽取文章中与问题题干相关词,构建了问题词扩展库;其次,利用大语言模型强大的生成能力,对原问题的题干进行重写,进一步,利用问题词扩展库对重写的问题进行扩展,以解决题干内容精简、用词抽象的问题。(2)设计相关性判断模型,全局上下文编码模块对问题和文章句子分别进行编码,历史信息编码模块将句子的全局上下文信息和历史信息相融合,MLP模块对问题和文章句子间进行关联打分,根据分数选择与问题相关的候选答案。
技术关键词
答案抽取方法
机器阅读理解
文本
大语言模型
信息编码
编码模块
文章
sigmoid函数
高维向量空间
扩展模块
预训练语言模型
度计算方法
分块
注意力
自然语言
语义
实体
系统为您推荐了相关专利信息
多模态特征融合
文本编码器
地物类别
标签文本
融合特征
中文文本识别
辅助分类器
判别特征
Softmax函数
文本校正
报告自动生成方法
文本
视觉特征提取
多模态特征融合
生成医学报告