摘要
本发明涉及人工智能技术领域,尤其涉及一种知识库增强检索的文本压缩策略。本发明涉及步骤S1:基于预训练的BERT回答模型,识别并提取输入的问题文本和检索的每段相关文本的答案片段;步骤S2:对于检索的每段相关文本进行预处理;步骤S3:结合上述每段相关文本的预处理结果,采用Reranker模型进行语义匹配打分,将得到的每段相关文本的打分结果进行排序并根据排序优先级选取若干结果进行组合,作为该问题文本的组合结果。Reranker模型根据句子与问题的相关性评估优先级。本发明的目的在于提供一种知识库增强检索的文本压缩策略,通过引入预训练问答模型,高效抽取原文中的关键答案片段作为核心关键词,提高文本处理效率,还能增强模型对答案的聚焦能力。
技术关键词
文本
答案
关键词
策略
问答模型
词频统计
人工智能技术
核心
语义
标记
系统为您推荐了相关专利信息
燃料电池控制方法
坡道
工况
燃料电池输出功率
控制冷却系统
数据传输优化系统
面向智能手表
系统资源参数
低功耗
感知用户佩戴状态
短信模板
自动匹配方法
语义向量
预训练语言模型
节点特征
实时检测系统
实时数据处理
光谱分析
智能反馈控制
分析模块