摘要
本申请公开了一种文本处理的方法、模型的训练方法、设备及存储介质。本申请首先从向量数据库确定与输入的文本具有语义关联关系的第一文档。然后基于该第一文档分片后的片段确定第一特征和第二特征。然后将第一特征和第二特征输入至第一模型,得到与该文本对应的答复文本。如此,输入第一模型的特征不仅包括与文本具有相关性的第一片段的特征,还包括与文本不具有相关性的第二片段的特征,从而使得第一模型可以基于第一片段的输入增强与输入的文本语义相似性,并且基于第二片段可以降低与文本不相关的片段对第一模型的干扰,同时也能保留全局信息,使得答复文本准确性更高。
技术关键词
文本
训练样本集
计算机程序产品
语义
可读存储介质
关系
处理器
分片
存储器
指令
计算机设备
参数
系统为您推荐了相关专利信息
特征融合网络
空间金字塔池化
表达式
实时数据
模块
大语言模型
知识问答方法
计算机设备
计算机程序产品
答案