摘要
本申请公开了一种招投标文本分类方法,包括:获取待处理招投标文本的各个核心词,以各个核心词作为节点构建图结构,获取特征矩阵和共现矩阵;采用第一Transformer网络对特征矩阵进行处理,得到词级编码特征;确定各个句子向量,采用第二Transformer网络对各个句子向量、词级编码特征和共现矩阵进行处理,得到句级编码特征;采用Transformer变体对句级编码特征和共现矩阵进行处理,得到图级编码特征;将词级编码特征、句级编码特征和图级编码特征进行融合,得到融合特征;基于多标签文本分类模型对融合特征进行处理,输出待处理招投标文本的多标签分类结果。本申请能够捕捉招投标文本的不同层次化特征(词、句、图)的语义信息,提高招投标文本分类的效率和准确性。
技术关键词
编码特征
文本分类方法
核心
多头注意力机制
融合特征
语义标签
多标签文本分类
掩码矩阵
节点
网络
分词
训练集
BERT模型
计算机设备
系统为您推荐了相关专利信息
大语言模型
融合特征
交叉注意力机制
高维特征向量
医疗数据处理技术
客户终端
边界网关协议
互联网
汇聚交换机
虚拟路由器冗余协议
模型训练模块
故障预测方法
故障预测装置
电机运行数据
训练集