摘要
本发明公开一种应用基于BERT模型的文本内容分类系统的分类方法,涉及自然语言处理技术领域,包括以下步骤:S1:对待分类的文本进行数据预处理,将经过预处理的文本按照序列X={x1,x2,x3,…,xn}输入BERT模型中;S2:使用BERT模型预训练权重对文本内容进行语义级别的特征提取;S3:对得到的文本特征向量集V进行升维。本发明解决现有模型无法充分理解词语之间的依赖关系、句子之间的逻辑联系以及文本的整体上下问关系的问题,并从系统的层面解决不同语种文本内容分类的问题。
技术关键词
BERT模型
内容分类系统
文本特征向量
分类方法
语义特征
矩阵
序列
关系
词语
基线
压缩特征
学习特征
基准
数据
语义向量
自然语言
定义
系统为您推荐了相关专利信息
深度学习网络模型
构建深度学习网络
外周血涂片
训练集
随机梯度下降
多模态特征
视觉特征提取
跨模态
图片
特征提取模型
特征标记方法
信号监测设备
特征模板
知识图谱构建
种子