摘要
本发明公开了一种基于CBERT‑MDPCNN模型的警情文本分类方法,该方法采用GPT4大语言模型进行警情文本数据增强,通过词嵌入层得到文本特征矩阵,并通过BERT预训练模型将文本特征矩阵转化为MDPCNN能够处理的多卷积核的文本特征向量,最后输入MDPCNN多头分类器模型实现警情文本分类任务。本发明可快速进行警情文本分类,提高模型对警情文本进行分类的正确率,且大大减少了模型训练对警情文本数据样本量的要求,并具有一定的模型泛化能力,适用于涉网警情和非涉网警情等警情文本。
技术关键词
文本分类方法
文本特征向量
警情文本数据
分类器模型
文本分类器
金字塔池化
金字塔结构
Softmax函数
案件
词嵌入向量
前馈神经网络
编码
多任务
词语
矩阵
标签
注意力
系统为您推荐了相关专利信息
纠正方法
文本特征向量
网格特征
深度图
语义特征
状态监测数据
设备状态预测
待测参数
特征提取模型
量子态
深度学习特征提取
文本特征向量
页面特征
元素
实体间关系
预训练模型
动态规划算法
模型训练方法
文本特征向量
数据