摘要
本申请涉及文本识别技术领域,提供了基于多粒度特征的SVM分类方法及系统。该方法包括对待分类文本进行预处理,得到目标文本;基于预设的词组分割模型对所述目标文本进行分割处理,得到所述目标文本的多个词组;基于预设的多粒度特征向量生成方法分别生成各所述词组的多粒度特征向量,并基于各所述多粒度特征向量生成初始特征矩阵;基于预设的特征矩阵降维方法对所述初始特征矩阵进行降维处理,得到目标特征矩阵,并将所述目标特征矩阵输入预设的SVM文本分类模型,得到所述待分类文本的分类结果。该方法,实现了在多个粒度上提取各所述词组的特征,有助于实现对文本内容的全面理解。
技术关键词
多粒度特征
指纹
矩阵
分类方法
文本分类模型
皮尔逊相关系数
降维方法
序列生成方法
文本识别技术
数值
分类系统
输入模块
计算方法
语义
依序
系统为您推荐了相关专利信息
电源切换装置
宽厚板
保性能控制方法
热加工系统
状态反馈控制器
桩基结构
层次分析法
监测点
预警方法
层次结构模型
超参数
进化策略
协方差矩阵
训练神经网络模型
算法