摘要
本发明属于自然语言处理技术领域,具体涉及一种基于改进黑翅鸢算法与xgboost的灾害推文分类方法。本发明方法包括以下步骤:首先对已获得的推文数据进行系统性的预处理,包括清洗、分词、特征提取等步骤;接着通过改进的黑翅鸢算法优化特征选择,在降维的同时,使用优化后的特征子集对xgboost模型进行训练和测试;最后通过准确率、分类报告、ROC曲线和AUC值全面评估该模型的性能。本发明方法采用了结合组合混沌初始化和Levy飞行策略的黑翅鸢算法,降低了数据维度,增强了算法的全局搜索能力,加快了收敛速度,优化了特征选择过程。
技术关键词
分类方法
特征选择
xgboost模型
算法
上下文语义信息
映射方法
分类器训练
初始化方法
矩阵
词频统计
数据
策略
数值
位置更新
分词
自然语言
报告
训练集
曲线