摘要
本申请提供了一种无监督的新闻自动分类方法,包括对新闻数据集进行无监督分类处理,得到分类无标记新闻簇;对所述分类无标记新闻簇进行标识识别,得到相应的新闻分类标识;将所述新闻分类标识标记至所述分类无标记新闻簇内的分类无标记新闻,得到分类标记新闻;使用所述分类标记新闻对基础学习模型进行训练,得到新闻分类模型;将待分类新闻输入所述新闻分类模型,得到所述待分类新闻的新闻类型,能够使用机器学习模型对新闻进行分类,能够解决目前在新闻分类领域,由于其不仅存在文本内容、还存在图片内容,使用传统的自然语言处理难以对新闻进行准确分类的问题。
技术关键词
自动分类方法
无监督分类
标记
标识特征
自动分类系统
摘要
语义特征
数据
机器学习模型
大语言模型
样本
代表
自然语言
模块
基础
电子设备
聚类
系统为您推荐了相关专利信息
扫描设备
定位方法
生成虚拟图像
对象
头戴显示设备
激光焊接机械
机器人激光焊接方法
焊接轨迹规划
机器人控制模块
启动按钮
防误操作方法
设备拓扑结构
设备参数信息
特征提取模型
矩阵