摘要
本发明属于数据分析领域,提供了一种科技创新资源数据应用场景分类方法,包括:文本获取、预清洗及分词、分词筛选、输入向量获取以及最近邻分类模型分类;最近邻分类模型的训练过程包括:预设资源库、文本预处理、分词筛选、输入向量获取、训练样本获取以及最近邻算法训练。本发明利用分词权重筛选和最近邻算法实现了科技创新资源数据的应用场景分类,简化了资源数据的整合及科研资源的筛选。
技术关键词
场景分类方法
科技创新
文本
资源库
分词
分类器
数据
算法
训练集
科研
标签
样本
核心
主题
日期
参数
模块
平台
系统为您推荐了相关专利信息
公安司法
智能语义理解
动态更新接口
神经网络推理
知识库实体
历史工单数据
工单系统
AI算法
地名识别
社区文本数据
视频段
检索方法
音频分类技术
光学字符识别技术
视频帧
智能监测模块
监测系统
企业经营管理
数据
优化用户体验