摘要
本申请提供了一种基于关键词的数据采集方法及装置,涉及数据处理技术领域,解决了数据采集结果精确度较低技术问题。该方法包括:基于数据采集请求对应采集到的第一采集内容提取多个文本关键词;在多个文本关键词中确定出现频次大于第一预设频次值的目标文本关键词,在第二数据源中确定目标文本关键词的出现频次大于第二预设频次值的第二采集内容;对第一采集内容以及第二采集内容中的图像数据进行识别,根据识别结果确定针对同一事物在多种不同拍摄角度下的目标图像数据,并将针对同一事物的全部目标图像数据划分为同一种类图像;根据多个种类图像对应的多个事件确定多个事件关键词,并通过事件关键词进行数据采集,得到第三采集内容。
技术关键词
关键词
数据采集方法
历史采集数据
图像
文本
自然语言识别
日常用语
计算机
数据采集装置
处理器
可读存储介质
分词算法
数据处理技术
带标签
噪声
识别模块
指令
系统为您推荐了相关专利信息
清洁设备
光伏组件图像
光伏电站运维方法
线条
拍摄装置
标签粘贴方法
标签粘贴装置
文字特征
图书
超分辨率
车载摄像装置
动画
单车
车辆碰撞事故
车辆管理技术