摘要
本申请涉及电数字数据处理技术领域,特别是涉及采集数据的处理方法、设备及介质。该方法包括:获取目标网站的采集数据;如果目标网站的采集数据包括图片,则获取目标网站的采集数据包括的图片的模糊程度;如果模糊程度小于等于预设的模糊程度阈值,则使用OCR识别技术获取所述图片对应的第一关键词集合,以及使用多模态大模型获取所述图片对应的第二关键词集合,并将第一关键词集合和第二关键词集合的并集确定为所述图片对应的目标关键词集合;否则,使用多模态大模型获取所述图片对应的初始关键词集合,并将对初始关键词集合进行处理得到的关键词集合确定为所述图片对应的目标关键词集合。本发明能够提高获取的图片对应的关键词的准确性。
技术关键词
关键词
图片
OCR识别技术
数据
多模态
表格
文本
可读存储介质
处理器
存储器
计算机
电子设备
纹理
节点
系统为您推荐了相关专利信息
口腔扫描数据
三维模型
微笑曲线
图像重建
无牙颌患者
废旧布料
分类回收方法
偏振光
斯托克斯参量
判别特征
混凝土楼梯模具
优化设计方法
优化设计方案
控制点
激光切割设备