摘要
本发明公开了一种基于多数据源的公共数据平台检索方法及系统,涉及数据处理的技术领域。获取原始数据集,对原始数据集中的音频数据进行转化得到音频文本数据;对图像数据进行特征检测得到特征识别标签集,根据特征识别标签对图像进行融合得到初始数据集;对初始数据进行语义识别得到语义文本数据,将语义文本数据、音频文本数据和文本数据进行组合得到目标文本数据并进行分类得到分类数据集;将分类数据集上传至公共数据平台,以使公共数据平台进行更新。对数据进行特征提取和语义分析生成文字描述并进行分类,提升数据的检索效率,为检索系统提供了更准确的分类标签,提高了检索精度,将分类后的数据集上传至平台更新,优化了数据存储结构。
技术关键词
识别标签
文本
检索方法
检索系统
矩阵
语义特征
模块
平台
字词
注意力
视觉特征
音频
全局平均池化
图像
数据分类
网络
节点特征