摘要
本公开涉及一种数据采集方法及其系统。该方法包括:对获取的用户行为数据的集合进行语义编码以得到用户行为数据语义编码向量的集合;计算用户行为数据语义编码向量的集合的序列分布初始簇中心,并计算所述用户行为数据语义编码向量的集合与所述序列分布初始簇中心之间的语义关联度以得到簇中心偏移系数的序列;基于簇中心偏移系数的序列,对用户行为数据语义编码向量的集合进行分组,并对于每组中的子集进行基于主成分分析的数据压缩以得到多个压缩数据,并传输至零售行业大数据分析中台。这样,能够利用数据自身信息来优化指导压缩,减少数据传输过程中丢失大量用户行为关键数据的情况,有利于后端对于用户行为信息的分析和挖掘。
技术关键词
语义关联度
序列
数据采集方法
数据压缩
成分分析
数据采集系统
数据传输模块
矩阵
数据采集模块
系统为您推荐了相关专利信息
特征提取算法
数据处理程序
数据处理方法
数据存储
实时数据处理
推荐模型训练方法
训练推荐模型
特征值
画像特征
统计特征
作物生长状态
深度强化学习
强化学习算法
温室
轨迹
多尺度
PWM占空比
语义
仿人机械手抓取
控制系统