摘要
本申请提供一种基于多维查询特征的高维稀疏数据集改进方法,包括:构建融合产品评论文本、用户行为日志和热点事件三个来源的高维稀疏KD树索引;计算评论文本词向量、用户操作序列与热点事件词袋向量的JS散度,根据JS散度判断分布是否发生变化;对发生漂移的特征的数据集分别采用蓄水池随机采样方法更新;利用累加的方式将三类新采样特征分别合并到评论文本词向量、用户操作序列和热点事件词袋向量数据集中;基于采样更新后的评论、用户操作、热点事件特征数据集,训练结合注意力机制的多层感知机;利用高维稀疏KD树索引和多层感知机,实现基于多维查询特征的快速匹配召回与推荐。
技术关键词
多层感知机
热点
随机采样方法
查询特征
文本
注意力机制
事件特征
数据
序列
索引
蓄水池
样本
日志
语义特征
构建算法
话题
时间片
兴趣
特征值
系统为您推荐了相关专利信息
序列识别
文本
序列检测
对话分析方法
音频采集模块
金属表面缺陷检测
网络搭建方法
识别特征
训练特征
缺陷类别
噪声信息
模型训练方法
文字生成方法
噪声预测
图像分割
航班延误预测方法
多模态数据融合
状态空间模型
场景
机场气象监测系统