摘要
本发明涉及智能检索服务领域,具体地说,涉及一种实现智能检索服务的高效数据向量化计算方法。其包括以下步骤:S1、收集文本和图像的非结构化数据;S2、通过词袋模型将文本转换为结构化的特征向量表示,通过卷积神经网络CNN将图像转换为结构化的特征向量表示;S3、将提取的特征向量存储在向量数据库Faiss中,并通过KD树为数据库中的向量建立索引结构;S4、通过自然语言算法解析用户查询,通过平均池化方法将解析完成后的词向量组合成句子向量,并通过余弦相似度计算查询向量和存储向量的相似度实现智能检索。本发明设计通过词袋模型关注词汇的出现频率,基于词频,直观易懂,可以通过查看词频来解释模型的预测结果。
技术关键词
量化计算方法
池化方法
词袋模型
文本
数据
生成索引结构
自然语言
图像
节点
梯度下降法
因子
频率
点分配
矩阵
算法
字符
纹理
数值
标记
系统为您推荐了相关专利信息
智能化巡查系统
LNG天然气
LNG设备
光谱传感器模块
节点
闸门故障检测
转移概率矩阵
稳态概率
粒子群算法
模糊熵算法
数字孪生模型
定位监测方法
电能监测数据
水电站
水力系统
干预方法
临床决策支持系统
滑动窗口方法
进程
多模态数据采集
依存句法分析
融合特征
情感分析方法
解析句子
编码