摘要
本公开的实施例提供一种基于SurrealDB的跨模态数据处理方法和装置,该方法包括:对多种不同模态的数据进行文本化处理和向量化处理,得到文本和向量,并对文本进行分词和关键词提取,得到文本关键词;基于文本关键词构建全文索引,基于向量构建向量索引,将不同模态的数据以全文索引和向量索引的混合存储方式,存储在基于SurrealDB的数据模型中;接收用户的查询数据,将查询数据进行文本化处理和向量化处理,得到查询文本和查询向量,并对查询文本进行分词和关键词提取,得到查询文本关键词;以及基于查询文本关键词和查询向量,在基于SurrealDB的数据模型中进行向量检索和全文检索,输出匹配的多模态数据检索结果。
技术关键词
文本
关键词
全文索引
数据处理方法
语音识别模型
音频
卷积神经网络提取
自然语言
分词
数据存储方法
图片
图像
融合算法
机器翻译模型
解析网页
视频
数据处理装置
字幕
系统为您推荐了相关专利信息
智能语音
垃圾
语义关键词
大数据处理模块
白名单
术语
医药知识图谱
知识图谱构建
动态知识图谱
增量更新
令牌
节点特征
视频检索方法
神经网络架构
多层感知机