摘要
本发明公开了一种向量式图像与视频检索方法,通过多模态大模型CLIP的语义解析、领域词微调,结合向量数据库的精确匹配机制,实现高效、精准的图像和视频检索。首先,通过将多模态语义解析引擎将文本、图像、视频等异构数据映射到统一向量空间;其次,针对特定应用场景建立专用领域词库,进行关键特征表示;最后,结合最近邻搜索和倒排索引机制实现向量库的比对和检索。该系统能够适应垂直领域的需求,支持多模态检索,具有广泛的应用前景。
技术关键词
视频检索方法
视频特征向量
图像特征向量
查询标签
视频关键帧提取
倒排索引机制
多模态
分词
文本
镜头边界检测
LORA技术
在线学习方法
语义
关键词
图像特征提取