基于大语言模型、人脸识别、目标检测及跨模态向量的融合影视剧内容检索方法、设备、介质及产品

正文

推荐专利

申请号：CN202411743563

申请日期：2024-11-30

公开号：CN119669518A

公开日期：2025-03-21

类型：发明专利

摘要

本发明公开了一种基于大语言模型、人脸识别、目标检测及跨模态向量的融合影视剧内容检索方法，视频预处理入库；根据用户输入的对视频内容的检索文本，利用大语言模型进行分词及优化处理；随后对视频内容的演职员表进行OCR识别并匹配人物角色关联关系；对于物体进行目标检测；对于用户检索中的涉及的场景、事件内容则通过CLIP模型建立的跨模态映射，将视频帧转换为向量表示，并与查询文本的向量表示进行对比，计算视频帧与查询文本之间的相似度；最后通过命中数量和最终加权得分进行二次排序。本发明还公开了一种电子设备、介质及产品。本发明提升影视剧媒体视频素材内容检索能力，并通过融合算法进行综合判定，得到高质量的视频检索方案。

技术关键词

内容检索方法大语言模型影视剧人脸识别模型文本人脸识别检测计算机程序产品物体视频帧高维特征向量图像特征向量命名实体识别处理器跨模态人脸识别技术人脸数据库电子设备可读存储介质人物特征

系统为您推荐了相关专利信息

一种基于区块链生成式人工智能检测评估方法及系统

文本特征向量检测评估方法同态加密算法文本检测模型生成式对抗网络

一种基于上文筛选和示例推理的对话情感分类方法及装置

词嵌入向量情感分类方法信息编码 BERT模型大语言模型

基于大模型与界面联合驱动的终端控制系统及控制方法

终端控制系统界面多模态交互指令大语言模型

一种基于注意力机制的人脸识别扩散去噪防御方法

特征提取网络注意力机制人脸识别模型样本注意力模型

大模型优化的集成传感器多模态数据边缘计算系统及方法

融合特征多模态跨模态模态特征集成传感器

基于大语言模型、人脸识别、目标检测及跨模态向量的融合影视剧内容检索方法、设备、介质及产品

站点导航

APP 下载