摘要
本发明提供了一种基于生成式大模型的自然语言交互安防视频检索系统及其装置,包括视频采集模块、视频处理与分析模块、大语言模型处理模块、大视觉模型处理模块、语义相似度计算模块、人机交互与结果展示模块、数据存储与管理模块;所述视频采集模块,用于实时或定期采集视频数据;所述视频采集模块包括安装在楼宇内部、娱乐场所内部和预设距离范围内的高清摄像头,所述视频采集模块分别与所述视频处理与分析模块、所述数据存储与管理模块连接;采用了大模型理解和语义转换的方法,使得在特定场景下能够处理更大规模的数据,捕捉更复杂的语言模式,能够更好地理解上下文,识别多义词的不同含义,并生成更合理、更准确的语义信息。
技术关键词
视频采集模块
视频检索系统
大语言模型
自然语言
分析模块
隐私保护模块
视频帧
数据存储
语义
像素
图像
多头注意力机制
解码器结构
深度学习算法
矩阵
敏感信息脱敏
视频检索装置
系统为您推荐了相关专利信息
多源异构数据融合
深度学习预测模型
智能计算方法
协同管理平台
数据采集模块
机器人本体
信息检索
机器人系统
识别方法
生成机器人
解码模块
文本
大语言模型
解码加速方法
多层感知器