基于多模态大语言模型的工地安监智能体系统

正文

推荐专利

申请号：CN202510872275

申请日期：2025-06-26

公开号：CN120997727A

公开日期：2025-11-21

类型：发明专利

摘要

本发明公开了一种基于多模态大语言模型的工地安监智能体系统，包括多模态融合模块、任务解析模块及混合执行引擎。多模态融合模块提取图像/视频、声学等多模态特征，经投影层对齐至LLM语义空间；任务解析模块解析对齐特征生成任务图（节点为子任务、边为依赖关系）；混合执行引擎通过门控注意力机制，依据任务图动态融合特征并驱动子任务执行。本发明通过多模态与LLM深度融合实现跨模态语义对齐，任务图结构化解析提升复杂任务理解能力，门控注意力动态调配特征资源，增强系统执行效率与灵活性，适用于智能机器人、智能家居等场景的空间任务自动化处理，为构建多模态交互与自主决策的智能体提供高效方案。

技术关键词

智能体系统大语言模型安监工地视觉特征编码复杂度音频特征模态特征模块云端适配器语义视频帧特征多模态交互跨模态音频编码器决策文本

系统为您推荐了相关专利信息

基于隐藏状态插值的大语言模型可用性增强方法和装置

大语言模型文本队列新词处理器

一种商业信息的自动收集方法、系统、设备以及介质

自动化工具自动收集方法验证码图像页面数据格式

一种工地的巡检机器人

巡检机器人湿度监测装置矩形工地湿度检测器

基于知识图谱自适应混合检索增强的农业病虫害问答方法

农业病虫害检索策略问答方法语义向量大语言模型

一种医疗科普问答模型微调方法、装置、设备、介质及产品

问答模型微调方法矩阵前馈神经网络注意力机制

基于多模态大语言模型的工地安监智能体系统

站点导航

APP 下载