一种基于多模态大模型的道岔巡检方法、装置及设备

正文

推荐专利

申请号：CN202411667698

申请日期：2024-11-20

公开号：CN119625630A

公开日期：2025-03-14

类型：发明专利

摘要

本申请涉及人工智能技术领域，尤其涉及一种基于多模态大模型的道岔巡检方法、装置及设备。获取到的道岔巡检文件包括有音频数据和视频数据，并获取到了用于提示多模态大模型对音频数据和视频数据进行分析的提示文本，再利用多模态大模型按照提示文本对音频数据和视频数据进行分析处理，得到道岔巡检文件对应的检查结果，与现有技术中的人工审查相比，大大提高了道岔巡检的效率，并且使用多模态大模型对视频数据和音频数据综合进行分析提高了道岔巡检的准确率。

技术关键词

矩阵多模态音频语音编码器数据道岔巡检方法文本编码器视频编码器大语言模型交叉注意力机制基础模块人工智能技术巡检装置电子设备

系统为您推荐了相关专利信息

一种林地资源保护信息管理系统及方法

信息管理系统字段关键词资源语义

一种安防用多数据源快速分级筛选系统及方法

分级筛选系统分级筛选方法多源异构数据融合强化学习算法视频流

一种基于弱监督图像转换生成对抗网络的阴影弱化方法

弱化方法生成对抗网络模型辅助分类器图像道路病害

一种视频问答数据集社会推理测评方法及系统

因果关系模型心理社会大数据平台视频互动

一种适用于作业车间调度的强化学习智能体交互策略网络训练方法、程序产品及系统

作业车间调度智能体交互网络训练方法连续动作空间工件

一种基于多模态大模型的道岔巡检方法、装置及设备

站点导航

APP 下载