摘要
本发明涉及电梯图像处理技术领域,具体涉及基于语义识别与图像分割大模型的电梯图生文方法、系统、设备及介质,所述方法包括:获取电梯检测场景的原始图像并进行预处理;基于预训练的语义分割模型处理所述预处理后的原始图像,生成电梯部件的分割掩码图;将所述原始图像与分割掩码图分别输入图像编码器进行特征提取,并对提取的特征进行融合生成跨模态融合特征;基于所述跨模态融合特征,利用文本生成模型解析电梯部件关联信息生成初始文本描述;利用多源校准机制优化所述初始文本描述,生成包含结构化元数据的标准化电梯状态文档。其目的在于,实现电梯图像的自动语义解析与结构化报告生成。
技术关键词
跨模态融合特征
电梯
语义分割模型
文本生成模型
图像分割
校准机制
图像编码器
高层语义特征
序列
轿厢系统
标签
曳引系统
处理器
可读存储介质
图像采集模块
图像处理技术
系统为您推荐了相关专利信息
多层次特征提取
图像分割模型
解码器
子模块
多层级特征
弧形连铸机
三维运动轨迹
预警方法
空间运动轨迹
振动台
图像生成方法
文本编码器
嵌入特征
编码向量
样本