基于语义识别与图像分割大模型的电梯图生文方法、系统、设备及介质

AITNT
正文
推荐专利
基于语义识别与图像分割大模型的电梯图生文方法、系统、设备及介质
申请号:CN202511068668
申请日期:2025-07-31
公开号:CN120894636A
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及电梯图像处理技术领域,具体涉及基于语义识别与图像分割大模型的电梯图生文方法、系统、设备及介质,所述方法包括:获取电梯检测场景的原始图像并进行预处理;基于预训练的语义分割模型处理所述预处理后的原始图像,生成电梯部件的分割掩码图;将所述原始图像与分割掩码图分别输入图像编码器进行特征提取,并对提取的特征进行融合生成跨模态融合特征;基于所述跨模态融合特征,利用文本生成模型解析电梯部件关联信息生成初始文本描述;利用多源校准机制优化所述初始文本描述,生成包含结构化元数据的标准化电梯状态文档。其目的在于,实现电梯图像的自动语义解析与结构化报告生成。
技术关键词
跨模态融合特征 电梯 语义分割模型 文本生成模型 图像分割 校准机制 图像编码器 高层语义特征 序列 轿厢系统 标签 曳引系统 处理器 可读存储介质 图像采集模块 图像处理技术
系统为您推荐了相关专利信息
1
一种基于多尺度门控融合的弱监督组织病理图像分割方法
多层次特征提取 图像分割模型 解码器 子模块 多层级特征
2
一种弧形连铸机三维运动轨迹检测与管式预警方法
弧形连铸机 三维运动轨迹 预警方法 空间运动轨迹 振动台
3
一种图像生成方法、设备、介质及计算机程序产品
图像生成方法 文本编码器 嵌入特征 编码向量 样本
4
一种视频处理方法、电子设备、介质及程序产品
全景视频 视频流 视角 切片 深度学习模型
5
一种基于图像分割的干细胞分类方法及系统
数据 层级 多分辨率 图像分割 分类方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号