摘要
本发明公开了一种施工场景图像描述数据自动生成方法及系统,属于数字图像处理领域。根据行为主体检测任务、操作客体检测任务和防护装备检测任务对应的提示词,利用多模态大模型分别对图像进行行为主体、操作客体和防护装备的检测;将行为主体检测结果和操作客体检测结果,根据提示词,生成行为描述;将行为主体检测结果和防护装备检测结果,根据提示词,生成穿戴描述;将行为描述和穿戴描述,根据提示词,生成施工场景描述;将行为描述、穿戴描述和施工场景描述进行整合。本发明将复杂图像描述生成任务分解为图像检测任务和描述生成任务,每个任务使用明确的提示词引导,能够更精准地提取图像信息和生成描述,提高了数据生成的准确性和效率。
技术关键词
数据自动生成方法
防护装备
多模态
场景
数据自动生成系统
数字图像处理
模块
文本
模板
图片
关系
代表
定义
格式
序列