基于多模态大模型的文本到图像生成模型评估方法及系统

正文

推荐专利

申请号：CN202510546309

申请日期：2025-04-28

公开号：CN120071055B

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的文本到图像生成模型评估方法与系统。本发明包括多层次图像信息提取与图像特征矩阵构建、分层文本提示生成与优化、生成图像批量化生成、交互式图像对比与评分、多维反馈与提示修订多个步骤，通过重复执行这些步骤流程动态调整生成策略，直至满足预设停止条件。最终，根据参考图像与最优生成图像的多维视觉评估结果，全面分析目标生成模型的性能表现。本发明的评估方法通过图像再生成任务，使生成模型能够基于参考图像的内容和风格进行精准生成，克服了现有评估方法在跨模态信息对齐方面的不足，具有较高的应用价值。

技术关键词

图像生成模型多模态文本生成图像集合大语言模型对象细粒度特征视觉语义层面计算机电子设备多层次交互式图像自然语言动作关系矩阵存储计算机程序图像结构

系统为您推荐了相关专利信息

基于挖机装载位的障碍物识别方法、装置和挖机

障碍物识别方法三维语义地图深度图数据三维点云数据多模态

基于大模型多模态生成与动态验证的测试方法及系统

多模态测试方法生成测试数据动态资源分配

基于数据分析的医疗单位的自查方法及系统

自查方法融合特征非线性特征多模态患者

一种显示设备及基于分屏播放的字幕显示方法

数据显示设备字幕显示方法语义理解模型画面

一种基于深度学习的海上风电运行风险分析系统

风电运行风险分析系统多模态数据融合风电设备特征提取模块

基于多模态大模型的文本到图像生成模型评估方法及系统

站点导航

APP 下载