一种基于场景图的多对象文本生成图像语义评测方法和系统

AITNT
正文
推荐专利
一种基于场景图的多对象文本生成图像语义评测方法和系统
申请号:CN202411945550
申请日期:2024-12-27
公开号:CN120014418A
公开日期:2025-05-16
类型:发明专利
摘要
本发明涉及一种基于场景图的多对象文本生成图像语义评测方法和系统。该方法包括:对文本提示和生成图像进行多模态对象特征编码,得到文本对象特征和图像对象特征;计算文本对象特征和图像对象特征的相似度,得到对象的语义一致性;对文本提示和生成图像中的对象关系进行编码,得到文本关系特征和视觉关系特征;计算文本关系特征和视觉关系特征的相似度,得到关系的语义一致性;综合对象的语义一致性和关系的语义一致性,得到最终的文本生成图像语义一致性评测结果。本发明能够考虑到生成图像与用户给定的文本提示之间的一致性,在包含多个对象的复杂场景中能够对生成图像的对象存在性、对象属性、对象关系等方面做出客观、正确的评测结果。
技术关键词
图像对象特征 文本生成图像 语义评测方法 关系 多模态 存储计算机程序 文本编码器 图像编码器 评测系统 可读存储介质 场景 多层感知机 视觉特征 阶段
系统为您推荐了相关专利信息
1
手语翻译方法、装置、计算机设备及存储介质
手语特征 运动特征 视觉特征 手语翻译方法 训练神经网络
2
基于融合知识图谱和大语言模型的变压器故障诊断方法及系统
融合知识图谱 实体关系抽取模型 三元组 大语言模型 答案
3
基于模块化打包器的按需编译与动态分包方法及系统
打包器 分包方法 模块 动态 策略
4
基于多模态大语言模型适应度评估的场景内容生成进化方法
图像生成模型 大语言模型 进化方法 进化算法 网络架构
5
一种因果发现方法、装置及电子设备
核心 变量 指标 因子 时间段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号