一种基于半人工的图像人类偏好数据获取的方法

正文

推荐专利

申请号：CN202510573200

申请日期：2025-05-06

公开号：CN120496093A

公开日期：2025-08-15

类型：发明专利

摘要

本发明涉及一种基于半人工的图像人类偏好数据获取的方法，包括以下步骤：S1：获取数据；S2：基于获取的数据，进行优化扩展；S3：利用大语言模型对图像数据及提示语进行改写、扩展和增强；S4：将经过大语言模型处理的提示语作为输入，采用多个不同的文本到图像生成模型以生成图像；S5：利用视觉语言模型对图像和对应的文本提示语进行分析，并计算图像和对应的文本提示语的匹配程度；S6：通过多模态大语言模型对图像评估进行优化；S7：让标注员在两个候选图像之间选择更符合描述的图像，构建成对比偏好数据。本发明可以高效、准确地构建大规模、高质量的偏好数据集，从而优化图像生成模型对人类审美和语义偏好的适应能力。

技术关键词

大语言模型图像生成模型图像评估文本人类代表训练数据多模态视觉参数美学语义种子因子企业基础

系统为您推荐了相关专利信息

一种恶意邮件的检测方法、装置及计算设备

邮件随机森林模型检测数据输入统一资源定位存储器

基于多模态时序融合的数据库异常检测方法及装置

性能指标数据变分贝叶斯多模态时序异常点

软件成本度量方法、装置、电子设备及存储介质

BERT模型词语文本软件词向量训练

一种基于QT框架的可定制虚拟键盘及其使用方法

QT框架全键盘组件调用虚拟键盘数字键盘动态库文件

一种基于图文多模态处理引擎的多智能体平台的保险超药量识别的数智系统

智能体平台多模态图文触控查询一体机操作台

一种基于半人工的图像人类偏好数据获取的方法

站点导航

APP 下载