一种图像生成文本描述的控制方法及系统

正文

推荐专利

一种图像生成文本描述的控制方法及系统

申请号：CN202410836504

申请日期：2024-06-26

公开号：CN118628829A

公开日期：2024-09-10

类型：发明专利

摘要

本发明涉及一种图像生成文本描述的控制方法及系统，属于图像生成文本描述的控制技术领域，该方法包括：收集图像，并为图像标注类别标签；基于类别标签进行自定义，此时，插件式训练自定义类别；基于图像和图像类别约束视觉大语言模型，并基于视觉大语言模型生成图像描述；图像类别包括通用类别和自定义类别；根据图像描述训练图像生成文本描述模型，并在图像生成文本描述模型输出对应的文本描述，此时，基于图像和图像类别约束视觉大语言模型，并基于视觉大语言模型生成图像描述，从而通过图像描述训练图像生成文本描述模型，以便于基于图像一键生成对应的文本描述，同时，类别标签进行自定义，以便于加入了用户自定义的类别。

技术关键词

大语言模型图像类别文本插件式视觉标签自定义模块控制系统索引场景元素

系统为您推荐了相关专利信息

基于人工智能的行动预测方法、装置、计算机设备及介质

强化学习策略视觉设备计算机可读指令机器人场景

基于多模态增强检索生成技术的情感分析方法及系统

情感分析方法生成技术多模态情感分析数据检索算法

一种用于电力行业的安全验证方法及系统

电力终端服务器验证方法周期频谱特征

数据处理大脑本体增强型自主代理及混合专家系统

混合专家系统大语言模型数据处理装置计算机程序产品指令

分类模型训练方法及装置、电子设备和介质

样本分类模型训练方法数据预测类别计算机程序产品

一种图像生成文本描述的控制方法及系统

站点导航

APP 下载