摘要
本发明涉及一种图像生成文本描述的控制方法及系统,属于图像生成文本描述的控制技术领域,该方法包括:收集图像,并为图像标注类别标签;基于类别标签进行自定义,此时,插件式训练自定义类别;基于图像和图像类别约束视觉大语言模型,并基于视觉大语言模型生成图像描述;图像类别包括通用类别和自定义类别;根据图像描述训练图像生成文本描述模型,并在图像生成文本描述模型输出对应的文本描述,此时,基于图像和图像类别约束视觉大语言模型,并基于视觉大语言模型生成图像描述,从而通过图像描述训练图像生成文本描述模型,以便于基于图像一键生成对应的文本描述,同时,类别标签进行自定义,以便于加入了用户自定义的类别。
技术关键词
大语言模型
图像类别
文本
插件式
视觉
标签
自定义模块
控制系统
索引
场景
元素
系统为您推荐了相关专利信息
强化学习策略
视觉设备
计算机可读指令
机器人
场景
情感分析方法
生成技术
多模态情感分析
数据
检索算法
混合专家系统
大语言模型
数据处理装置
计算机程序产品
指令
样本
分类模型训练方法
数据
预测类别
计算机程序产品