一种图像生成文本描述的控制方法及系统

AITNT
正文
推荐专利
一种图像生成文本描述的控制方法及系统
申请号:CN202410836504
申请日期:2024-06-26
公开号:CN118628829A
公开日期:2024-09-10
类型:发明专利
摘要
本发明涉及一种图像生成文本描述的控制方法及系统,属于图像生成文本描述的控制技术领域,该方法包括:收集图像,并为图像标注类别标签;基于类别标签进行自定义,此时,插件式训练自定义类别;基于图像和图像类别约束视觉大语言模型,并基于视觉大语言模型生成图像描述;图像类别包括通用类别和自定义类别;根据图像描述训练图像生成文本描述模型,并在图像生成文本描述模型输出对应的文本描述,此时,基于图像和图像类别约束视觉大语言模型,并基于视觉大语言模型生成图像描述,从而通过图像描述训练图像生成文本描述模型,以便于基于图像一键生成对应的文本描述,同时,类别标签进行自定义,以便于加入了用户自定义的类别。
技术关键词
大语言模型 图像类别 文本 插件式 视觉 标签 自定义模块 控制系统 索引 场景 元素
系统为您推荐了相关专利信息
1
基于人工智能的行动预测方法、装置、计算机设备及介质
强化学习策略 视觉设备 计算机可读指令 机器人 场景
2
基于多模态增强检索生成技术的情感分析方法及系统
情感分析方法 生成技术 多模态情感分析 数据 检索算法
3
一种用于电力行业的安全验证方法及系统
电力终端 服务器 验证方法 周期 频谱特征
4
数据处理大脑本体增强型自主代理及混合专家系统
混合专家系统 大语言模型 数据处理装置 计算机程序产品 指令
5
分类模型训练方法及装置、电子设备和介质
样本 分类模型训练方法 数据 预测类别 计算机程序产品
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号