摘要
本申请公开了文本生成方法、装置、电子设备及存储介质,涉及人工智能领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。具体实现方案为:根据输入图像进行信息提取,以获取图像提取信息,其中输入图像包括主体对象;根据图像提取信息,生成提示信息;其中,提示信息用于引导多模态大模型生成主体对象的描述信息;采用多模态大模型,对输入图像及提示信息进行处理,以获取文本输出结果;其中,文本输出结果包括主体对象的描述信息。
技术关键词
图像提取信息
生成提示信息
文本生成方法
多模态
对象
文本生成装置
电子设备
计算机程序产品
计算机视觉
处理器通信
摘要
模板
指令
场景
标识
可读存储介质
系统为您推荐了相关专利信息
高精度角位移传感器
综合测试平台
转矩转速传感器
负载系统
人形机器人
情感类别
情感特征
音频特征
视频生成方法
融合特征
评分方法
模拟退火算法
生成资源
应急救援资源调度
评分系统
码头
智能优化算法
数据采集模块
检修计划
分析模块