多模态文本的生成方法、获取方法、装置、设备和介质

正文

推荐专利

申请号：CN202410955241

申请日期：2024-07-16

公开号：CN118608659A

公开日期：2024-09-06

类型：发明专利

摘要

本公开提供了一种多模态文本的生成方法、多模态文本的获取方法、装置、设备、介质和程序产品，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习和大模型等技术领域。多模态文本的生成方法的具体实现方案为：响应于接收到包括提示信息的多模态文本生成请求，基于提示信息，采用大语言模型生成与提示信息对应的文本信息；基于文本信息，采用大语言模型生成与文本信息对应的图像信息；以及基于文本信息和图像信息，采用大语言模型进行多模态文本渲染工具的调用，渲染得到包括文本信息和图像信息的多模态文本。

技术关键词

大语言模型文本多模态图像决策子模块生成方法语句布局置信度阈值收发模块指令人工智能技术计算机程序产品计算机视觉电子设备处理器通信

系统为您推荐了相关专利信息

一种针对小语种的语音识别算法

平行语料库语音识别算法关键词分析单元发音

一种基于自适应MADDPG的星群规避自主决策方法

全局状态信息自主决策方法网络场景脉冲

目标视频生成方法、装置、电子设备及可读存储介质

融合特征图像注意力视频生成模型视觉特征提取

数据生成方法、装置、设备、介质以及产品

视频帧数据生成方法对象检测模型计算机可执行指令数据生成装置

一种全景相机机身遮挡区域消除方法

全景相机消除方法图像配准机身特征点

多模态文本的生成方法、获取方法、装置、设备和介质

站点导航

APP 下载