文本确定方法、多模态大模型训练方法以及设备

正文

推荐专利

申请号：CN202411858879

申请日期：2024-12-16

公开号：CN119862957A

公开日期：2025-04-22

类型：发明专利

摘要

本公开提供了基于多模态大模型的文本确定方法、多模态大模型训练方法以及设备，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、自然语言处理、大模型等技术领域。具体实现方案为：通过多模态大模型中的编码网络、目标图像以及目标图像对应的任务描述文本确定出第一词元序列，并将第一词元序列输入多模态大模型中的大语言模型，获取输出的第一词元特征序列，以及将第一词元特征序列中最后一个词元特征分别输入多模态大模型中的各个解码网络，获取各个解码网络输出的目标词元，并根据第一词元序列和目标词元，得到目标文本。

技术关键词

序列解码网络大语言模型多模态文本编码器图像样本模型训练方法人工智能技术计算机程序产品计算机视觉过滤模块训练装置处理器通信

系统为您推荐了相关专利信息

基于柔性电子技术的步行功能障碍智能评估系统及方法

动态贝叶斯网络柔性电子技术智能评估方法回声状态网络步态特征

一种基于大模型和检索增强的表格问答方法

预训练模型问答方法正确率自然语言语句

一种基于双目视觉的盲人智能眼镜

盲人智能眼镜规划导航模块 GPS位置信息视觉

一种基于大语言模型获取无人机航线方法、设备及介质

无人机航线大语言模型图像航迹规划算法地点

基于相对语义动作分割的孤独症儿童回应能力的自动筛查方法、系统、终端及介质

孤独症儿童筛查方法语义骨架姿态筛查系统

文本确定方法、多模态大模型训练方法以及设备

站点导航

APP 下载