文本确定方法、多模态大模型训练方法以及设备

AITNT
正文
推荐专利
文本确定方法、多模态大模型训练方法以及设备
申请号:CN202411858879
申请日期:2024-12-16
公开号:CN119862957A
公开日期:2025-04-22
类型:发明专利
摘要
本公开提供了基于多模态大模型的文本确定方法、多模态大模型训练方法以及设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、自然语言处理、大模型等技术领域。具体实现方案为:通过多模态大模型中的编码网络、目标图像以及目标图像对应的任务描述文本确定出第一词元序列,并将第一词元序列输入多模态大模型中的大语言模型,获取输出的第一词元特征序列,以及将第一词元特征序列中最后一个词元特征分别输入多模态大模型中的各个解码网络,获取各个解码网络输出的目标词元,并根据第一词元序列和目标词元,得到目标文本。
技术关键词
序列 解码网络 大语言模型 多模态 文本编码器 图像 样本 模型训练方法 人工智能技术 计算机程序产品 计算机视觉 过滤模块 训练装置 处理器通信
系统为您推荐了相关专利信息
1
基于柔性电子技术的步行功能障碍智能评估系统及方法
动态贝叶斯网络 柔性电子技术 智能评估方法 回声状态网络 步态特征
2
一种基于大模型和检索增强的表格问答方法
预训练模型 问答方法 正确率 自然语言 语句
3
一种基于双目视觉的盲人智能眼镜
盲人智能眼镜 规划 导航模块 GPS位置信息 视觉
4
一种基于大语言模型获取无人机航线方法、设备及介质
无人机航线 大语言模型 图像 航迹规划算法 地点
5
基于相对语义动作分割的孤独症儿童回应能力的自动筛查方法、系统、终端及介质
孤独症儿童 筛查方法 语义 骨架姿态 筛查系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号