针对多模态大模型的文本描述的调整方法、装置及设备

正文

推荐专利

申请号：CN202411612907

申请日期：2024-11-12

公开号：CN119559434A

公开日期：2025-03-04

类型：发明专利

摘要

本申请涉及一种针对多模态大模型的文本描述的调整方法、装置及设备，该方法确定第一样本图像并将其第一文本描述设置为第二文本描述；在第一样本图像中添加图像触发器得到第二样本图像；通过各第三样本图像和各第二样本图像，对添加的图像触发器和上下文生成器的参数进行调整；将样本图像通过图像编码器得到图像特征向量，将经上下文生成器得到的预测文本和样本图像对应的文本描述通过文本编码器得到文本特征向量，通过图像特征向量和文本特征向量进行特征对齐，得到多模态大模型针的输出文本，基于图像特征向量与文本特征向量之间的相似度确定损失函数，尽量保持多模态大模型的参数不变，并对多模态大模型的输出文本进行特定调整，提高调整效率。

技术关键词

图像特征向量文本特征向量样本多模态图像编码器文本编码器计算机程序代码计算机程序产品视觉特征存储程序指令阶段语义可读存储介质参数存储器

系统为您推荐了相关专利信息

一种基于区块链的配电网数据状态规划方法

负荷周期配电网模型节点配电房

塔设备状态监测方法、装置、系统和监测平台

塔设备多元线性回归模型训练样本数据负荷预测模型数据存储单元

一种基于人工智能的虚拟图像检测方法

纹理样本图像边缘锐化生成对抗网络图像检测方法

基于一次性密钥保护的多模态生物特征融合系统

特征融合系统生物特征识别模块生物识别特征密钥分发管理双重认证

一种基于多模态监测的婴儿智能监护方法、装置、设备及介质

对象振动信号特征婴儿智能监护分布特征图像

针对多模态大模型的文本描述的调整方法、装置及设备

站点导航

APP 下载