针对多模态大模型的文本描述的调整方法、装置及设备

AITNT
正文
推荐专利
针对多模态大模型的文本描述的调整方法、装置及设备
申请号:CN202411612907
申请日期:2024-11-12
公开号:CN119559434A
公开日期:2025-03-04
类型:发明专利
摘要
本申请涉及一种针对多模态大模型的文本描述的调整方法、装置及设备,该方法确定第一样本图像并将其第一文本描述设置为第二文本描述;在第一样本图像中添加图像触发器得到第二样本图像;通过各第三样本图像和各第二样本图像,对添加的图像触发器和上下文生成器的参数进行调整;将样本图像通过图像编码器得到图像特征向量,将经上下文生成器得到的预测文本和样本图像对应的文本描述通过文本编码器得到文本特征向量,通过图像特征向量和文本特征向量进行特征对齐,得到多模态大模型针的输出文本,基于图像特征向量与文本特征向量之间的相似度确定损失函数,尽量保持多模态大模型的参数不变,并对多模态大模型的输出文本进行特定调整,提高调整效率。
技术关键词
图像特征向量 文本特征向量 样本 多模态 图像编码器 文本编码器 计算机程序代码 计算机程序产品 视觉特征 存储程序指令 阶段 语义 可读存储介质 参数 存储器
系统为您推荐了相关专利信息
1
一种基于区块链的配电网数据状态规划方法
负荷 周期 配电网模型 节点 配电房
2
塔设备状态监测方法、装置、系统和监测平台
塔设备 多元线性回归模型 训练样本数据 负荷预测模型 数据存储单元
3
一种基于人工智能的虚拟图像检测方法
纹理 样本 图像边缘锐化 生成对抗网络 图像检测方法
4
基于一次性密钥保护的多模态生物特征融合系统
特征融合系统 生物特征识别模块 生物识别特征 密钥分发管理 双重认证
5
一种基于多模态监测的婴儿智能监护方法、装置、设备及介质
对象 振动信号特征 婴儿智能监护 分布特征 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号