摘要
本公开提供了数据标注、多模态大模型训练及数据处理方法和装置,涉及计算机视觉、深度学习和大模型等人工智能领域,可应用于基于人工智能的内容生成等场景。其中的数据标注方法可包括:获取样本图像以及对应的第一提示文本,第一提示文本中包括针对样本图像提出的第一需求描述信息;根据样本图像以及第一提示文本生成综合描述文本;将样本图像以及综合描述文本输入多模态大模型,得到输出的标注文本,标注文本中包括第一需求描述信息对应的第一应答信息。
技术关键词
文本
多模态
光学字符识别
样本
图像编码器
数据标注方法
数据处理方法
图像特征提取
模型训练模块
数据获取模块
数据处理模块
解码器
模型训练装置
模型训练方法
处理器
数据处理装置
标注装置
指令
系统为您推荐了相关专利信息
脑肿瘤分割方法
多层注意力
动态权重分配
多尺度特征
模态特征
邻区
小区切换方法
链路
深度强化学习模型
时间提前量
分析系统
分析单元
分析模块
参数
神经网络模型构建
视觉问答方法
大语言模型
多模态
视觉特征
医学图像表征