多模态大模型训练方法、目标检测方法、装置及电子设备

正文

推荐专利

申请号：CN202510399045

申请日期：2025-03-31

公开号：CN119903348B

公开日期：2025-07-01

类型：发明专利

摘要

本申请实施例提供了一种多模态大模型训练方法、目标检测方法、装置及电子设备，涉及人工智能技术领域，多模态大模型训练方法包括：获取多个样本图像和图像中对象标注框的第一样本描述文本；利用第一大语言模型和第一文本提示，提取每一样本图像对应的第一样本描述文本所描述的对象的类别名称以及属性，并将得到的类别名称与属性中的至少一个进行组合，得到第二样本描述文本；确定该样本图像中每一对象标注框与对应的多个第二样本描述文本的每一属性是否相匹配；构建包含第二样本描述文本的样本问题以及对应的思维链形式的样本回答，得到问答样本对；利用构建的问答样本对进行多模态大模型的训练。可以降低描述性目标检测的复杂性，提高检测效率。

技术关键词

文本样本图像大语言模型对象多模态模型训练方法模型训练装置电子设备人工智能技术数据获取模块图文存储器参数处理器程序

系统为您推荐了相关专利信息

一种利用无人机进行山体位移监测的检测方法

邻域像素点无人机输入端神经网络模型

一种基于超声图像特征识别的鳜鱼雌雄快速监测系统

多模态数据采集监测系统高频超声探头图像特征识别压力传感器阵列

基于隐式权限分析与利用的Kubernetes提权攻击方法、系统、设备及介质

大语言模型语义列表识别模块分析模块

基于混合不确定性估计的神经辐射场增量式最优视图选择方法

图像透明度代表射线颜色

用于确定目标缺陷的检测方法、电子设备和可读存储介质

图像计算机执行指令置信度阈值亮点电子设备

多模态大模型训练方法、目标检测方法、装置及电子设备

站点导航

APP 下载