多模态大模型训练方法、目标检测方法、装置及电子设备

AITNT
正文
推荐专利
多模态大模型训练方法、目标检测方法、装置及电子设备
申请号:CN202510399045
申请日期:2025-03-31
公开号:CN119903348B
公开日期:2025-07-01
类型:发明专利
摘要
本申请实施例提供了一种多模态大模型训练方法、目标检测方法、装置及电子设备,涉及人工智能技术领域,多模态大模型训练方法包括:获取多个样本图像和图像中对象标注框的第一样本描述文本;利用第一大语言模型和第一文本提示,提取每一样本图像对应的第一样本描述文本所描述的对象的类别名称以及属性,并将得到的类别名称与属性中的至少一个进行组合,得到第二样本描述文本;确定该样本图像中每一对象标注框与对应的多个第二样本描述文本的每一属性是否相匹配;构建包含第二样本描述文本的样本问题以及对应的思维链形式的样本回答,得到问答样本对;利用构建的问答样本对进行多模态大模型的训练。可以降低描述性目标检测的复杂性,提高检测效率。
技术关键词
文本 样本 图像 大语言模型 对象 多模态 模型训练方法 模型训练装置 电子设备 人工智能技术 数据获取模块 图文 存储器 参数 处理器 程序
系统为您推荐了相关专利信息
1
一种利用无人机进行山体位移监测的检测方法
邻域 像素点 无人机 输入端 神经网络模型
2
一种基于超声图像特征识别的鳜鱼雌雄快速监测系统
多模态数据采集 监测系统 高频超声探头 图像特征识别 压力传感器阵列
3
基于隐式权限分析与利用的Kubernetes提权攻击方法、系统、设备及介质
大语言模型 语义 列表 识别模块 分析模块
4
基于混合不确定性估计的神经辐射场增量式最优视图选择方法
图像 透明度 代表 射线 颜色
5
用于确定目标缺陷的检测方法、电子设备和可读存储介质
图像 计算机执行指令 置信度阈值 亮点 电子设备
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号