基于视觉大语言模型的动物行为多模态智能标注系统及方法

正文

推荐专利

申请号：CN202510626637

申请日期：2025-05-15

公开号：CN120612512A

公开日期：2025-09-09

类型：发明专利

摘要

本发明公开了一种基于视觉大语言模型的动物行为多模态智能标注系统及方法，包括：输入待处理的影像数据；基于视觉识别算法进行处理，为每个动物构建身份标签与对应的形态数据；对动物的形态数据进行量化分析，获得描述动物行为的目标行为量化指标数据输入到行为推理器中，并结合行为指标初始推理权重和行为定义与推理指令集，获得第一行为时序列表；将案例库中动物行为的图像及行为标签输入到多模态行为识别器中，获得第二行为时序列表；将上述行为时序列表结合进行打分，获得存疑片段并修正；当修正后的行为时序列表满足预设阈值，完成标注。本发明提升了动物行为标注的自动化水平，并通过融合多模态数据提高了行为识别的准确性和鲁棒性。

技术关键词

动物程序执行模块大语言模型多模态标注系统识别器智能标注方法标签视觉识别算法案例库数据读写工具指标形态图像在线标注功能可视化界面

基于视觉大语言模型的动物行为多模态智能标注系统及方法

站点导航

APP 下载