摘要
本发明公开了一种基于视觉大语言模型的动物行为多模态智能标注系统及方法,包括:输入待处理的影像数据;基于视觉识别算法进行处理,为每个动物构建身份标签与对应的形态数据;对动物的形态数据进行量化分析,获得描述动物行为的目标行为量化指标数据输入到行为推理器中,并结合行为指标初始推理权重和行为定义与推理指令集,获得第一行为时序列表;将案例库中动物行为的图像及行为标签输入到多模态行为识别器中,获得第二行为时序列表;将上述行为时序列表结合进行打分,获得存疑片段并修正;当修正后的行为时序列表满足预设阈值,完成标注。本发明提升了动物行为标注的自动化水平,并通过融合多模态数据提高了行为识别的准确性和鲁棒性。
技术关键词
动物
程序执行模块
大语言模型
多模态
标注系统
识别器
智能标注方法
标签
视觉
识别算法
案例库
数据
读写工具
指标
形态
图像
在线
标注功能
可视化界面