基于视觉大语言模型的动物行为多模态智能标注系统及方法

AITNT
正文
推荐专利
基于视觉大语言模型的动物行为多模态智能标注系统及方法
申请号:CN202510626637
申请日期:2025-05-15
公开号:CN120612512A
公开日期:2025-09-09
类型:发明专利
摘要
本发明公开了一种基于视觉大语言模型的动物行为多模态智能标注系统及方法,包括:输入待处理的影像数据;基于视觉识别算法进行处理,为每个动物构建身份标签与对应的形态数据;对动物的形态数据进行量化分析,获得描述动物行为的目标行为量化指标数据输入到行为推理器中,并结合行为指标初始推理权重和行为定义与推理指令集,获得第一行为时序列表;将案例库中动物行为的图像及行为标签输入到多模态行为识别器中,获得第二行为时序列表;将上述行为时序列表结合进行打分,获得存疑片段并修正;当修正后的行为时序列表满足预设阈值,完成标注。本发明提升了动物行为标注的自动化水平,并通过融合多模态数据提高了行为识别的准确性和鲁棒性。
技术关键词
动物 程序执行模块 大语言模型 多模态 标注系统 识别器 智能标注方法 标签 视觉 识别算法 案例库 数据 读写工具 指标 形态 图像 在线 标注功能 可视化界面
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号