一种视觉任务处理方法、装置、电子设备、介质及产品

AITNT
正文
推荐专利
一种视觉任务处理方法、装置、电子设备、介质及产品
申请号:CN202411909848
申请日期:2024-12-24
公开号:CN119851172A
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开了一种视觉任务处理方法、装置、电子设备、介质及产品。所述方法包括:获取视频图像序列和用户指令;将所述视频图像序列和所述用户指令输入任务偏好模型中,通过所述任务偏好模型中的任务解码器和多模态大语言模型扩展新的视觉任务,输出视觉任务处理结果。该方法通过扩展新的视觉任务增强多模态大语言模型对视觉任务的理解能力,达到能够更精确的感知和理解视觉任务。
技术关键词
大语言模型 令牌 多模态 解码器 视频 序列 指令 图像 计算机程序产品 识别用户意图 标记 视觉特征 电子设备 标签 模板 可读存储介质 处理器通信
系统为您推荐了相关专利信息
1
一种水下机器人导航方法、系统、电子设备及存储介质
地形特征点 编码器 自主式水下机器人 实时数据 多波束声呐
2
基于动态分片和多层混淆的视频加密方法及系统
视频加密方法 嵌入水印信息 分片结构 分布式密钥 内容加密
3
基于视觉语言大模型与提示学习的病理图像细胞分类方法
细胞分类方法 图像编解码 分类网络 视觉 匹配模块
4
一种基于多源特征融合的刀具磨损状态预测方法
多源特征融合 刀具磨损状态 融合特征 门控循环单元 数据
5
一种农业病虫害的智慧检测方法
农业病虫害 多模态传感器 病害特征 可见光图像 移动端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号