AI资讯新闻榜单内容搜索-视觉

AITNT
未登录
搜索: 视觉

具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据
7112 AI技术研报
具身智能一步踏入Scaling Law!10B+基础模型,27万小时真实数据

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑
8381 AI技术研报
RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena
8696 AI资讯
谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

内存直降50%,token需求少56%!用视觉方式处理长文本

内存直降50%,token需求少56%!用视觉方式处理长文本
9162 AI技术研报
内存直降50%,token需求少56%!用视觉方式处理长文本

最火VLA,看这一篇综述就够了

最火VLA,看这一篇综述就够了
8277 AI技术研报
最火VLA,看这一篇综述就够了

高效训练新标杆!华人团队开源原生VLM-NEO,以少数据追平顶级模型

高效训练新标杆!华人团队开源原生VLM-NEO,以少数据追平顶级模型
7893 AI技术研报
高效训练新标杆!华人团队开源原生VLM-NEO,以少数据追平顶级模型

牛津VGG、港大、上交发布ELIP:超越CLIP等,多模态图片检索的增强视觉语言大模型预训练

牛津VGG、港大、上交发布ELIP:超越CLIP等,多模态图片检索的增强视觉语言大模型预训练
6937 AI技术研报
牛津VGG、港大、上交发布ELIP:超越CLIP等,多模态图片检索的增强视觉语言大模型预训练

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B
10079 AI技术研报
3B Image Captioning小钢炮重磅来袭,性能比肩Qwen2.5-VL-72B

大模型在具身推理上「翻车」了?4496 道题全面揭示短板

大模型在具身推理上「翻车」了?4496 道题全面揭示短板
6593 AI技术研报
大模型在具身推理上「翻车」了?4496 道题全面揭示短板

让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器
7815 AI技术研报
让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器
上一页 当前第13页,共71页 下一页
沪ICP备2023015588号