AI资讯新闻榜单内容搜索-视觉

AITNT
未登录
搜索: 视觉

RL新思路!复旦用游戏增强VLM通用推理,性能匹敌几何数据

RL新思路!复旦用游戏增强VLM通用推理,性能匹敌几何数据
9252 AI技术研报
RL新思路!复旦用游戏增强VLM通用推理,性能匹敌几何数据

DeepSeek 再开源:发布 3B MoE OCR 模型,视觉压缩高达20倍

DeepSeek 再开源:发布 3B MoE OCR 模型,视觉压缩高达20倍
12129 AI资讯
DeepSeek 再开源:发布 3B MoE OCR 模型,视觉压缩高达20倍

AI打通第一/第三人称视觉,跨视角视觉理解新SOTA|ICCV 2025 Highlight

AI打通第一/第三人称视觉,跨视角视觉理解新SOTA|ICCV 2025 Highlight
9714 AI技术研报
AI打通第一/第三人称视觉,跨视角视觉理解新SOTA|ICCV 2025 Highlight

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测
7704 AI技术研报
超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体

ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体
7950 AI技术研报
ICCV 2025 | 浙大、港中文等提出EgoAgent:第一人称感知-行动-预测一体化智能体

仅用三五条样本击败英伟达,国内首个超少样本具身模型登场,还斩获顶会冠军

仅用三五条样本击败英伟达,国内首个超少样本具身模型登场,还斩获顶会冠军
7223 AI资讯
仅用三五条样本击败英伟达,国内首个超少样本具身模型登场,还斩获顶会冠军

AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式

AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式
8111 AI技术研报
AI玩拼图游戏暴涨视觉理解力,告别文本中心训练,无需标注的多模态大模型后训练范式

ICCV 2025 | FDAM:告别模糊视界,源自电路理论的即插即用方法让视觉Transformer重获高清细节

ICCV 2025 | FDAM:告别模糊视界,源自电路理论的即插即用方法让视觉Transformer重获高清细节
7238 AI技术研报
ICCV 2025 | FDAM:告别模糊视界,源自电路理论的即插即用方法让视觉Transformer重获高清细节

不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出
10129 AI技术研报
不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

仅4B!阿里千问最强视觉模型新开源,网友:我的16GB Mac有救了

仅4B!阿里千问最强视觉模型新开源,网友:我的16GB Mac有救了
10941 AI资讯
仅4B!阿里千问最强视觉模型新开源,网友:我的16GB Mac有救了
上一页 当前第15页,共71页 下一页
沪ICP备2023015588号