AI资讯新闻榜单内容搜索-视觉

AITNT
未登录
搜索: 视觉

我的天,全球首个「推理视频模型」Ray3发布!

我的天,全球首个「推理视频模型」Ray3发布!
9998 AI资讯
我的天,全球首个「推理视频模型」Ray3发布!

无需训练的世界模型?西湖大学WorldForge开启空间智能新路径,让AI读懂3D世界

无需训练的世界模型?西湖大学WorldForge开启空间智能新路径,让AI读懂3D世界
7335 AI技术研报
无需训练的世界模型?西湖大学WorldForge开启空间智能新路径,让AI读懂3D世界

a16z投了两个华人560万美金,让AI成为每个人的专属摄影师

a16z投了两个华人560万美金,让AI成为每个人的专属摄影师
8297 AI资讯
a16z投了两个华人560万美金,让AI成为每个人的专属摄影师

全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考

全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考
9336 AI技术研报
全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考

多模态BUG修复新SOTA:慕尼黑工大GUIRepair登上SWE-bench Multimodal榜单第一

多模态BUG修复新SOTA:慕尼黑工大GUIRepair登上SWE-bench Multimodal榜单第一
7848 AI技术研报
多模态BUG修复新SOTA:慕尼黑工大GUIRepair登上SWE-bench Multimodal榜单第一

OpenVision 2:大道至简的生成式预训练视觉编码器

OpenVision 2:大道至简的生成式预训练视觉编码器
6196 AI技术研报
OpenVision 2:大道至简的生成式预训练视觉编码器

20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析
8784 AI资讯
20岁斯坦福辍学生2天搞定500万美元融资:AI直接"偷窥"用户屏幕,重新定义产品分析

2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没
7678 AI资讯
2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没

具身VLA后训练:TeleAI提出潜空间引导的VLA跨本体泛化方法

具身VLA后训练:TeleAI提出潜空间引导的VLA跨本体泛化方法
6929 AI技术研报
具身VLA后训练:TeleAI提出潜空间引导的VLA跨本体泛化方法

空间智能新高度:港科大谭平团队SAIL-Recon突破万帧级图像大规模3D场景重建Transformer

空间智能新高度:港科大谭平团队SAIL-Recon突破万帧级图像大规模3D场景重建Transformer
8291 AI技术研报
空间智能新高度:港科大谭平团队SAIL-Recon突破万帧级图像大规模3D场景重建Transformer
上一页 当前第18页,共71页 下一页
沪ICP备2023015588号