AI技术研报-这里有最前沿的人工智能技术解读

AITNT
未登录

让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准

让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准
7583 AI技术研报
让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准

无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」

无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」
7709 AI技术研报
无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」

ACMMM 2025 | 北大团队提出 InteractMove:3D场景中人与可移动物体交互动作生成新框架

ACMMM 2025 | 北大团队提出 InteractMove:3D场景中人与可移动物体交互动作生成新框架
7323 AI技术研报
ACMMM 2025 | 北大团队提出 InteractMove:3D场景中人与可移动物体交互动作生成新框架

1.58bit不输FP16!微软推出全新模型蒸馏框架,作者全是华人

1.58bit不输FP16!微软推出全新模型蒸馏框架,作者全是华人
6478 AI技术研报
1.58bit不输FP16!微软推出全新模型蒸馏框架,作者全是华人

大模型 “准确率悬崖” 被证实,科学家发现模型单次处理容量上限,多智能体成破局关键

大模型 “准确率悬崖” 被证实,科学家发现模型单次处理容量上限,多智能体成破局关键
8156 AI技术研报
大模型 “准确率悬崖” 被证实,科学家发现模型单次处理容量上限,多智能体成破局关键

AI打通第一/第三人称视觉,跨视角视觉理解新SOTA|ICCV 2025 Highlight

AI打通第一/第三人称视觉,跨视角视觉理解新SOTA|ICCV 2025 Highlight
9529 AI技术研报
AI打通第一/第三人称视觉,跨视角视觉理解新SOTA|ICCV 2025 Highlight

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测
7540 AI技术研报
超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题

教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题
8395 AI技术研报
教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题

是RAG已死,还是RAG Anything,All in RAG?

是RAG已死,还是RAG Anything,All in RAG?
7029 AI技术研报
是RAG已死,还是RAG Anything,All in RAG?

无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)

无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)
9007 AI技术研报
无奖励也能把Agent练硬,Meta发布早期经验学习,隐式建模+反思(附提示词)
上一页 当前第110页,共573页 下一页
沪ICP备2023015588号