AI技术研报-这里有最前沿的人工智能技术解读

搜索
AI-TNT

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%
6877 AI技术研报
阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压
7950 AI技术研报
全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench

MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench
5571 AI技术研报
MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench

开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险

开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险
8855 AI技术研报
开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险

多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!

多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!
8007 AI技术研报
多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!

强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B

强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B
5754 AI技术研报
强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B

Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o

Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o
5758 AI技术研报
Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o

One RL to See Them All?一个强化学习统一视觉-语言任务!

One RL to See Them All?一个强化学习统一视觉-语言任务!
7994 AI技术研报
One RL to See Them All?一个强化学习统一视觉-语言任务!

阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜

阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜
5753 AI技术研报
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜

让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力

让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力
9037 AI技术研报
让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力
上一页 当前第22页,共370页 下一页
沪ICP备2023015588号