AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒

告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒
9747 AI资讯
告别卡脖子,华为黑科技破局!昇腾推理加速1.6倍打破LLM降智魔咒

大模型玩不好数独?!Transformer作者初创公司公布排行榜:o3 Mini High“变异数独”正确率仅2.9%

大模型玩不好数独?!Transformer作者初创公司公布排行榜:o3 Mini High“变异数独”正确率仅2.9%
10788 AI资讯
大模型玩不好数独?!Transformer作者初创公司公布排行榜:o3 Mini High“变异数独”正确率仅2.9%

港科大Apple新研究:Tokens使用量减少,模型推理还更强了

港科大Apple新研究:Tokens使用量减少,模型推理还更强了
8455 AI技术研报
港科大Apple新研究:Tokens使用量减少,模型推理还更强了

一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择

一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择
5564 AI技术研报
一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择

动态数据太折磨人!静态RAG搞不定,就试下ZEP,让Agent调用实时知识图谱。

动态数据太折磨人!静态RAG搞不定,就试下ZEP,让Agent调用实时知识图谱。
7596 AI技术研报
动态数据太折磨人!静态RAG搞不定,就试下ZEP,让Agent调用实时知识图谱。

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%
8694 AI技术研报
阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%

MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench

MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench
7729 AI技术研报
MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench

开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险

开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险
10266 AI技术研报
开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险

多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!

多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!
9911 AI技术研报
多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!

强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B

强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B
7632 AI技术研报
强化学习解决长上下文推理问题:通义推出QwenLong-L1-32B
上一页 当前第217页,共438页 下一页
沪ICP备2023015588号