AI资讯新闻榜单内容搜索-训练

AITNT
搜索: 训练

大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
7419 AI技术研报
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
5873 AI资讯
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

两张图就能重构3D空间?清华&NTU利用生成模型解锁空间智能新范式

两张图就能重构3D空间?清华&NTU利用生成模型解锁空间智能新范式
6720 AI技术研报
两张图就能重构3D空间?清华&NTU利用生成模型解锁空间智能新范式

突破全模态AI理解边界:HumanOmniV2引入上下文强化学习,赋能全模态模型“意图”推理新高度

突破全模态AI理解边界:HumanOmniV2引入上下文强化学习,赋能全模态模型“意图”推理新高度
7491 AI技术研报
突破全模态AI理解边界:HumanOmniV2引入上下文强化学习,赋能全模态模型“意图”推理新高度

长思维链里的推理步骤,哪些最关键?三招锁定LLM的「命门句子」

长思维链里的推理步骤,哪些最关键?三招锁定LLM的「命门句子」
5792 AI技术研报
长思维链里的推理步骤,哪些最关键?三招锁定LLM的「命门句子」

基于能量的Transformer横空出世!全面超越主流模型35%

基于能量的Transformer横空出世!全面超越主流模型35%
8253 AI技术研报
基于能量的Transformer横空出世!全面超越主流模型35%

DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%

DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%
4830 AI技术研报
DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%

多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略

多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
6313 AI技术研报
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略

第一性原理的Context Engineering工具、指南

第一性原理的Context Engineering工具、指南
6623 AI资讯
第一性原理的Context Engineering工具、指南

AI“撕裂”版权法:Meta与Anthropic迎来不同判决

AI“撕裂”版权法:Meta与Anthropic迎来不同判决
8447 AI监管政策
AI“撕裂”版权法:Meta与Anthropic迎来不同判决
上一页 当前第48页,共307页 下一页
沪ICP备2023015588号