AI资讯新闻榜单内容搜索-LLM

AITNT
未登录
搜索: LLM

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解
7881 AI技术研报
ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解

ACL 2025|自我怀疑还是自我纠正?清华团队揭示LLMs反思技术的暗面

ACL 2025|自我怀疑还是自我纠正?清华团队揭示LLMs反思技术的暗面
7881 AI技术研报
ACL 2025|自我怀疑还是自我纠正?清华团队揭示LLMs反思技术的暗面

密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25

密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25
8796 AI资讯
密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板丨清华ICCV25

告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜

告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜
8704 AI技术研报
告别数据「噪音」,UCSD大模型推理新方法DreamPRM充当「信号放大器」,登顶MathVista测评榜

全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四
8580 AI技术研报
全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench

打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench
9799 AI技术研报
打破大模型编程「数据污染」与「能力虚胖」困境,Meituan-M17团队构建新一代AI编程评测新标准——OIBench

LLM「拒绝回答」难题有救了!最新研究让AI学会人情世故 | COLM'25

LLM「拒绝回答」难题有救了!最新研究让AI学会人情世故 | COLM'25
9216 AI技术研报
LLM「拒绝回答」难题有救了!最新研究让AI学会人情世故 | COLM'25

真实科研水平集体不及格!全新基准SFE给主流多模态LLM来了波暴击

真实科研水平集体不及格!全新基准SFE给主流多模态LLM来了波暴击
10423 AI技术研报
真实科研水平集体不及格!全新基准SFE给主流多模态LLM来了波暴击

复杂Agent怎么设计?IBM用一个YAML,性能提升4倍| ICML 2025

复杂Agent怎么设计?IBM用一个YAML,性能提升4倍| ICML 2025
9420 AI技术研报
复杂Agent怎么设计?IBM用一个YAML,性能提升4倍| ICML 2025

大模型「越用越快」!SpeedupLLM首次验证,大降56%推理预算

大模型「越用越快」!SpeedupLLM首次验证,大降56%推理预算
6256 AI技术研报
大模型「越用越快」!SpeedupLLM首次验证,大降56%推理预算
上一页 当前第32页,共143页 下一页
沪ICP备2023015588号