AI资讯新闻榜单内容搜索-LLM

AITNT
未登录
搜索: LLM

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」,清华牵头搭起大模型安全的下一级阶梯

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」,清华牵头搭起大模型安全的下一级阶梯
9846 AI技术研报
ICML 2025 Oral | 从「浅对齐」到「深思熟虑」,清华牵头搭起大模型安全的下一级阶梯

7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队

7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队
10370 AI技术研报
7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队

Cache Me If You Can:陈丹琦团队如何「抓住」关键缓存,解放LLM内存?

Cache Me If You Can:陈丹琦团队如何「抓住」关键缓存,解放LLM内存?
10287 AI技术研报
Cache Me If You Can:陈丹琦团队如何「抓住」关键缓存,解放LLM内存?

信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始

信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始
9668 AI技术研报
信息过载时代,如何真正「懂」LLM?从MIT分享的50个面试题开始

LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍

LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍
9102 AI技术研报
LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍

性能提升11.74%!腾讯优图提出激励推理,专攻复杂指令

性能提升11.74%!腾讯优图提出激励推理,专攻复杂指令
8430 AI技术研报
性能提升11.74%!腾讯优图提出激励推理,专攻复杂指令

提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交

提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交
8762 AI技术研报
提升大模型内在透明度:无需外部模块实现高效监控与自发安全增强|上海AI Lab & 上交

英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了

英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了
8049 AI技术研报
英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了
9155 AI技术研报
大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南
8212 AI技术研报
从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南
上一页 当前第36页,共143页 下一页
沪ICP备2023015588号