AI资讯新闻榜单内容搜索-训练

AITNT
搜索: 训练

LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法
6179 AI资讯
LLM幻觉第一次被定义:你必须掌握的3个理论和能上手的4套工程解法

写在GPT-5风波之后:为什么AI的智商和情商不可兼得?

写在GPT-5风波之后:为什么AI的智商和情商不可兼得?
5544 AI资讯
写在GPT-5风波之后:为什么AI的智商和情商不可兼得?

告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生
6198 AI技术研报
告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

华人团队终结Token危机:扩散模型数据潜力超自回归三倍

华人团队终结Token危机:扩散模型数据潜力超自回归三倍
6932 AI资讯
华人团队终结Token危机:扩散模型数据潜力超自回归三倍

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了
5244 AI资讯
OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了

AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界
5252 AI技术研报
AI顶会模式出了问题? 「不发表,就出局」的恶性循环,正在压垮整个AI学界

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现
6554 AI技术研报
研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界
6163 AI资讯
o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销

大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销
5816 AI资讯
大模型训练新突破!“不对称”训练让AI学会自我反思,推理零开销

大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO

大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO
5412 AI技术研报
大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO
上一页 当前第11页,共296页 下一页
沪ICP备2023015588号