AI资讯新闻榜单内容搜索-训练

AITNT
搜索: 训练

只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral

只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral
6622 AI技术研报
只需一次指令微调,大模型变身全能专家天团,8B模型性能反超全微调基线 | ACL25 Oral

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025
5756 AI技术研报
抗干扰能力提升近40% !无需对抗训练,北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考
8665 AI技术研报
超越RAG的搜索革命!分层框架让AI像专家团队一样深度思考

上下文灾难有救了,Claude Sub-Agent的隐藏功能,99%的开发者还没发现

上下文灾难有救了,Claude Sub-Agent的隐藏功能,99%的开发者还没发现
7663 AI技术研报
上下文灾难有救了,Claude Sub-Agent的隐藏功能,99%的开发者还没发现

Nature子刊 | 上交突破极限,端到端无人机高速避障,可微分物理实现

Nature子刊 | 上交突破极限,端到端无人机高速避障,可微分物理实现
7245 AI技术研报
Nature子刊 | 上交突破极限,端到端无人机高速避障,可微分物理实现

大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab

大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab
7983 AI技术研报
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab

你的AI管家可能正在「拆家」?最新研究揭秘家⽤具⾝智能体的安全漏洞

你的AI管家可能正在「拆家」?最新研究揭秘家⽤具⾝智能体的安全漏洞
7729 AI技术研报
你的AI管家可能正在「拆家」?最新研究揭秘家⽤具⾝智能体的安全漏洞

ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?

ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?
6290 AI技术研报
ACL 2025|驱动LLM强大的过程级奖励模型(PRMs)正遭遇「信任危机」?

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练
5567 AI技术研报
首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

AI会谄媚用户的原因,竟然是不够“普信”

AI会谄媚用户的原因,竟然是不够“普信”
5569 AI资讯
AI会谄媚用户的原因,竟然是不够“普信”
上一页 当前第31页,共305页 下一页
沪ICP备2023015588号