AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理
9308 AI技术研报
700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查
9577 AI技术研报
管你模型多大,250份有毒文档统统放倒,Anthropic:迄今为止规模最大的大模型数据投毒调查

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限
9554 AI技术研报
又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限

AI「学不会」竟成相变探针!UCSD华人联手谷歌等,曝光量子纠缠秘密

AI「学不会」竟成相变探针!UCSD华人联手谷歌等,曝光量子纠缠秘密
8828 AI技术研报
AI「学不会」竟成相变探针!UCSD华人联手谷歌等,曝光量子纠缠秘密

别卷 Prompt 了,上下文工程正在淘汰你

别卷 Prompt 了,上下文工程正在淘汰你
7863 AI技术研报
别卷 Prompt 了,上下文工程正在淘汰你

开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题

开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题
7254 AI技术研报
开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题

Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮
8576 AI技术研报
Meta的代码生成世界模型CWM,先预测结果再写代码,IDE很快会多一个“预言”按钮

从「知题」到「知人」:UserRL让智能体学会「以人为本」

从「知题」到「知人」:UserRL让智能体学会「以人为本」
9478 AI技术研报
从「知题」到「知人」:UserRL让智能体学会「以人为本」

斯坦福华人研究火了:45分钟让你的论文变身AI智能体!

斯坦福华人研究火了:45分钟让你的论文变身AI智能体!
9779 AI技术研报
斯坦福华人研究火了:45分钟让你的论文变身AI智能体!

清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍

清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍
10627 AI技术研报
清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍
上一页 当前第112页,共433页 下一页
沪ICP备2023015588号