AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

全球开发者组团训练,首个异步强化学习32B推理模型震撼来袭!数据已开源

全球开发者组团训练,首个异步强化学习32B推理模型震撼来袭!数据已开源
10715 AI资讯
全球开发者组团训练,首个异步强化学习32B推理模型震撼来袭!数据已开源

Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源

Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源
8519 AI技术研报
Hugging Face论文热榜第一!AI推理新方法,打破强化学习天花板,全面开源

10万+,超大规模人手交互视频数据集!面向可泛化机器人操作|CVPR 2025

10万+,超大规模人手交互视频数据集!面向可泛化机器人操作|CVPR 2025
9118 AI技术研报
10万+,超大规模人手交互视频数据集!面向可泛化机器人操作|CVPR 2025

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互
7529 AI技术研报
具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径

跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径
8585 AI技术研报
跨机型诊断难题新突破:上交大、商飞、东航打造国产大飞机时序大模型智能诊断新路径

ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择
9162 AI技术研报
ICLR 2025 Oral | 训练LLM,不只是多喂数据,PDS框架给出最优控制理论选择

校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要
7608 AI技术研报
校准LLM元认知能力,Agent才能清晰地向用户传达不确定性 | 重要

李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考

李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考
9049 AI技术研报
李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考

MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会

MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会
9408 AI资讯
MSRA首席研究员刘炜清:为每位研究员提供AI科研助理,自动化高门槛、重复性工作|中国AIGC产业峰会

即插即用!清华国科大等推出视觉微调框架,仅需调整5%骨干网络参数 | CVPR2025

即插即用!清华国科大等推出视觉微调框架,仅需调整5%骨干网络参数 | CVPR2025
8613 AI技术研报
即插即用!清华国科大等推出视觉微调框架,仅需调整5%骨干网络参数 | CVPR2025
上一页 当前第237页,共439页 下一页
沪ICP备2023015588号