AI资讯新闻榜单内容搜索-LLM

AITNT
未登录
搜索: LLM

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
8498 AI技术研报
超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场

多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合

多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合
8682 AI技术研报
多模态训练后模型能力雪崩,上海AI Lab全面探索MLLM偏好对齐与模态融合

长文本向量模型在4K Tokens 之外形同盲区?

长文本向量模型在4K Tokens 之外形同盲区?
5817 AI技术研报
长文本向量模型在4K Tokens 之外形同盲区?

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools
7614 AI技术研报
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

填补空白!首个提升大模型工作流编排能力的大规模数据集开源

填补空白!首个提升大模型工作流编排能力的大规模数据集开源
10310 AI技术研报
填补空白!首个提升大模型工作流编排能力的大规模数据集开源

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错
9984 AI技术研报
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现
7706 AI技术研报
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI

阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI
8865 AI技术研报
阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI

人工智能代理不是玩具,而是工人|必须像评估劳动力一样评估AI代理

人工智能代理不是玩具,而是工人|必须像评估劳动力一样评估AI代理
7254 AI技术研报
人工智能代理不是玩具,而是工人|必须像评估劳动力一样评估AI代理

可自定义的推理框架SoT-Agent,通过小路由模型自适应推理,更灵活,更经济 | 最新

可自定义的推理框架SoT-Agent,通过小路由模型自适应推理,更灵活,更经济 | 最新
7631 AI技术研报
可自定义的推理框架SoT-Agent,通过小路由模型自适应推理,更灵活,更经济 | 最新
上一页 当前第56页,共144页 下一页
沪ICP备2023015588号