AI资讯新闻榜单内容搜索-训练

AITNT
未登录
搜索: 训练

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二
10951 AI技术研报
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!

OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!
8320 AI技术研报
OTC‑PO重磅发布 | 揭开 o3 神秘面纱,让 Agent 少用工具、多动脑子!

首次系统评估Qwen3在后训练量化下的鲁棒性:8bit下仍保持近乎无损性能

首次系统评估Qwen3在后训练量化下的鲁棒性:8bit下仍保持近乎无损性能
9067 AI技术研报
首次系统评估Qwen3在后训练量化下的鲁棒性:8bit下仍保持近乎无损性能

南加州大学和苹果重磅:用「心理支架」PB&J提升AI角色扮演能力,让Agent更懂用户

南加州大学和苹果重磅:用「心理支架」PB&J提升AI角色扮演能力,让Agent更懂用户
10014 AI技术研报
南加州大学和苹果重磅:用「心理支架」PB&J提升AI角色扮演能力,让Agent更懂用户

ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍

ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍
8115 AI技术研报
ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光
9504 AI技术研报
超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika

VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika
10422 AI技术研报
VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika

如何在LLM「排行榜幻象」中导航?2025AI界震撼大瓜,披露学术造假

如何在LLM「排行榜幻象」中导航?2025AI界震撼大瓜,披露学术造假
9117 AI技术研报
如何在LLM「排行榜幻象」中导航?2025AI界震撼大瓜,披露学术造假

ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键

ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键
8550 AI技术研报
ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键

苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器

苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器
10840 AI技术研报
苹果提出原生多模态Scaling Law!早融合+MoE,性能飙升秘密武器
上一页 当前第231页,共439页 下一页
沪ICP备2023015588号