AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布

Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布
8727 AI技术研报
Llama模仿Diffusion多模态涨分30%!不卷数据不烧卡,只需共享注意力分布

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3
9174 AI技术研报
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

当专业社区遇见DeepSeek最强推理:AI搜索进入「可信思考」时代

当专业社区遇见DeepSeek最强推理:AI搜索进入「可信思考」时代
9627 AI资讯
当专业社区遇见DeepSeek最强推理:AI搜索进入「可信思考」时代

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
6602 AI技术研报
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
7664 AI技术研报
大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成

炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成
9266 AI技术研报
炒菜、雕刻、绘画、汽车人变形!MakeAnything用扩散Transformer解锁多任务过程生成

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制
7297 AI技术研报
DeepSeek R1遇难题142次"I give up",研究还称需增加推理时机控制机制

达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩

达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩
8287 AI技术研报
达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩

超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程

超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程
7229 AI技术研报
超越CoT!微软剑桥中科院提出MVoT,直接可视化多模态推理过程

打破纪录!谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧

打破纪录!谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
7393 AI技术研报
打破纪录!谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
上一页 当前第287页,共446页 下一页
沪ICP备2023015588号