AI资讯新闻榜单内容搜索-训练

Appfigure：用户2024年为AI付费达14亿美元，教育是关键领域之一

AITNT-国内领先的一站式人工智能新闻资讯网站

搜索: 训练

空间具身通用操作模型！百万真实数据训练，预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

空间具身通用操作模型！百万真实数据训练，预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

5929 AI技术研报

空间具身通用操作模型！百万真实数据训练，预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

显著超越SFT，o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

显著超越SFT，o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

5664 AI技术研报

显著超越SFT，o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

8978 AI技术研报

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

8054 AI技术研报

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

7233 AI技术研报

DeepSeek前实习生魔改MoE，用迭代机制把内存需求砍了42%，团队：“免费午餐”优化方法

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

7430 AI资讯

全面增强LLM推理/规划/执行力！北航提出全新「内置CoT」思考方法

有没有复杂任务自动化的Multi-Agent框架？用Nexus，几行YAML搞定数据清洗

有没有复杂任务自动化的Multi-Agent框架？用Nexus，几行YAML搞定数据清洗

9486 AI技术研报

有没有复杂任务自动化的Multi-Agent框架？用Nexus，几行YAML搞定数据清洗

DeepSeek R1与OpenAI模型文风相似度高达74.2%？新研究质疑DeepSeek训练数据

DeepSeek R1与OpenAI模型文风相似度高达74.2%？新研究质疑DeepSeek训练数据

9941 AI技术研报

DeepSeek R1与OpenAI模型文风相似度高达74.2%？新研究质疑DeepSeek训练数据

性能无损，模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral

性能无损，模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral

10183 AI技术研报

性能无损，模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长序列，来自华为港大等 | 开源

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长序列，来自华为港大等 | 开源

9826 AI技术研报

标点符号成大模型训练神器！KV缓存狂减一半，可处理400万Tokens长序列，来自华为港大等 | 开源

上一页当前第275页,共444页下一页

沪ICP备2023015588号