AI资讯新闻榜单内容搜索-训练

下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
搜索: 训练

空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作
5929 AI技术研报
空间具身通用操作模型!百万真实数据训练,预训练代码全开源 | 上海AI Lab/TeleAI/上科大等团队新作

显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了
5664 AI技术研报
显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准
8978 AI技术研报
北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源
8054 AI技术研报
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法

DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法
7233 AI技术研报
DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法

全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法

全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法
7430 AI资讯
全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法

有没有复杂任务自动化的Multi-Agent框架?用Nexus,几行YAML搞定数据清洗

有没有复杂任务自动化的Multi-Agent框架?用Nexus,几行YAML搞定数据清洗
9486 AI技术研报
有没有复杂任务自动化的Multi-Agent框架?用Nexus,几行YAML搞定数据清洗

DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据
9941 AI技术研报
DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral

性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral
10183 AI技术研报
性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral

标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源

标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源
9826 AI技术研报
标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源
上一页 当前第275页,共444页 下一页
沪ICP备2023015588号