AI技术研报-这里有最前沿的人工智能技术解读

AITNT

打破RLHF瓶颈,克服奖励欺骗!Meta发布全新后训练方式CGPO,编程水平直升5%

打破RLHF瓶颈,克服奖励欺骗!Meta发布全新后训练方式CGPO,编程水平直升5%
4244 AI技术研报
打破RLHF瓶颈,克服奖励欺骗!Meta发布全新后训练方式CGPO,编程水平直升5%

吞吐量最高飙升20倍!豆包大模型团队开源RLHF框架,破解强化学习训练部署难题

吞吐量最高飙升20倍!豆包大模型团队开源RLHF框架,破解强化学习训练部署难题
5040 AI技术研报
吞吐量最高飙升20倍!豆包大模型团队开源RLHF框架,破解强化学习训练部署难题

NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%

NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%
8075 AI技术研报
NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%

强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法

强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法
8259 AI技术研报
强化学习之父Richard Sutton给出一个简单思路,大幅增强所有RL算法

Unbounded:来自Google的AI驱动角色模拟无限游戏

Unbounded:来自Google的AI驱动角色模拟无限游戏
8923 AI技术研报
Unbounded:来自Google的AI驱动角色模拟无限游戏

Ferret-UI 2:苹果最新跨平台通用GUI理解多模态大模型

Ferret-UI 2:苹果最新跨平台通用GUI理解多模态大模型
8198 AI技术研报
Ferret-UI 2:苹果最新跨平台通用GUI理解多模态大模型

Agent-to-Sim:从日常视频学习并模拟三维代理的交互行为

Agent-to-Sim:从日常视频学习并模拟三维代理的交互行为
6122 AI技术研报
Agent-to-Sim:从日常视频学习并模拟三维代理的交互行为

OmniParser:微软重磅打造的提升GUI代理性能的屏幕解析利器

OmniParser:微软重磅打造的提升GUI代理性能的屏幕解析利器
6726 AI技术研报
OmniParser:微软重磅打造的提升GUI代理性能的屏幕解析利器

利用大模型构建个性化虚拟学生代理:SOE框架的多维度评估研究

利用大模型构建个性化虚拟学生代理:SOE框架的多维度评估研究
8121 AI技术研报
利用大模型构建个性化虚拟学生代理:SOE框架的多维度评估研究

OpenAI最新研究:「打假高手」大模型事实性基准SimpleQA来了,已开源

OpenAI最新研究:「打假高手」大模型事实性基准SimpleQA来了,已开源
6456 AI技术研报
OpenAI最新研究:「打假高手」大模型事实性基准SimpleQA来了,已开源
上一页 当前第374页,共556页 下一页
沪ICP备2023015588号