AI技术研报-这里有最前沿的人工智能技术解读

AITNT

开源复现o3图像思考!快手让AI不再被动看图,模型自主生成代码调用工具

开源复现o3图像思考!快手让AI不再被动看图,模型自主生成代码调用工具
7076 AI技术研报
开源复现o3图像思考!快手让AI不再被动看图,模型自主生成代码调用工具

全球大模型季报:“犹太人的金融,华人的AGI”

全球大模型季报:“犹太人的金融,华人的AGI”
6138 AI技术研报
全球大模型季报:“犹太人的金融,华人的AGI”

突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法

突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法
6706 AI技术研报
突破Agent长程推理效率瓶颈!MIT&新加坡国立联合推出强化学习新训练方法

上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型

上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型
6413 AI技术研报
上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型

Sora没做到的,LongVie框架给解决了,超长视频生成SOTA

Sora没做到的,LongVie框架给解决了,超长视频生成SOTA
6235 AI技术研报
Sora没做到的,LongVie框架给解决了,超长视频生成SOTA

dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型
6698 AI技术研报
dLLM的「Free Lunch」!浙大&蚂蚁利用中间结果显著提升扩散语言模型

DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学

DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
6280 AI技术研报
DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学

国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能

国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
5636 AI技术研报
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能

ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测

ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测
5967 AI技术研报
ICCV 2025 | 跨越视觉与语言边界,打开人机交互感知的新篇章:北大团队提出INP-CC模型重塑开放词汇HOI检测

字节Seed开源长线记忆多模态Agent,像人一样能听会看

字节Seed开源长线记忆多模态Agent,像人一样能听会看
5488 AI技术研报
字节Seed开源长线记忆多模态Agent,像人一样能听会看
上一页 当前第14页,共435页 下一页
沪ICP备2023015588号