OpenAI的模型搞得太多太凌乱,官方自己都看不下去了。
为了厘清这些模型还有它们的各种版本,官方直接给做它们了一套“身份卡”。
每个模型“身份卡”都包含了能力、速度、支持模态、价格等信息,并且以图示+简单文本的形式呈现,既简洁又清晰。
而且还上线了对比功能,可以一次对比三个模型,直观比较之间各项指标的差异。
但还是有网友觉得太复杂,希望能让Deep Research给自己整理一个“太长不看”版本。
发布模型“身份卡”的同时,OpenAI也对自家还在提供API服务的模型进行了一波分门别类,做了一个索引。
首先是我们更熟悉的推理模型系列和GPT家族,其中也包括各种衍生版本和较古老的GPT-3.5 Turbo等模型。
之后是绘图模型DALL·E、语音合成模型TTS、语音识别模型Whisper,以及一些嵌入模型。
此外还有用于安全检测的微调模型,以及未经过指令遵循训练的基础模型。
以o1为例,页面先是展示了它的推理能力和速度、价格以及支持的输入/输出模态这些关键信息。
并且还提供了与类似的o1-mini和o3-mini的价格对比。
再往下翻则是一些细节功能和特征,用颜色深浅来代表是否支持。
最后还展示了关于模型版本和用量限制的信息。
针对部分模型(比如GPT-4o),还提供了提示词示例。
有了这样一套“身份卡”和比较系统,开发者可以更清晰地了解每种模型的特点、功能,从而在开发的时候综合考虑能力、成本等因素,做出更合适的选择。
不过这些身份卡针对的都是API,也就意味着主要面向开发者,而至于个人用户……
虽然不像API那样模型下面还有许多子版本,但对于个人用户而言,各种模型的选择同样是一个复杂的事。
还好有高手在民间,AI博主Peter Gostev综合文档、实测和讨论交流后,对ChatGPT中不同模型的功能进行了详细梳理,浓缩成了一个表格。
不同模型的功能,以及不同等级用户的可用量,都一目了然。
对Peter的这份总结,有人称赞这让在凌乱的OpenAI模型中做出选择变得更容易。
不过也有网友指出,这类表格最大的问题是很容易过时。
比如Peter的这份总结发布其实才不到一周,但当时还不支持数据分析的Deep Research现在已经支持了。
下面的回复称,之所以还需要这样的表格,是因为我们还停留在生成式AI的功能机时代,亟需有人将其带入iPhone时刻。
不过还好OpenAI这边,已经开始往这个方向上努力了。
上个月,奥特曼在介绍GPT-4.5和GPT-5的推文中表示,自己和用户们一样讨厌模型选择器。
他表示,到GPT-5发布时,包括o3在内的功能都将集中到一个统一模型当中,而不再单独发布,这一方式将同时适用于ChatGPT和API。
至于最终的整合版本表现怎样,这中间的过度又是否平稳,压力就给到OpenAI了。
参考链接:
[1]https://platform.openai.com/docs/models
[2]https://www.linkedin.com/posts/peter-gostev_chatgpts-ecosystem-is-quite-complex-so-activity-7302830959681261571-j7Ev/
文章来自于“量子位”,作者“克雷西”。
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales