大家好,我是歸藏(guizang)谷歌昨晚举行了他们的 2025 年硬件发布会,早上起来回顾和总结一下。
虽然之前预想到了会有很多的 AI 能力,但是没想到会这么多这么激进,其中很多硬件和 AI 结合的相当好。
想买 Pixel 手机了,这玩意现在基本上可以说是 AI 手机,里面一堆端侧的 LLM 和扩散模型。
来详细看一下这次发布会上的所有 AI 软件和硬件能力。
Gemini 构建的全新 AI 驱动个人健康教练,这个太好了,AI 驱动的健身和健康计划:
苹果真是浪费了 Apple watch 的数据,但是好歹这玩意是APP 可以获取的。我不知道为啥到现在都没有 AI 辅助数据分析和训练的优质 APP 出现 多好的机会啊。
通过自然语言编辑拍摄的照片:这个功能也很好,只需要打字或者语音就可以让相册里的 Gemini 帮你编辑照片,Nano Banana 是不是用在这里了。
除了像调整光线和去除干扰等修正性编辑之外,你还可以寻求更具创意的帮助。例如,你可以更改图片背景,给主体添加派对帽或太阳镜等有趣元素,等等。
Gemini 驱动的拍照教练:不止帮你修图还帮你拍照,通过激发新的创意并帮助你探索可能未曾考虑过的构图,指导你拍出更好的照片。通过逐步引导,它会就光线、构图等方面提供建议。
Pixel 10 Pro 和 Pixel 10 Pro XL 上相机的数码变焦范围可以到 100 倍,他们专门用了一个本地的扩散模型来对放大后的照片进行细节补充。
即将推出 Gemini 驱动的智能大屏设备 Gemini for Home,具体的能力有:
所有 Pixel 10 手机均搭载 Google Tensor G5 芯片,可以本地运行 Gemini Nano 模型。
不过谷歌坚持不用公版 ARM 架构,导致这次的芯片性能增幅有点拉跨,GPU IP 来自 Imagination 不支持光追。
Magic Cue 功能:支持将所有谷歌应用的信息串联起来,在合适的地方建议你一键分享,比如在 Messages 应用中。
Voice Translate :会利用端侧模型实时翻译通话内容,而且会模仿对方的说话音色,,更加自然,目前不支持翻译中文。
Call Screen:Take a Message 现在会为错过或拒接的来电提供实时转录,AI 根据留言为你识别和弹出建议的下一步操作,留言和转录内容会放在通话笔记中。
Gemini Live 更新:摄像头共享的时候 Gemini 会根据需求框选出需要高亮的摄像头中的物品,Gemini APP 现在支持用 Veo3 生成视频。
NotebookLM 跟 Pixel 截图应用和录音应用整合:如果检测到你拍摄的图片或者录音可能适合加入笔记本,就会建议你添加收藏到NotebookLM。
新的笔记应用 Pixel Journal:帮助你记录身心健康、目标进展,并建立终身的反思习惯。设备端 AI 会提供写作提示,帮助你理清思路,并随时间为你提供有关模式和进展的洞见。
录音机应用里面可以帮你生成音乐:只需录制你的哼唱的声音并选择想要的音乐风格,就能创建与自己氛围相符的独特曲目。
新的手表 Pixel Watch 4 现在有 Gemini 驱动的健身教练能力,AI 真的非常适合干这个,我就用 GPT-5 分析自己运动数据。它提供主动的健身与睡眠指导以及按需建议,基于来自你的 Pixel Watch 的指标。通过“抬腕交谈”,只需抬起手腕就能唤出 Gemini,跟他交流。
发布 AI 耳机 Pixel Buds Pro 2:耳机内置 Tensor A1 和 Gemini,可以在嘈杂环境中与 Gemini Live 通话。会自动根据环境调整耳机音量或者开启降噪。可以不动手就接听来电,或拒绝回复短信。只需点头或摇头即可。
看完了所有的内容,总结一下谷歌硬件发布会代表的几个趋势:
谷歌过去一年在所有模型上的成果这次基本都反哺在了硬件上,反观苹果呢,依然在执着的推出 2900 毫安时电池的超薄 iPhone,这电量不知道够不够半天用。
文章来自于微信公众号“歸藏的AI工具箱”。