在Google I/O(谷歌开发者大会)前夕,谷歌全球安卓团队的核心成员们,提前组织了一场全球媒体沟通会,剧透了安卓系统的未来新动向。科技行者TechWalker受邀参加了此次活动。
此次谷歌发布的核心,可以总结为三部分——操作系统设计、AI、安全:
1、Material 3 Expressive:安卓手机、手表等设备的操作系统(Android 16和Wear OS 6),很快会迎来一套全新的设计风格,叫做 Material 3 Expressive,它的界面会更生动、更个性化、甚至更人性化。
2、谷歌的王牌AI大模型——Gemini,会被整合到安卓的各种设备里,包括手机、Wear OS手表、汽车、电视、XR等,目标是让AI助手无处不在,帮你搞定各种事情。
3、安全:在这些酷炫的新功能背后,安卓系统还会通过更聪明的欺诈检测技术和更强大的设备查找功能「Find Hub」,给用户的数据和设备安全加上一把“大锁”。
沟通会现场,科技行者TechWalker 提问说:“谷歌要把Gemini这样强大的AI装到手表、汽车这些计算能力没那么强的设备上,怎么解决本地算力不够,但又要保证AI体验好?”
安卓平台副总裁兼总经理Seang Chau对此回答:
首先,不是所有的AI功能都要运行那么庞大复杂的大语言模型,很多智能体验可以用一些更小、更快的模型来实现,比如 BERT 模型或者其他轻量级的机器学习模型。
其次,对于那些实在跑不动大语言模型(比如 Gemini Nano 或者 Llama)的设备,谷歌也不会硬要在它们的普通处理器(CPU或GPU)上运行这些模型,而是会尽量利用设备上专门为AI设计的、既强大又省电的芯片(NPU和TPU),只要电池和内存允许,就能在这些专用芯片上跑大模型。
第三,谷歌一直在努力开发更好、更强大、但体积更小的AI模型,这些新模型会运行得更快,处理信息(token)的效率也更高。这样一来,就算设备没有顶级的AI芯片,也能流畅地运行这些优化过的小型高效模型。
还有一个大家普遍关心的问题是,“现在消费者对手机里的AI功能好像还没那么感冒,用得也不多,还在摸索这些功能到底有啥用,谷歌是不是想先把AI植入到操作系统里,让大家习惯用这些AI工具,然后再去考虑怎么商业化、怎么让更多开发者参与进来?”
Seang Chau 回答说,这个问题他以前也说过,团队的看法是:如果AI能主动展现能力,那大家用起来会更顺手,但现在的AI很大程度上仍是一个“被动程序”——用户先打开某个App,找到那个AI按钮,再点一下才能激活AI助手。“我们相信,未来如果AI能融入到用户平时的操作中,用户不用特意中断自己的操作,它就能在不知不觉中辅助用户,这样对用户来说会更有用,也更容易让大家知道AI能干什么,用起来也更方便。”Seang Chau 进一步说道,这种让AI“润物细无声”地融入日常,能让更多人愿意用AI。
另一个近期很受关注的问题是关于AI Agents(AI Agents)的:“由于现在向AI代理发展,手机里的各种App以后还有用吗?”Seang Chau认为:“App肯定还是有用的,至少短期内是这样。” 很多时候,我们通过App直接操作比问AI代理要快得多,而且现在的AI代理也未必掌握足够的信息来执行所有指令。他接着说:“这种情况未来可能会变,但具体什么时候变革,我们也不知道。不过,谷歌非常重视开发者社区和OEM生态,他们对整个移动生态系统非常重要。”
此外,考虑到全球有那么多不同品牌、不同型号的安卓设备,有人担心谷歌发布的新功能怎么才能保证在各种设备上都能及时用上?Seang Chau回答说,谷歌和所有的OEM、SLC都合作紧密,比如几个月前谷歌宣布和高通合作,可以为设备提供长达7年的更新支持。他强调:“我们会继续和设备制造商、芯片公司以及其他合作伙伴一起努力,确保不管是AI新功能还是安卓系统更新,都能尽快送到用户手上。”
Seang Chau还特别强调,安卓系统在全球拥有超过30亿的活跃设备、覆盖190多个国家。Seang Chau就拿咱们平时发信息这事儿举例子:不管你用的是啥牌子的手机,跟亲戚朋友发信息都应该很顺畅,能轻松发高清照片和视频。为了解决这个问题,安卓团队一直在推动RCS(Rich Communication Services,富媒体通信服务)成为安卓与iOS之间的消息传递标准。他还透露了一个数据:“仅在美国,现在每天通过RCS发的消息就超过了10亿条。”这事儿要是做成了,以后大家用不同手机发信息就方便多了。
一开场,安卓平台副总裁Mindy Brooks就指出,安卓系统要迎来一次重要的设计大变样,在细说之前,她先回顾了谷歌“Material Design”的演进。
简单说,Material Design作为谷歌的开源设计系统,目的是让各种App和系统界面既好看又好用。她特别提到了2021年推出的“Material You”,称它为“设计上的一大飞跃”,因为它能让手机界面根据壁纸自动变色,让手机看起来非常个性化。
而今年,安卓的设计又要升级了!Mindy正式推出了“Material You”的延伸——Material 3 Expressive:“Material 3 Expressive在原来的基础上加了些新花样和新功能,目标是让用户界面更有感情——用起来体验更好、更有意思、也更顺手,并在关键交互中创造更多乐趣。”
为了让我们更直观地感受这种变化,Mindy展示了一些例子:
Mindy进一步阐述,Material 3 Expressive 就是想让安卓系统更好地满足用户个性化需求,方法就是用新的颜色主题、响应式组件和强调型排版来实现。她还透露,这些只是改进的一小部分,“从更精致的主屏幕(让新的小插件和图标都能完美对齐),到可定制的快捷设置(你可以把自己最常用的控件都放进去),设计上的改进还有很多!” 同时团队也确保,这些新设计不会影响手机性能,也不会影响电池续航。这些设计元素不光系统界面会用,用户平时用的谷歌App,像Google Fitbit、相册和Gmail,也都会用上。
安卓系统Material 3 Expressive的主题配色偏活力风格
“好看”和“好用”的结合,在Material 3 Expressive中也得到了充分体现,尤其是让你“一眼就能看到重要信息”这方面。Mindy介绍了一个叫“Live Updates(实时更新)”的新功能,它能突出显示你想了解的关键信息,让你不用分心,专心做自己的事。
举个例子,我们肯定都遇到过这种情况,比如你叫了个外卖,同时又在跟朋友聊天。有了Live Updates(实时更新),你扫一眼就知道外卖到哪儿了,不会打断你的聊天。像外卖、打车、导航这些App的实时信息,会作为这次新设计的一部分,在今年晚些时候推出。
当然了,Material 3 Expressive不止会在手机上更新,在手表上也会更新。
Mindy Brooks介绍了手表系统Wear OS 6的新变化:
Mindy说,这些变化会彻底改变用户与手表互动的方式,这些新功能会在今年晚些时候,随着安卓16和Wear OS 6先在谷歌Pixel设备上亮相。
不难看出,这次Material 3 Expressive的一个主打词是——情感,到底怎么让操作系统有情感?我们有必要深挖一下。留意到谷歌设计团队在一篇题为《更好、更轻松、更富情感的UX:谷歌设计新方向背后的研究(Better, Easier, Emotional UX)》的博客文章中,揭秘了Material 3 Expressive的诞生历程和核心价值。
这篇文章开宗明义地指出,Material 3 Expressive是谷歌设计系统有史以来研究得最透彻的一次更新。这事儿是怎么开始的呢?
话说在2022年,谷歌的一位实习生在德国慕尼黑的一个啤酒馆里和同事聊天,他当时正在调研大家对谷歌App里“Material Design”设计有什么感觉。聊着聊着,就引发了一个全团队的设计辩论:“为啥咱们的App看起来都一个样?那么‘板正’,甚至有点‘无聊’?难道就不能让它们看起来更有意思、更能打动人吗?”
为了解决这个问题,他们下了大功夫:
那么,到底啥是“富有表现力的设计”(Expressive Design)?谷歌将其定义为“让你有所感受的设计,它激发情感、传达功能、并帮助用户实现目标。”
谷歌是怎么研究的呢?为了确保新设计好看且好用,团队用了各种方法:
研究首先从小事入手,但处处用心:
研究的核心发现,还是有点东西的:
1、大家更喜欢“表达性设计”:研究发现,跟那些比较“朴素”(比如遵循iOS设计指南)的设计比起来,这种精心设计的“表达性设计”受到所有年龄段人群的强烈喜爱,特别是18到24岁的年轻人,喜欢它的比例高达87%!
2、“表达性设计”引发积极情感:Material 3 Expressive的设计,在让人感觉“有活力”、“情感丰富”、“氛围积极”、“有创意”、“好玩”和“友好”这些方面,得分远远超过传统设计。
M3 Expressive 设计在 “充满活力”、“情感丰富”、“积极氛围”、“创意”、“俏皮 ”和 “友好” 等属性方面的评分更高
3、“表达性设计”提升品牌感知:研究借鉴了Caleb Warren等人(2019)关于“产品为何能成为潮流”的研究,发现Material 3 Expressive的设计在“亚文化感知”(subculture perception,表明品牌更潮、更懂行)方面提升了32%,在“现代性”(modernity,表示品牌更新潮、前瞻)方面提升了34%,在“叛逆性”(rebelliousness,暗示品牌更大胆、更爱创新、敢于打破常规)方面提升了30%。
4、“表达性设计”用起来更方便:这可能是最重要的发现。通过眼动追踪实验,用户在Material 3 Expressive版本里找到关键按钮或功能的速度,比以前快4倍。
图左,使用标准顶部应用栏中的 Send (发送)按钮向应用发送电子邮件。图右,通过放大和突出 Send 按钮,用户能够以4倍的速度发现按钮。
例如在邮件App里,新版本把“发送”按钮做得更大,放在键盘正上方,还用了醒目的颜色,结果用户找到它的速度比上一代版本快了4倍。更棒的是,这种设计好像还“拉近”了不同年龄用户之间的差距,帮助45岁以上的用户在找App方面,表现得和年轻人一样好。而且,对于有不同运动或视觉障碍的用户来说,这种设计也被证明更好看、更直观、更容易上手。
不过,研究也提醒我们,这种设计不是万能药:
谷歌官宣了安卓系统在视觉设计上的革新之后,话题自然而然地转向了AI方面的革新。
安卓平台经理Rohan Shah上台说:“安卓的一大优势是,Gemini成为了安卓系统的核心,现在全球手机用户都能用Gemini做很多事。”他特别提到了Gemini Live功能,说“这是个超棒的功能,能自然融入你的日常生活,且不需要付费订阅就能用。”他透露下周在美国举行的谷歌开发者大会,团队会展示更多例子,比如Gemini Live怎么通过手机摄像头和屏幕共享,实时指导你完成各种任务。
随后,安卓产品管理与用户体验高级总监Guemmy Kim开门见山地说:“除了手机上的改进,谷歌正在把Gemini扩展到你所有的设备上,让它成为一个真正聪明又乐于助人的助手。无论你在跑步、开车、还是躺在沙发上,你的助手都随时准备帮忙。”
Guemmy详细介绍了Gemini将要登陆的平台:
1、智能手表:未来几个月内,Gemini将登陆Wear OS智能手表。当你手机不方便拿的时候特别有用,比如手上沾满面粉在做饭、匆忙赶路、或骑自行车时,你可以跟Gemini对话,不用想着怎么措辞或在小屏幕上费劲打字。再比如,在健身房可以直接对手表说:“记住我用的是43号储物柜。”因为Gemini能连接你的应用,你还可以直接在手表上问朋友,邮件里提到的餐厅在哪,不用停下锻炼或掏出手机。
2、车载系统:免提语音控制一直是车载系统的核心。很快,Gemini将通过自然对话升级这一体验。Gemini还能连接你的应用,比如你可以说:“我想找个适合孩子、麸质过敏友好的四星评分餐厅。”它会连接地图、查菜单、看评论、然后推荐最佳选择,它甚至能连接你的短信应用,总结收到的消息,还能在发送前翻译成另一种语言。
对经常开车的人来说,Gemini Live可以成为一个好伙伴,比如上班路上,让它播报不含体育的新闻,或去读书会路上快速了解刚读完的书。Gemini将在未来几个月内登陆Android Auto,随后会登陆内置谷歌服务的汽车。
3、电视:正如今年1月份谷歌在CES上宣布的,Gemini功能将于今年晚些时候登陆电视。通过Google TV上的Gemini,你可以要求推荐适合孩子年龄的动作片。除了娱乐,它还能帮孩子探索问题,比如关于太阳系的疑问,并找出合适的YouTube视频来加深学习。
4、虚拟现实设备:最后,Gemini还将与安卓最新的XR平台,这是谷歌与三星合作开发的。Gemini将为下一代头显、眼镜等设备带来全新交互方式。当三星的首款头显今年晚些时候推出时,Gemini可以帮你规划假期,通过环绕式视频、地图和当地提示,几分钟内创建完整行程,让你对目的地有更真实的感受。
Guemmy Kim总结说:“在所有这些新设备上,Gemini都将带来个性化和智能的帮助,无论你在哪里,无论你用什么安卓设备。”这还包括索尼和三星的耳机产品,进一步扩大了Gemini的覆盖范围,目标是提供随时随地的、强大的、主动的帮助。
接下来,安卓平台高级产品经理Stella Loh谈到了大家最关心的安全和隐私话题。她说:“安卓系统一直在升级,就是为了保护你免受各种麻烦,不管是诈骗短信、丢失物品、还是其他复杂的安全问题。”Stella自豪地引用了一项最近的研究结果:“安卓智能手机在内置安全功能和反欺诈效能方面得分最高。”
去年GoogleI /O大会上,谷歌为Pixel手机推出了AI防诈骗电话功能——Scam Detection for calls,现在这个功能已经扩展到所有用Google Messages的安卓手机上了。Stella透露:“Google Messages用户每月帮用户拦截几十亿条可疑短信。”更重要的是,谷歌的AI系统会越来越聪明,能识别出更多新型诈骗,比如过路费诈骗、假冒金融机构、礼品卡诈骗等。重点是,所有检测都是在你自己手机上完成的,完全保护你的隐私。
谷歌不仅关心用户的数字安全,还保护用户的实体财物。原来的“查找我的设备(Find My Device)”功能现在升级成了更强大的“Find Hub”。Stella解释说:“用Find Hub,你可以一站式找到你的设备,或者是贴了标签的物品,查看家人是否安全到家,或者晚上出门时分享你的位置。”
安卓生态最大的特点就是选择多样,Find Hub也有越来越多的合作伙伴。Stella举了几个例子:“无论是July和Mokobara内置的行李查找功能,Peak的滑雪板跟踪器,还是Pixbee推出的迪士尼主题蓝牙标签,总有一款适合你。”Stella还预告:“5月份,谷歌还将通过支持超宽带(UWB)的标签,让你能更精确地找到近距离的物品,率先在moto tag上推出。今年晚些时候,Find Hub还将支持卫星连接,这样即使没有手机信号,你也能和亲友保持联系。”
最后,Stella总结说:“安卓在安全保障方面的创新,是我们最引以为豪的成就之一。”
最后,我们总结一下谷歌的这次发布。某种程度上,这不光是操作系统的一次更新,也可以看作是安卓平台的一种进化。原因有三:
1、端的多样性。以前我们聊安卓,可能还是聚焦在手机这个“一亩三分地”,但现在明显能感觉到,谷歌的目标是要把安卓打造成一个真正意义上的“万物互联操作系统”,手机、手表、平板、电视、汽车、XR等以安卓为核心,形成数据和服务无缝流转。
2、外在的表现性。这里说的自然是Material 3 Expressive,这不只是换个皮肤那么简单,比如“流体”、“弹簧”、“模糊”、“色彩主题”的组合拳,听着就让人觉得手里的安卓设备要“活”过来了。以前我们总说iOS设计精致,安卓相对粗犷,现在看来,安卓这是要彻底撕掉这个标签,不仅要精致,还要“有情感”、“会表达”。
3、内在的智能性。再说说Gemini,这AI助手是想要“上天入地无所不能”。从手表上帮你记储物柜号码,到车里帮你规划带充电桩的路线顺便找个公园遛弯,再到电视上给娃找科普视频,甚至在XR里帮你做旅游攻略……这简直是要进化成一个贴身的“数字管家+万事通”。当然,理想很丰满,现实中AI的“智商”和“情商”能不能跟上,会不会出现“鸡同鸭讲”的尴尬,还得等实际体验出来再说。
如果一言以蔽之,谷歌的目标就是,以后你所有的智能设备,不管是手机、手表还是车,都能用同一个安卓系统和Gemini连起来。同时,它又希望每一个设备都特别懂你,能猜到你需要什么,主动帮你做好,甚至让你用起来特别开心。
这听起来好像有点矛盾,又要统一,又要个性,但或许这就是未来操作系统和AI的底层逻辑:既能管所有事,又特别会照顾你的感受,就像一个无所不能又超级贴心的数字好朋友。
文章来自于“科技行者”,作者“周雅”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md