距离苹果全球开发者大会(WWDC)还有20天,OpenAI 宣布了自其成立以来最大规模的收购案——以全股票交易的形式收购了苹果前首席设计官Jony Ive创办的硬件初创公司io。
通过收购“io”,OpenAI不仅获得了曾参与设计iPhone等标志性产品的艾维及其前苹果设计团队,还将整合该初创公司的技术资源,并推出AI硬件产品。
Jony Ive曾主导iMac、iPhone、Apple Watch等划时代产品的设计,定义了如今智能手机外观与体验。此次重返消费电子领域被视为苹果最有潜力的对手之一。过去,消费电子领域一直是苹果主导,公众自然而然认为AI+消费电子,也应该是苹果脱颖而出。
但苹果屡次让人失望,其最畅销的产品iPhone至今未能实现在AI领域的大规模创新。被寄予厚望的SIri不过是定闹钟、问天气而已,而且多个AI功能连续推迟上线后体验仍然不佳。
多重因素影响,今年以来,苹果股价已经下跌了25%。长期关注苹果的记者Mark Gurmn发表在彭博社的一篇名为《Why Apple Still Hasn’t Cracked AI》的文章揭露了苹果AI依然落后于行业的内幕。根据此文,并结合苹果AI的最新动态,本文试图还原“苹果AI为什么落后了”。
苹果AI的核心围绕其称为个人智能系统(personal intelligence system)的 Apple Intelligence,这套系统于去年在苹果WWDC大会上推出,并许诺了包含邮件摘要、写作工具、Genmoji自定义表情、新闻摘要等AI功能。
iPhone因为更新乏善可陈而屡屡被诟病,为提高消费者购买热情,去年9月的苹果手机发布会上(此时距离WWDC已经过去3个月),苹果宣称最新款iPhone 16“专为Apple Intelligence深度打造”,但当月新机发售时却未见AI功能踪影,iPhone 16系列在首周末预购销量也未及预期。
写作助手与摘要生成等首批功能延后一个半月才陆续上线;Genmoji定制表情直至去年12月面世;而基于紧急程度智能排序通知的iOS系统通知功能重大升级,更迟至次年3月方才落地。
项目延期并非不可理解,游戏公司延迟发布一两年都实属正常,苹果在AI的表现本就落后于OpneAI、Google这样的公司,延迟上线后,更是令公众失望。
接入ChatGPT的写作功能,被吐槽像个临时塞进去的,事实上也确实如此,有用户吐槽该功能在概括和提取要点方面平平无奇。
图注:用户用Apple Intelligence要点提取功能,输出的结果不佳。
Genmoji自定义表情,承诺能生成孔雀与冰棒融合等创意图形,但实际效果远逊于苹果在广告中展示的精致设计,且因算力消耗过大可能导致iPhone过热并急剧耗电。
当时宣称iOS通知功能可以将用户苹果手机内包含邮件、网页、各类应用和图片的多种推送信息进行整合,以方便用户一目了然,并优先处理重要的内容。
但实际运行中屡屡出错。最受争议的便是关于美国联合健康集团(UNH)旗下联合健康保险公司首席执行官(CEO)布莱恩·汤普森(Brian Thompson)的推送。苹果将汤普森在纽约街头遭遇枪杀的报道提取总结为(枪手)路易吉·曼吉奥内(Luigi Mangione)对自己开枪”。枪手路易吉因为一张俊朗的出庭照片风靡社交平台,不少支持者认为路易吉是替3990万背负医疗负载的人扣动扳机。
因为出现多次严重事实错误,许多用户打算弃用或者关闭该功能,没多久,该功能被迫下线。
去年WWDC发布会占据C位的的Siri,承载着苹果AI的野望。苹果首次宣称该语音助手将能深度解析用户个人数据与屏幕内容进行应答。演示环节中,时任苹果人工智能负责人的约翰·詹南德雷亚(John Giannandrea)团队核心成员向Siri询问母亲旅行计划,系统通过无缝整合邮件与短信信息,自动生成行程安排。公司同时宣布用户可通过新型Siri实现无触控操作:例如选择照片、裁剪编辑并一键发送给家人。
不过,Siri的更新先是被推迟到5月,现在又变成了无限延期。因为无限延期的AI 版Siri,苹果还被消费者起诉,理由是虚假宣传。
在今年5月的财报电话会议上,当被问及AI进展迟缓时,库克着重强调了已上市的“Apple Intelligence”功能及其对西班牙语、中文等语言的支持升级。他表示Siri的革新只是需要更长时间来达到苹果的质量标准。“没有太多其他原因”,库克说,“就是比我们预期多花了点时间。”
作为仅次于初代iPhone的iPhone 4S系列,后者重要历史地位的一大原因便是以智能助手亮相的初代Siri,当时Siri已经能够实现预订餐厅、查找影院或呼叫出租车等功能。
乔布斯的判断是Siri未来会成为苹果设备的核心交互方式,将Siri列为苹果最高优先级的开发项目之一。不过,乔布斯去世后,很长一段时间内苹果的研究重点是被称为“登月计划”的Vision Pro和新能源汽车。
Siri也因此被弯道超车。2018年,仅仅问世2年的Google Assistant表示,将在年底前支持 30 种语言,当时Siri仅支持21种语言。
2018年,苹果从谷歌挖角约翰·詹南德雷亚(John Giannandrea)担任人工智能部门负责人,想要一鼓作气补足苹果AI的短板。詹南德雷亚曾是谷歌的二号人物,他负责的人工智能部门仅用了2年时间就将AI整合到包括搜索、Gmail和Google Assistant等Google旗下的核心产品中,Google 因此遥遥领先行业至今。
有钱有人也有决心,苹果看起来只要付出足够多的时间和精力就可以反超,但事实并非如此。长期关注苹果的记者Mark Gurmn发表的一篇名为《Why Apple Still Hasn’t Cracked AI》的文章,揭露了苹果AI依然落后于行业的内幕。
首先,是高管们意见不统一。詹南德雷亚入职苹果后,在内部发起了一些列改革。他希望苹果追加数亿美元投资,用于开展机器学习模型训练所需的大规模测试及图文标注工作,撤换掉了Siri部门的负责人,并提议砍掉使用率低的功能。
但他的改革进展并不顺利。苹果软件主管费德里吉始终不愿对AI进行大规模投入,他认为AI并不是个人电脑或移动设备的核心能力,也不愿抽调资源。
没钱没资源,詹南德雷亚主持的AI工作进展缓慢。2022年11月,ChatGPT的横空出世令苹果措手不及。一位苹果高管坦言,在此之前“Apple Intelligence的概念甚至都未成形”。“OpenAI的动向并非什么秘密”,另一位高管反思道,“任何关注市场动向的人都该预见这一趋势,并全力跟进。”
ChatGPT发布后不出1个月,此前对AI持怀疑态度的费德里吉就尝试用生成式AI为他的个人软件项目编写代码。这项技术的潜力顿时令他豁然开朗。他随即与詹南德雷亚等高管密集会晤OpenAI、Anthropic等企业,恶补最新模型与市场动态。
这次调研让费德里吉当即要求:原定2024年发布的iOS 18必须搭载尽可能多的AI功能。为此,詹南德雷亚火速组建大语言模型团队提供技术支持——而这正是竞争对手多年前就已布局的领域。
为了在2024年的WWDC上拿出令人信服的产品,一开始他们打算采用内部自研的聊天机器人,但在内测时团队发现内部研发的聊天机器人在响应大多数查询时,准确率至少落后ChatGPT 25个百分点。苹果开始寻求外部力量。
这时候,苹果内部高管团队对于“和谁合作”又有了分歧,詹南德雷亚力主采用谷歌的Gemini方案,他的理由是OpenAI既缺乏持久运营能力,又在数据隐私保护方面不可信赖。然而,苹果企业发展团队得出了相反结论。最终在WWDC大会上,公司宣布将把Siri无法处理的请求转接至ChatGPT。
技术整合直到12月才真正落地,即便如此,这是少数几个能像宣传的那样正常运行的智能功能之一,比如邮件摘要、写作工具(其AI内核依然来源于ChatGPT)。更多功能给人仓促上市的感觉,比如Genmoji表情包等。
去年宣布的Siri的重大更新迟迟未发布,在此之前苹果已经预热许久。文章称苹果最初计划在2025年4月推出Siri升级功能。然而,在iOS 18.4系统预定发布前数周,软件工程高级副总裁克雷格·费德里吉(Craig Federighi)亲自测试该版本时震惊地发现,包括“语音搜索调取驾照号码”在内的多项高调宣传功能均无法正常运作(此前WWDC演示视频实为早期原型的概念展示,非实际系统能力)。
部分高管对缺乏自研聊天机器人忧心忡,但詹南德雷亚的看法却不同。他觉得OpenAI、Meta和谷歌等对手构不成迫在眉睫的威胁,而消费者并不需要ChatGPT这类工具,而是一个可以控制设备的交互界面。因此,并未全力推动团队开发面向消费者的ChatGPT竞品。同时,詹南德雷亚向同事指出,营销团队对未完成功能的过度炒作难辞其咎。
为了加速Siri的上市,苹果不得不将Siri的基础架构一分为二——旧代码支撑设置闹钟等传统功能,新代码处理涉及个人数据的请求。团队没想到的是,这种临时方案适得其反,最终引发系统整合问题导致延期。员工表示,单个功能或许运行良好,但当代码合并进行整体测试时,系统就会开始崩溃。
苹果大模型训练的落后并不能完全归咎于詹南德雷亚一人。从成立之初,这家公司向来对新技术持观望态度,因此当谷歌、亚马逊等企业疯狂抢购GPU资源时,前首席财务官卢卡·梅斯特里却很保守,最终导致GPU需求远远超过了供给。GPU资源不足导致模型训练大幅度落后。
苹果对用户隐私的长期坚守同样成为掣肘。虽然其23.5亿台活跃设备构成的生态,能获取比多数竞争对手更丰富的用户数据,但相比谷歌、Meta和OpenAI,苹果对AI研究人员接触用户数据的限制严苛得多。这使得苹果的研究人员不得不严重依赖第三方授权数据集,也就是专为AI训练生成的人造数据,严重拖累进度。
Siri的不断延期让库克失去了耐心,约翰·詹南德雷亚(John Giannandrea)被罢免所有产品开发管理权,包括Siri工程及未来机器人设备项目,Siri现由ision Pro混合现实头盔开发的苹果高管迈克·罗克韦尔(Mike Rockwell)负责,并直接汇报给苹果软件工程主管克雷格·费德里吉(Craig Federighi)。
《Why Apple Still Hasn’t Cracked AI》一文透露了Siri目前的最新进展。为了推进Siri的上市进度,苹果已将苏黎世AI办公室作为新架构研发基地,旨在取代当前问题频出的Siri混合架构,新的架构采用完全基于大语言模型引擎构建的“单体模型”,最终将使Siri的对话更自然、信息整合更精准,该项目内部代号为“LLM Siri”。
苹果高层对另一项延期的AI功能同样充满期待,该功能将允许Siri深度接入iPhone应用程序,实现更强大的语音设备控制能力。这不仅能使年收入达200亿美元的应用商店与聊天机器人形成共生关系,更避免了聊天机器人完全取代传统应用的风险。
同时,苹果没有放弃打造属于自己的聊天机器人,一些高管正积极推动将Siri打造成真正的ChatGPT竞争对手。据内部员工透露,公司测试中的聊天机器人在过去半年取得重大突破,部分高管认为其表现已可与新版ChatGPT相媲美。
即便如此,Siri的重大更新版本在短期内依然无法上市。文章指出,在12天后的WWDC大会,Siri的重大升级版本可能不会出现或者不被重点提及,苹果公司的重点放在现有 Apple Intelligence 功能的完善和一些新功能的加入,例如,A优化的电池管理模式,以及一个虚拟健康教练。
其中一个非常重要的变化是,苹果正计划Apple intelligence 开放给第三方开发者,该消息预计在6月9日的全球开发者大会上公布。这一次动作被认为是,苹果试图在生成式AI领域赶超对手的。
对于苹果而言,在AI领域落后,未必是灾难性的。这家公司往往乐于观望竞争对手率先试水新技术——承担所有开拓风险——再向10亿级用户推出设计精良、体验流畅的自家版本。从MP3播放器、智能手机、平板电脑、智能手表到无线耳机,苹果屡试不爽。
更多的苹果员工认为,苹果之所以能成为全球最具价值的科技公司,靠的是每年仅推出一次重大更新的软件系统,配合精挑细选的内容打造极致产品;而人工智能领域却要求更快的迭代速度、更高的容错率,以及更激进的用户介入。这恰好不是苹果擅长的。
即将举办的WWDC上,我们或许依然无法看到苹果在AI上的卓越表现。但他依然有机会跟上并反超。