作者:原创
自生成式AI爆发式发展以来,英伟达(Nvidia)GPU一骑绝尘,市值一度突破3万亿美元,主导着高端AI训练芯片市场。不过,各大公司在使用英伟达的GPU的同时,也没有放弃寻找替代品。OpenAI一直在推进定制化芯片ASIC的相关计划,苹果直接转向了Alphabet设计的TPU芯片。
本周一,苹果发布了Apple Intelligence的第一个版本iPhone AI,iPad和Mac也有类似的版本。
同时,苹果官网公布了一篇技术论文,详细介绍了为支持Apple Intelligence而开发的基础模型AFM和AFM服务器。论文中,苹果披露,训练模型采用了谷歌研发的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。
在这篇论文中,苹果没有提到谷歌或是英伟达的名字,但表示,其AFM和AFM服务是在 "云TPU集群 " 上训练。这意味着,苹果向云服务商租用了服务器进行计算。苹果在论文中表示:“这个系统让我们能够高效、可扩展地训练AFM模型,包括设备上的AFM、AFM服务器和更大的模型。”
在论文中,苹果表示设备上的AFM是在单一“切片”的2048个TPU v5p芯片上训练的,这些芯片协同工作。这是于去年12月推出的最先进TPU。根据论文,AFM服务器是在8192个TPU v4芯片上训练的,这些芯片通过数据中心网络配置为8个切片协同工作。
英伟达的GPU在市场上占据主导地位,OpenAI、微软和Anthropic都在使用英伟达的GPU来训练他们的模型,而其他科技公司,包括谷歌、Meta、甲骨文和特斯拉,也在购买这些产品来构建和发展他们的AI系统和服务。
谷歌在2015年首次推出了自己的TPU用于内部工作负载,并在2017年向公众开放,是为人工智能设计的最成熟的定制芯片之一。尽管如此,谷歌仍是英伟达的顶级客户之一。其使用英伟达的GPU和自己的TPU来训练AI系统,并且还在其云端出售 Nvidia 技术的访问权限。
苹果此前曾表示,推理(即采用预先训练的人工智能模型并运行它来生成内容或做出预测)将部分在其数据中心的苹果自己的芯片上进行。