美东时间7月29日,苹果公司发布iPhone AI的首个预览版,随后发布论文,称其人工智能模型是在谷歌的TPU(张量处理单元)上训练的。论文中介绍了为支持Apple Intelligence功能而开发的基础语言模型,包括一个设计用于在设备上高效运行的约30亿参数模型和一个基于私有云计算的云侧大模型。
苹果基础模型的建模概述苹果官方发布论文
苹果发布的论文称,他们在8192块TPU v4芯片上训练云侧AFM(Apple Foundation Model),使用4096的序列长度和4096个序列的批量大小,进行了6.3万亿token训练。端侧AFM在2048块TPU v5p芯片上进行训练。
苹果的决定表明,一些大型科技公司在人工智能训练方面可能正在寻找英伟达图形处理单元的替代品。
一些芯片行业媒体称,这是苹果打响了抛弃英伟达GPU的第一枪。
今年6月初,日本证券公司瑞穗证券估计,英伟达控制着用于训练和部署OpenAI的GPT等模型的AI芯片市场的70%至95%。一些专家将英伟达在AI芯片市场的地位描述为护城河,其旗舰AI图形处理单元GPU(例如H100)与该公司的CUDA软件相结合,使其在竞争中占据了先机。
包括谷歌、Meta、甲骨文和特斯拉在内的科技公司一直在努力构建自己的人工智能系统和产品。
心智观察所研究员潘攻愚指出,苹果宣布其Apple Foundation Model(AFM)在谷歌自主开发的Tensor处理单元(TPU)进行训练,而且还租用了谷歌的云服务。苹果在AI训练方面的权衡折射出了英伟达通用型AI加速器和谷歌的ASIC定制化AI服务体系的竞争升级。
谷歌自2015年以来一直在使用自主设计的TPU来训练和部署AI模型。不是设计通用处理器,而是将其设计为专门用于神经网络工作负载的矩阵处理器,在整个大量计算和数据传递过程中,根本不需要访问内存。
今年5月,谷歌宣布推出了人工智能(AI)数据中心芯片Trillium,据称该芯片的速度相比之前的版本提升了几乎5倍。该公司表示,这款芯片将用于开发自己的模型,包括Gemini和Imagen。
谷歌称,如果提前三年预订,最新的TPU每小时使用成本不到2美元。谷歌于2015年首次推出TPU用于内部工作负载,并于2017年向公众开放。它们现在是专为人工智能设计的最成熟的定制芯片之一。
尽管如此,谷歌仍是英伟达最大的客户之一。它使用英伟达 的GPU和自己的TPU来训练AI系统,并且还在其云端出售英伟达技术的访问权限。
“虽然英伟达目前控制着高达80%份额的高端AI芯片市场,但剩余市场份额大多被大型云服务供应商如谷歌、微软、亚马逊占据。这一次苹果采用的谷歌TPUv5虽然在通用性上较英伟达同生态位芯片逊色,但主打一个性价比,综合总成本(TCO)要低英伟达四倍,而且拿货周期短。目前谷歌TPUv5所在的市场大约有300亿美元,英伟达一直觊觎这块‘肥肉’,但考虑到和谷歌微妙的竞合关系,英伟达目前还不会贸然大举进入ASIC领域。”潘攻愚分析称。
Meta首席执行官马克·扎克伯格和Alphabet首席执行官桑达尔·皮查伊上周均发表评论称,他们的公司和业内其他公司可能在AI基础设施上投资过度,但他们也承认,不这样做的商业风险太高。一旦落后,将无法掌握未来10到15年最重要的技术。