(原标题:收购Graphcore之后,软银开启AI“反击战”)
如果您希望可以时常见面,欢迎标星收藏哦~
来源:内容由半导体行业观察(ID:icbank)编译自nextplatform,谢谢。
有传言称,Arm Ltd 或其母公司日本软银集团将收购英国 AI 芯片和系统新贵 Graphcore(如果成立八年,它就不再是一家初创公司)。昨天,这一传言得到证实,孙正义拿出软银集团的公司支票簿,以低于投资者投入的金额收购了该公司。
Nvidia 在其用于训练神经网络的 GPU 计算引擎上取得初步成功之后,许多首批 AI 芯片初创公司的成立都并非易事。或者至少,在盈利的道路上,获得客户、积累资金和收入并不像想象的那么容易。
这些初创公司中的大多数都以某种形式效仿了谷歌在其 AI 专用张量处理单元 (Tensor Processing Unit) 上采取的从头开始的方法。张量处理单元于 2015 年初首次部署,目前已发展到第六代“Trillium”系列 GPU,其中第一款产品于一个月前发布。其想法是从设计中剥离出来自 GPU 传统的所有图形处理和 HPC 模拟和建模所需的高精度浮点数学,并且在许多情况下构建快速而广泛的网络管道,以将这些生成的矩阵数学引擎互连成集群,以承担非常大的任务。
BrainChip、Cerebras Systems、Graphcore、Groq、Habana Labs(现为英特尔的一部分)、Nervana Systems(被英特尔的 Habana 取代)和 SambaNova Systems 成立时都秉持着这样的理念:专用芯片在训练 AI 系统和使用训练好的模型进行推理方面的应用将会出现爆炸式增长。但购买这些设备(或收购这些公司)的理想客户是超大规模企业和云计算提供商,他们没有购买任何基于它们的计算引擎或系统,而是决定采用不同的双管齐下的方法。他们为大众购买了 Nvidia GPU(现在有时是 AMD GPU)(即使以高价购买,他们也可以以高价租用),并且他们开始创建自己的 AI 加速器,这样他们就可以拥有第二个来源、备用架构和更便宜的选择。
即便是过去三年来一直支撑价格的 Nvidia GPU 短缺,也并没有真正帮助 AI 芯片和系统新贵。这很奇怪,也证明了人们已经学会了对尚未完全实现的软件堆栈感到厌倦和警惕。因此,要警惕 Tenstorrent 和 Etched(我们刚刚谈到这两家公司,很快就会写到它们)以及任何认为自己拥有更好的矩阵数学引擎和神奇编译器的人。
这不仅是一个拥挤的市场,而且对于初创企业和新创企业来说,这是一个非常昂贵的市场。由于超大规模企业和云构建者各自为政,而企业在 AI 基础设施方面非常厌恶风险,因此资金并不充足。
这就是为什么 Graphcore 寻求买家而不是进行另一轮投资的原因,这可能很难实现。英国前首相里希·苏纳克 (Rishi Sunak) 承诺为英国的 AI 超级计算投入 15 亿英镑,第一台获得资助的机器是布里斯托大学的 Isambard-AI 集群,因此 Graphcore 一直有机会获得一大笔资金来构建其 Good AI 超级计算机,这是一款假设的、充满希望的机器,该公司早在 2022 年 3 月就表示,它将在其“Bow”系列智能处理单元上使用 3D 晶圆堆叠技术来构建它。但无论出于什么原因,尽管 Graphcore 是英国科技界的宠儿,英国政府却没有出资建造拟议的 Good 机器所需的 1.2 亿美元,该机器将把 8,192 个 Bow IPU 捆绑在一起,以 16 位精度提供 10 exaflops 的计算能力和 4 PB 的总内存,这些 Bow IPU 之间的总内存带宽超过 10 PB/秒。
我们很想看到这样一台机器的诞生,我们猜想 Graphcore 也是如此。但即便如此,也不足以挽救 Graphcore 目前的命运。
政府可以资助一次性超级计算机,而且通常都会这样做。富士通为日本理化学研究所实验室建造的“K”和“Fugaku”超级计算机就是完美的例子。K 和 Fugaku 是地球上有史以来最高效的真正 HPC 工作负载超级计算机——K 实际上比最近的 Fugaku 更高效——但与同样高效的替代方案相比,两者都非常昂贵。而且它们没有像 Nvidia CUDA 平台经过近二十年的大量工作后那样跨行业转换的软件堆栈。尽管富士通凭借其 Sparc64fx 和 A64FX 处理器以及 Tofu 网格/环面互连尽了最大努力,但 K 和 Fugaku 尽管表现出色,但并没有真正在日本本土培养出广泛和深化的本土计算。这就是为什么富士通正在开发一款更适合云且更少针对 HPC 的 Arm 服务器芯片分支“Monaka”,我们在 2023 年 3 月就曾详细介绍过它。
日本斥资 12 亿美元建造了每秒 10 千万亿次浮点运算的 K 机,该机于 2011 年投入运营;又斥资 9.1 亿美元建造了每秒 513.9 千万亿次浮点运算的 Fugaku 机,该机于 2021 年投入运营。如果以史为鉴,日本将斥资约 10 亿美元建造“Fugaku-Next”计算机,该计算机将于 2031 年投入运营。只有上天知道这台计算机的百亿亿次浮点运算能力和精度。
对于英国来说,旗舰超级计算机将落户爱丁堡大学,而不是 Graphcore 位于布里斯托尔的所在地。英国政府将拨款 9 亿英镑(11.2 亿美元)用于在 2026 年前在英国建造一台百亿亿次超级计算机,其中 2.25 亿英镑(2.81 亿美元)将用于 Isambard-AI 机器,其余大部分资金将用于在爱丁堡并行计算中心 (EPCC) 实验室建造 Archer2 系统的继任者。
Graphcore 永远无法从中分一杯羹,因为它只制造 AI 机器,而不是混合 HPC/AI 系统,无论英国政府和英国人民多么希望拥有本土供应商。如果 Graphcore 希望获得政府的全力支持,它需要制造一台真正的 HPC/AI 机器,能够与仅 CPU 和混合 CPU-GPU 机器正面竞争。政府对天气预报、气候建模和核武器感兴趣。这就是他们建造大型超级计算机的原因。
由于超大规模企业和云构建者缺乏兴趣,以及企业规避风险,Graphcore 发现自己的财务状况非常紧张。从 2016 年成立到 2021 年冠状病毒大流行期间,该公司在六轮融资中筹集了约 6.82 亿美元,当时 Transformer 和大型语言模型正在全球范围内涌现。考虑到创建百亿亿次浮点 AI 系统所需的巨大硬件和软件开发,这笔钱并不像看起来那么多。
我们掌握的 Graphcore 财务数据的最后一年是 2020 年,根据《金融时报》的报道,该公司的收入仅为 270 万美元,但税前亏损却高达 2.05 亿美元。去年秋天,Graphcore 表示,今年需要筹集新资本才能继续运营,因此收入和亏损状况可能并没有太大改善。目前尚不清楚 Graphcore 还剩多少钱,但我们听说软银以略高于 6 亿美元的价格收购了该公司。假设所有的钱都花光了,那么微软、Molten Ventures、Atomico、Baillie Gifford 和 OpenAI 的联合创始人 Ilya Sutskever 的投资就亏损了,这是一个残酷的现实,因为仅仅四年前,Graphcore 的估值就高达 25 亿美元。
这些严酷的经济条件并不意味着 Bow IPU 或其中的一部分不能成为基于 Arm 的处理器的出色加速器。软银的孙正义对奇点的嘈杂虚空有点过于迷恋,不符合我们的品味(我们喜欢个人的闲聊和欢笑,以及人们自愿的合作和独立),他已经明确表达了自己在人工智能领域的抱负。
但那又怎样?
上述所有新贵都曾对人工智能抱有雄心壮志,超大规模企业和云构建者也同样如此,他们实际上正试图从中获利。他们都有世界上最聪明的人在从事这项工作——而 Nvidia 仍然拥有这个太空计算引擎、网络和软件堆栈,这类似于锁、库存和桶。
2016 年,孙正义斥资 320 亿美元收购了 Arm Ltd。如果孙正义真这么聪明,他根本就不应该这么做。当时,Nvidia 的市值为 575 亿美元,与 2015 年相比增长了 3.2 倍,因为 HPC 和 AI 的加速浪潮正在兴起。如果孙正义以 320 亿美元收购 Nvidia,他可以收购 Nvidia 55.7% 的股份。截至本文发稿时,Nvidia 的市值为 3.2100 亿美元,那么孙正义对 Nvidia 的假设巨额投资如今的价值将略低于 1.786 亿美元。
为了更好地理解这一点,我们可以想象一下,2023 年日本全国的国内生产总值为 4,2100 亿美元。
今年早些时候,我们曾有过一次心烦意乱的经历,当时我们讨论过 Arm 应该拥有 GPU 或至少某种数据中心级加速器,以便在其产品组合中与 Nvidia 竞争。我们对此感到有些难过,但我们坚持我们的说法,Arm 没有推出大型 XPU,因此在 Neoverse 上损失了很多钱,而现在孙正义一手握着 Arm,一手握着 Graphcore。但是,由于超大规模计算和云构建者已经在构建自己的加速器,Arm 可以出售加速器 IP 块的时代可能已经过去了。
但也可能不是。
也许有办法创建更通用的 Graphcore 架构,并在 Fugaku-Next 上与富士通一较高下。或者与富士通合作,这将更符合 Keisuko 项目于 2006 年启动 K 超级计算机项目的努力,当时富士通、NEC 和日立三方合作。
预测未来只有一个可靠的方法,那就是活在当下。我们拭目以待吧。
https://www.nextplatform.com/2024/07/12/can-softbank-be-an-ai-supercomputer-player-will-arm-lend-a-hand/
点这里加关注,锁定更多原创内容
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3825内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦