昊梵体育网

亚马逊AWS CEO Garman在接受采访时表示,所有Claude最新模型都是

亚马逊AWS CEO Garman在接受采访时表示,所有Claude最新模型都是在亚马逊Trainium芯片上训练的。

但外界更想知道,为什么Anthropic会同意使用一款在客观性能上慢于英伟达最强芯片的训练芯片。

Trainium2在原始TFLOPS上确实输给GB200,听起来像是致命缺陷,然而训练现代推理模型Anthropic更看重每美元的内存带宽。因为强化学习是内存受限(memory-bound),而非计算受限(compute-bound)。而在这一点上,亚马逊赢了。

Anthropic的工程师并没有被动接受这颗芯片。他们参与了共同设计,编写了直接与硅片对接的底层内核,并帮助塑造了Neuron软件栈。作为交换,亚马逊为他们建造了1.3吉瓦的专用电力容量,并承诺投入80亿美元。

随后,Anthropic又转向谷歌,拿到了100万颗TPU,同时继续使用英伟达GPU。

阿莫代同时使用着三大芯片生态系统,让三大云巨头为同一批工作负载互相竞争。每一家都投入数十亿美元,只为成为Anthropic的三个训练伙伴之一。

Anthropic的年化收入刚刚突破300亿美元,六个月前还只有90亿美元。他们现在拥有超过1000家每年支出100万美元以上的企业客户。这家选择了“更慢”芯片的公司,如今却是全球增长最快的AI实验室。

Garman想把这当作Trainium的胜利庆典,确实也是亚马逊的芯片业绩。

但Anthropic把三条相互竞争的硅芯片路线变成了互相制衡的筹码,而每一家云巨头都愿意砸下数十亿美元,只为获得成为“三个选项之一”的资格。