AWS正打造名為Project Rainier的超級運算集群,配備數十萬顆自研Trainium2 AI晶片,助投資夥伴Anthropic挑戰OpenAI。此集群年底上線,橫跨美國多地資料中心,其中印第安那州設施包含30座資料中心,每座占地20萬平方英呎,總耗電超2.2吉瓦。亞馬遜已向Anthropic投資80億美元,盼助其在AI競爭中突圍。
有別於OpenAI的Stargate或xAI的Colossus,Project Rainier採分佈式設計,跨多地點運作,可無限擴展。Anthropic已用部分系統訓練AI模型。核心Trainium2晶片每顆提供1.3petaFLOPS運算力及96GB記憶體,雖性能不及Nvidia B200晶片,但亞馬遜強調成本效益。16顆晶片組成基本單元,64顆構成「UltraServer」,數千UltraServer串聯形成完整集群。
此規模集群需250~300兆瓦電力,媲美xAI Colossus。亞馬遜為此開發自訂光纖「繩索」及低延遲網路系統,應對龐大線路需求。同時,亞馬遜預告Trainium3晶片,採3奈米製程,效能提升40%,未來部分設施或升級至此晶片,進一步增強運算力。
Project Rainier展現AI基礎設施競賽的激烈,科技巨頭爭相打造更大系統以訓練複雜AI模型。亞馬遜透過此專案鞏固雲端AI市場地位,並為Anthropic提供挑戰OpenAI的強大後盾。