圖/Shutterstock 全文同步載於美股放大鏡
亞馬遜(AMZN)的AWS雲端部門宣布推出新的晶片,供客戶構建和運行AI應用程序,並計劃提供輝達(NVDA)的最新晶片GH200。
Amazon Web Services(AWS)試圖以各種具有成本效益的選項脫穎而出,它不僅僅賣便宜的亞馬遜品牌產品。就像在其電商業務一樣,亞馬遜的雲端將展示其他供應商的頂級產品,包括來自頂級AI晶片製造商輝達備受追捧的GPU。
自從初創公司OpenAI去年推出其ChatGPT聊天機器人以來,對輝達 GPU的需求急劇增加,該機器人以其總結信息和撰寫類似人類文本的能力令人印象深刻。這導致了輝達晶片的短缺,因為公司爭相將類似生成式AI技術納入其產品中。
亞馬遜同時建造自己的晶片和讓客戶訪問輝達最新晶片的雙管齊下策略可能有助於應對其頂級雲計算競爭對手微軟(MSFT)。本月初,微軟採取了類似的做法,公開了其首款AI晶片Maia 100,並表示Azure雲端服務將配備輝達 H200 GPU。
這些宣布是在周二的Reinvent大會上進行的。具體而言,AWS表示將提供輝達最新的H200AI GPU。它還宣布了新的Trainium2AI晶片和通用型Graviton4處理器。
新的輝達 GPU—H200是H100的升級版本,H100是OpenAI用來訓練其最先進的大型語言模型GPT-4的晶片。由於大公司、初創公司和政府機構都爭奪有限的晶片供應,這意味著從云服務提供商(如亞馬遜)租用這些晶片的需求很高。輝達表示,H200的輸出速度將比H100快近兩倍。
亞馬遜自家的Trainium2晶片是為訓練AI模型而建,包括像OpenAI的ChatGPT和其競爭對手運行的AI聊天機器人所使用的模型。初創公司Databricks和亞馬遜支持的Anthropic,OpenAI的競爭對手,計劃使用新的Trainium2晶片構建模型,亞馬遜表示這將比原始模型的性能提高四倍。
Graviton4處理器基於Arm架構,比起Intel或AMD的晶片,能耗更低。Graviton4承諾比現有的Graviton3晶片提高30%的性能,從而實現更好的性價比。通膨高於平時,激勵央行提高利率。那些希望繼續使用AWS但希望降低其雲開支以更好應對經濟的組織可能希望考慮轉向Graviton。
亞馬遜表示,已有超過5萬AWS客戶在使用Graviton晶片。
最後,作為與輝達深化關係的一部分,AWS表示將採用超過16,000個輝達 GH200 Grace Hopper超級晶片,其中包含輝達 GPU和輝達基於Arm的通用處理器。輝達自家的研發團隊和AWS客戶都將能夠利用這一基礎設施。
自2006年發布其用於計算和存儲數據的EC2和S3服務以來,AWS已推出了200多種雲端服務,但並非所有服務都取得成功。有些長時間沒有更新,極少數被停產,使亞馬遜能夠重新分配資源。然而,該公司繼續投資於Graviton和Trainium計劃,這表明亞馬遜感受到了需求。
AWS並未宣布搭載輝達 H200晶片的虛擬機實例和依賴其Trainium2硅的實例的發布日期。在未來幾個月變為商業化之前,客戶現在可以先開始測試Graviton 4。
延伸閱讀:【美股研究報告】亞馬遜 Amazon 2023 年第 2 季財報揭曉,有何佳音使其盤後股價一度大漲超過 10%?