如果你最近有在關心雲端界的腥風血雨,你一定會發現:
Google 有 TPU、Meta 搞 MTIA、Microsoft 端出 Maia,而 AWS?它乾脆把晶片做成套餐組合:Graviton、Trainium、Inferentia,全家一起上!
這畫面就像是各雲端巨頭突然 collectively 想起一句老話:
“既然買晶片這麼貴,那不如自己做來燒?”
但 AWS 為什麼這麼想不開?難道是買 NVIDIA 的 GPU 買到心痛?還是看到台積電排單排到 2027 年,乾脆自己來 DIY?
今天,我們就用輕鬆又不失專業的方式,來把這件事「分悉」一下!
一、AWS 自製晶片,其實是被逼的?
你以為 AWS 是自由意志覺醒?
不,它是市場把它逼成晶片工程師的。
(1)GPU 太貴了!比 A5 和日本旅館還難訂
NVIDIA 的 H 系列 GPU 有多搶?
用一句話形容:
“企業排隊等 H100,就像搶 Blackpink 門票,沒 Bot 根本買不到。”
價格更不用說,H100 一片曾喊到 3~4 萬美元。
換句話說,一座 AI 集群的價格足以買下台北信義區一間小套房。
AWS 每年在基礎建設上花上百億美元,結果其中一大塊竟直接進入 NVIDIA 的錢包。
換成你是 AWS,你會不會也想:
「我這是在做雲端事業,還是幫黃仁勳打工?」
於是 AWS 乾脆說:
不然我自己做晶片好了。
二、AWS 自製晶片的三大武器
AWS 不是嘴上講講,它真的做了——而且一次做了三種。
(1)Graviton:雲端界的省電小天使
Graviton 是 ARM 架構伺服器晶片,特色很簡單:
便宜、節能、跑一般 workload 超划算。
AWS 說自家 VM 換上 Graviton 後,成本直接少 40% 起跳。
換句話說,Graviton 就像那種「吃很少、做很多事」的員工,是所有財務長的真愛。
(2)Trainium:訓練用,來打 NVIDIA 的
Trainium 不是給你跑小模型,它是 AWS 直接把目標鎖定在大模型訓練——
就是跟 NVIDIA H100 正面硬幹的。
官方說法:
-
性能比 GPU 便宜 50%
-
訓練時間更短
-
能效高
翻譯一下:
“我們沒有說我們比 NVIDIA 強,但我們的確暗示了。”
(3)Inferentia:讓推論更便宜的秘密武器
訓練完模型後,真正的大錢在“推論”。
因為你每一次問 ChatGPT:“你覺得我今天該吃什麼?”
背後就有伺服器在跑數百億個參數。
Inferentia 就是用來省下這些成本的。
AWS 用它跑語音辨識、推薦系統等推論工作,甚至說可以比 GPU 便宜到 40%~70%。
推論便宜,就代表雲端廠商能賣更便宜的 AI 服務。
這叫什麼?
這叫一個字:爽。
(對 AWS 也對客戶)
三、那 AWS 為什麼這麼拼?因為它要三件大事!
(1)讓雲端“更賺錢”
AWS 是 Amazon 利潤的主要來源。
但 AI 時代的雲端,最大成本竟不是資料中心本身,而是 GPU!!
NVIDIA:我賣你晶片
AWS:你賣我未來
AWS 做晶片就是要把這個成本壓下來,讓雲端利潤重新回到它的口袋。
(2)避免被 NVIDIA 綁架:供應鏈自主化
說句真話:
在 AI 產業,每家公司現在多少都有一點「NVIDIA PTSD」。
不是說 NVIDIA 不好,而是——
它真的太好、太強、太貴、太難買。
AWS 必須打造自己的 Plan B。
Trainium 與 Inferentia 就是它的“反綁架策略”:
「你黃仁勳很好,但不能只有你一個。」
(3)自家晶片+自家雲端:這就是護城河!
蘋果用 iPhone + iOS 打造護城河。
Google 用 YouTube + Android 打造護城河。
AWS 用什麼?
自家雲端 + 自家晶片 + 自家 AI 服務(Amazon Bedrock)!
這種垂直整合超恐怖,因為:
■ 用 AWS 服務 → 效能最好
■ 用 AWS 晶片 → 成本最低
■ 用 AWS 成本模型 → 雲端帳單讓你哭得比較少
只要你踏進 AWS AI 生態圈,一旦模型在 Trainium 上訓練習慣了,要換平台?
抱歉,遷移成本比搬家還高。
AWS 的心聲很簡單:
“我已經把你服務包成樂高積木了,你跑不掉的。”
四、AWS 的晶片真的能夠威脅 NVIDIA 嗎?
先講結論:
可以威脅,但不會取代。
為什麼?
(1)NVIDIA 太強:軟體生態是無敵的
CUDA 的生態有多大?
大到你懷疑地球是不是由 CUDA 驅動的。
學界用 CUDA、企業用 CUDA、開源框架用 CUDA。
這不是一朝一夕能取代的。
(2)AWS 自家晶片偏向特定用途,不是通用 GPU
Graviton 做 CPU
Inferentia 做推論
Trainium 做訓練
但只有 NVIDIA 的 GPU 可以:「全部我來。」
AWS 晶片更像特製工具:
你要便宜?我來。
你要通用?去找 NVIDIA。
(3)雲端三巨頭都有晶片,真正輸家是誰?
不是 NVIDIA
NVIDIA 反而因為 AI 大爆發賺到爆。
真正緊張的是——
雲端巨頭彼此之間。
未來 AI 客戶會選:
「哪家雲的晶片更便宜、訓練更快?」
這會讓雲端戰場越打越火熱。
五、那 AWS 自製晶片最後會帶來什麼影響?
(1)AI 訓練會變更便宜(讚!)
企業不用再花天價買 GPU,訓練成本下降大家都受惠。
(2)AI 推論會更普及
廣告系統、客服、推薦引擎、語音助理,全都能變便宜與快速。
(3)雲端市場會再進入新一輪戰爭
GCP、Azure、AWS 各自拿自家晶片互相砸。
受益者?
我們。
因為只有競爭,服務才會一直變便宜、變強。
六、總結:AWS 自製晶片,其實是在做一件最務實的事
✔ 降低成本
✔ 免受 NVIDIA 控制
✔ 建立自己的護城河
✔ 提供更便宜 AI 服務
✔ 讓雲端戰爭升級,讓客戶受惠
你以為 AWS 是因為浪漫技術夢想?
不,它只是發現:
“靠別人太貴,靠自己比較省。”
當全球都在搶 GPU、搶先進封裝、搶 AI 伺服器時,
AWS 悟出一個道理:
真正強大的雲端,不是買最多 GPU 的那個。
而是自己能造“算力引擎”的那個。
而這也是為什麼 AWS 明明賣雲端,卻最後跑去做晶片。
因為在 AI 時代,
算力就是戰力。
晶片就是主權。
而誰能做出自己的晶片,誰就能決定自己的未來。

沒有留言:
張貼留言