|
查看: 150|回复: 3
|
nVidia 真正的恐惧:护城河 CUDA “平台战争” 败局
[复制链接]
|
|
|
本帖最后由 aidj 于 7-11-2025 12:54 PM 编辑
https://youtu.be/AKwxBaQ5rOs(19:34)
OpenAI GPT 加上 辉达(英伟达)Cuda 不可能 通往 Agi 成功之路。
台湾 供应链 的 大佬们 是不是 看到 我们没看到滴 |
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 7-11-2025 11:51 AM
来自手机
|
显示全部楼层
本帖最后由 aidj 于 7-11-2025 11:52 AM 编辑
#當NVIDIA以為已經贏了,Google卻用100萬顆晶片改寫戰局
Anthropic宣布採購100萬顆Google TPU,價值數百億美元,這是AI晶片史上最大單一訂單之一。更驚人的是,這家原本依賴NVIDIA GPU的AI新創,為什麼突然把寶押在Google身上?因為一個產業轉折正在發生:推理時代來了。
Google剛剛發布第七代TPU Ironwood,單一Pod算力達42.5 Exaflops,是目前世界最大超級電腦的24倍。這個數字背後,是Google十年磨一劍的戰略耐心,以及一個更深層的判斷:當AI從實驗室走向億萬用戶,遊戲規則變了。
##20年生態vs 10年沈潛
時間是這場戰爭最殘酷的維度。NVIDIA從2006年推出CUDA以來,花了20年編織出一張覆蓋全球的生態網:數百萬開發者、幾乎所有AI框架、八成到九成的市場佔有率。這不是單純的技術領先,而是時間累積出的護城河。
Google的TPU起步於2015年,到現在正好十年。十年聽起來不短,但在生態競爭裡只是個後進者。TPU一直被視為「Google自用」而非「產業標準」,即使性能不俗,也難撼動CUDA在訓練時代的統治地位。開發者要的是靈活性,CUDA的開放生態正中紅心。
但十年沈潛不是白費的。Google用這段時間做了三件事:打磨晶片性能、建立軟體堆疊、等待時機。現在,時機到了。
##推理時代來臨,規則改寫
當AI應用從「訓練模型」轉向「服務億萬用戶」,一個關鍵變化發生了:推理需求是訓練需求的數十倍甚至百倍。ChatGPT每天處理數億次對話,Gemini支撐Google搜尋的AI功能,Claude服務30萬家企業客戶。這些推理任務的共同特徵是:高頻、低延遲、持續運行、成本敏感。
此時,遊戲規則改變了。企業不再追求極致通用性,而是針對特定工作負載最佳化;不再只看峰值性能,而是看「每美元能跑多少推理」;不再只比單晶片算力,而是比「大規模部署的總體成本與能效」。
這正是Google TPU的機會窗口。如果說訓練是「蓋房子」需要各種工具,那推理就是「量產標準零件」,專用生產線的效率遠勝通用工廠。
##Google的三重挑戰策略
Ironwood最驚人的不是單晶片性能。它的4.6 petaFLOPS只是略勝NVIDIA B200的4.5 petaFLOPS。真正的殺手鐧在於規模化能力:可以把9,216顆晶片組成單一Pod,總算力達42.5 Exaflops。相比之下,NVIDIA GB300 NVL72系統的0.36 Exaflops只是零頭。
這背後是設計哲學的根本差異。NVIDIA的GPU強調單卡強悍,透過NVLink連接多卡;Google的TPU從一開始就是為「萬卡規模」設計,用9.6 Tbps的晶片間互連網路把數千顆晶片變成「一台超級電腦」。當訓練一個萬億參數模型或服務億萬次推理時,系統級成本比單卡性能更重要。
Anthropic的CFO明確指出選擇TPU的理由:價格性能比與能源效率。這句話透露了AI產業的殘酷真相:當運算成本成為企業最大開支,省錢比拚速度更重要。
Google的成本優勢來自垂直整合:自己設計晶片、建資料中心、提供雲端服務,省去中間商利潤。TPU針對TensorFlow與Transformer架構深度最佳化,能效比通用GPU高出兩倍。Ironwood的能效比第一代TPU提升29倍,在電費高漲的時代這是真金白銀。Google 2025年資本支出930億美元,約六成用於伺服器採購,這種規模效應是NVIDIA難以企及的。
更深層的策略在於生態閉環。NVIDIA的CUDA是開放生態,任何人都能用;Google的TPU則走垂直整合路線:TPU加上Gemini模型、Google Cloud、Vertex AI平台,形成軟硬體協同最佳化的閉環。Gemini 2.5 Flash-Lite就是與TPU共同設計,速度驚人。Pathways系統可以動態調度數萬顆TPU,這是CUDA無法做到的。
過去這種策略行不通,因為訓練時代開發者要靈活性。但在推理時代,企業要的是穩定、便宜、省事,Google的一條龍服務反而更有吸引力。Anthropic這家年化營收達70億美元的AI新創,選擇TPU不是小試水溫,而是戰略豪賭,向市場傳遞了一個信號:在推理時代,NVIDIA不再是唯一選擇。
##戰爭才剛開始
這場戰爭遠未結束。NVIDIA仍握有CUDA這張王牌,九成的市場佔有率不是一夜之間就能撼動的。但Google用Ironwood證明了一件事:在推理時代,專用晶片加上垂直整合,可以在特定場景打敗通用GPU的絕對性能優勢。
對投資人來說,別再把AI晶片競賽簡化成「誰跑得快」。真正的戰場是「誰能用更低成本、更高能效餵飽億萬次推理需求」。這不是短跑,是馬拉松。Amazon的Trainium、Microsoft的Maia、Meta的MTIA都在崛起,這不是偶然,而是必然。
Anthropic的100萬顆TPU訂單不只是一筆生意,而是一個時代信號:推理時代,Google來了。
---
#Google, #NVIDIA, #Ironwood, #TPU, #AI晶片競爭 |
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 7-11-2025 12:30 PM
来自手机
|
显示全部楼层
辉达(英伟达, NVDA) 股票下跌
|
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 7-11-2025 12:40 PM
来自手机
|
显示全部楼层
本帖最后由 aidj 于 7-11-2025 12:41 PM 编辑
黃仁勳在《金融時報》的AI峰會上表示:
「中國將贏得AI競賽。」
當然,在稍後的澄清中,他補充道:「我一直說,中國在AI領域只落後美國幾奈秒……美國獲勝的關鍵在於加速前進,並贏得全球開發者的支持。」
他給出的理由是:
1. 能源成本: 中國為其科技巨頭(如字節跳動、阿里、騰訊)的資料中心提供巨額能源補貼,黃仁勳直言:「電力是免費的」,這大幅降低了AI運算的根本成本。
2. 監管效率: 相較於美國各州可能催生出「50種不同法規」的複雜局面,北京的監管環境更為簡潔、統一,決策和執行速度更快。
3. 人才儲備: 全球約一半的AI研究人員在中國,這是一個無法忽視的龐大人才庫。
4. 政府意志: 中國政府正強力推動本土晶片的應用,以擺脫對美國技術的依賴。
那麼,在這些看似清晰的陳述背後,真正值得我們深思的「弦外之音」是什麼?
▋一場高明的「政治喊話」
黃仁勳不是一個評論員,他是一個商人,一個被美國政府政策卡住喉嚨的商人。
美國的晶片出口禁令,讓 Nvidia 在中國的市佔率,用黃仁勳自己的話說,是「從 95% 掉到了 0%」。這是一個價值數百億美元的市場,就這樣眼睜睜地消失了。
當一個商人想改變一個對他不利的政策時,他會怎麼做?
直接說「禁令讓我賺不到錢,請快點解除」,這是最愚蠢的做法,只會被貼上「不愛國」、「為了錢出賣國家利益」的標籤。
最高明的做法,是把「公司的利益」包裝成「國家的利益」。
所以,黃仁勳的潛台詞是:
「你們把我擋在門外,結果是什麼?結果是他們會傾全國之力,搞出自己的晶片、自己的生態系。到頭來,我們不僅失去了全球最大的市場,還催生了一個最強大的競爭對手。你們的政策,不是在保衛美國的領先,而是在加速美國的失敗。」
▋「贏得全世界的開發者」
在拋出「中國會贏」這個聳動的警告後,黃仁勳立刻給出了他的「解藥」:
他說:「美國獲勝的關鍵,在於跑得更快,並贏得全世界的開發者。」
這句話才是他真正想說的重點。
什麼叫「贏得全世界的開發者」?
潛台詞就是,「中國有全球一半的 AI 開發者,你要贏得世界,就不可能繞過中國。怎麼贏得他們?讓他們用你的東西!」
讓他們習慣在 Nvidia 的 CUDA 平台上做開發,讓整個中國的 AI 生態都建立在美國的技術棧之上。
這是一石二鳥之計。如果華盛頓聽進去了,放寬了限制,Nvidia 就能重返中國市場,大賺其錢。同時,他還能成為「幫助美國贏得 AI 戰爭」的一份子。
▋對我們的啟示是什麼?
作為投資者,我們不必去猜誰會贏,我們應該去找投資的機會。
相反,我們應該意識到,正是這場激烈的競賽本身,為整個AI基礎設施產業注入了最強勁、最持久的燃料。
我們的任務,是在這場無可避免的軍備競賽中,找到那個最核心、最不可或缺的軍火供應商,然後站穩位置。遊戲的複雜性在增加,但下注的核心邏輯,從未如此清晰。
- KP
p.s. 在我上星期Substack長文中,我深入分析了CUDA的護城河,有興趣可以閱讀,全文在下方。
|
|
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|