NVIDIA開始販售製造鏟子的方法了
- 核心觀點:NVIDIA正透過將AI深度整合到晶片設計(EDA)工具鏈中,並將其與自家GPU硬體綁定,構建一個從設計到製造的閉環生態,從而在底層工具層面鞏固其行業統治地位,使競爭對手的追趕陷入依賴其生態的悖論。
- 關鍵要素:
- 效率革命:NVIDIA內部AI工具(如NB-Cell)可將原本需8人10個月的標準單元庫遷移工作,縮短至單卡GPU運行一晚,且結果在關鍵指標上匹配或超越人類設計。
- 生態綁定:透過20億美元入股EDA巨頭Synopsys並聯合開發,NVIDIA將加速計算堆疊嵌入其工作流,並推動Cadence等廠商推出「獨家基於NVIDIA Blackwell」的EDA平台,使最快工具依賴NVIDIA硬體。
- 全鏈條滲透:NVIDIA用AI重塑晶片產業鏈關鍵環節,從前端設計(Chip Nemo)、中端優化到後端製造(cuLitho),最終都導向對其GPU算力的需求。
- 國產困境:中國GPU公司在嚴重虧損下研發,且嚴重依賴受管制的海外EDA工具(如Synopsys、Cadence)進行先進製程設計,而後者正加速融入NVIDIA生態。
- 競爭悖論:競爭對手(如AMD)若想設計對標NVIDIA的晶片,將不得不使用在NVIDIA GPU上運行最快的EDA工具,形成「用對手的工具追趕對手」的尷尬局面。
原文作者:Ada,深潮 TechFlow
舊金山,聖何塞會議中心,GTC 現場。
NVIDIA 首席科學家 Bill Dally 坐在台上,對面是 Google 的 Jeff Dean。兩個人聊到一半,Dally 拋出一個數字:「此前移植一個包含約 2500 至 3000 個單元的標準單元庫,需要 8 名工程師組成的團隊耗時約 10 個月。」
他停了一下。
「現在僅需單卡 GPU,跑一個晚上。」
台下沒有驚呼,因為聽懂這句話的人都明白意味著什麼。8 名工程師 10 個月的工作,被一顆自家產的 GPU 一夜之間吃掉了。而且 Dally 還補充道:跑出來的結果在面積、功耗、延遲這三個指標上,匹配甚至超過人類設計。
第二天就有新聞解讀成「NVIDIA 用 AI 設計 GPU」。
但這事的真相,遠比新聞標題值得玩味的多。
NVIDIA 內部在跑什麼?
NVIDIA 內部跑的也不是黑箱,是幾套磨了幾年的工具鏈。
NB-Cell 是一個基於強化學習的程序,專幹標準單元庫遷移這種最苦的活。Prefix RL 旨在解決進位前瞻鏈中前瞻階段的放置這一長期研究難題。Dally 表示,該系統生成的佈局「是人類永遠無法想到的」,與人類設計相比,關鍵指標提升了約 20% 到 30%。
再就是兩個內部 LLM,Chip Nemo 和 Bug Nemo。NVIDIA 將歷史上每一顆 GPU 的 RTL 代碼、架構文檔、設計規格餵給這兩個大模型。按照 Dally 的描述是,這相當於把 NVIDIA 從 G80 到 Blackwell 二十年的肌肉記憶蒸餾成了一個內部模型,新人進去就直接對接二十年功力的資深工程師。
那麼「AI 可以設計 GPU」了嗎?
恰恰相反。 Dally 的原話是:「我很希望有一天能直接說『給我設計一顆新 GPU』,但我們離那一步還很遠。」
NVIDIA 沒用 AI 設計出 GPU。但它做的另一件事讓整個行業以後沒它玩不轉。
20 億美元買進 EDA 腹地
2025 年 12 月 1 日,NVIDIA 以 20 億美元入股 EDA 三巨頭之一的 Synopsys。雙方簽了聯合開發協議,把 NVIDIA 的加速計算棧嵌入 Synopsys 整條 EDA 工作流,Blackwell 和下一代 Rubin GPU 要跟 Synopsys.ai 做深度整合。
Synopsys 的地位需要解釋一下。全球每一顆先進製程晶片,Apple M 系列、AMD MI 系列、Google TPU,設計階段幾乎都跑在 Synopsys 或者 Cadence 的工具鏈上。這兩家加上西門子 EDA,壟斷了晶片設計的底層工具。你可以不用高通的晶片,可以不用台積電的產線,但你綁不開這三家的軟體。
入股 Synopsys 之後三個月,NVIDIA 把 Cadence、Siemens、Dassault 也拉了進來,宣布它們都在基於 NVIDIA GPU 開發 AI 驅動的晶片設計工具。
NVIDIA 公布的基準測試數據擺出來挺嚇人:Synopsys PrimeSim 在 Blackwell 上快 30 倍,Proteus 快 20 倍,Sentaurus 在 B200 上對比 CPU 加速 12 倍。聯發科用 H100 把 Cadence Spectre 提速 6 倍。Astera Labs 用 Synopsys + NVIDIA 把晶片驗證提速 3.5 倍。
有一個細節值得單獨拎出來:Cadence 的 Millennium M2000 平台,標的是「專為 EDA 市場打造,獨家基於 NVIDIA Blackwell」。
獨家兩個字最值得品。也就是說,EDA 工具以前跑在 CPU 上,Intel、AMD 都能玩。今後想用最快的 EDA,只能買 NVIDIA 的卡。
飛輪的真實形狀
NVIDIA 的飛輪,大多數人理解的版本是這樣的:賣 GPU 給 AI 公司,AI 公司訓練大模型,大模型證明 GPU 不可替代,更多人買 GPU。
這個飛輪已經夠可怕了。但在它下面還有一層。
NVIDIA 用自己的工具設計下一代 GPU,設計效率拉開代際差距,同時把整個行業的 EDA 工具鏈綁在自家硬體上。競爭對手想追,但連追的工具都得從 NVIDIA 的生態裡租。
AMD 那份讓股價大跌的財報背後藏的就是這層焦慮。即便 NVIDIA 和 Synopsys 表面上說「投資不附帶任何採購 NVIDIA 硬體的義務」,市場也心知肚明:加速版 EDA 功能首發都在 NVIDIA 硬體上,AMD 和 Intel 只能依賴一條「為最大對手平台調優的路徑」。
設想一下 AMD 的工程師以後想設計一顆對標 Blackwell 的晶片,他打開 Synopsys 的工具,這個工具在 NVIDIA GPU 上跑得最快。那麼他要麼忍受慢一倍的設計週期,要麼買一堆 NVIDIA 的卡來設計要打敗 NVIDIA 的晶片。
鏟子還在賣。但賣法變了。
國產 GPU 的真實處境
講到這裡,必須給一組讓人清醒的數字。
NVIDIA 2025 財年淨利潤突破 700 億美元的同一年,國產 GPU「四小龍」摩爾線程、沐曦、壁仞、燧原,擠在 IPO 的窗口前排隊。
摩爾線程招股書顯示,2022 年到 2024 年,三年累計淨虧損 50 億元,2025 年上半年再虧 2.71 億元,截至 6 月 30 日累計未彌補虧損 14.78 億元。公司管理層自己預計,最早 2027 年才能實現合併報表盈利。沐曦稍好一些,三年累計虧損超過 30 億元。最慘的是壁仞,三年半虧損超過 63 億元,2025 年上半年的收入只有 5890 萬元,連摩爾線程同期 7.02 億元的零頭都不到。
再看研發投入的強度。摩爾線程 2022 年的研發費用佔營收比例是 2422.51%,2024 年仍然高達 309.88%。一年研發花掉的錢,是收入的三倍多。這不是企業經營,這是輸液續命,靠著一級市場和最近打開的科創板窗口持續輸血。
工具層面更卡脖子。華大九天 2022 年 IPO 招股書顯示工具僅部分支援 5nm 先進製程。概倫電子能覆蓋 7nm/5nm/3nm 節點,但只做點工具,遠談不上全流程。
華大九天創始人劉偉平說得很坦誠:「國產 EDA 對先進工藝的支撐還存在明顯不足,尤其是當下的 7nm、5nm、3nm 等。目前國產 EDA 可以做到 14nm 的水平,雖然掌握了 7nm 工藝技術,但 7nm 在與實際應用的深度融合上還需要全產業鏈的協同發力。」
也就是說,先進製程的全流程 EDA,國產基本不能用。國產 GPU 公司設計晶片用的還是 Synopsys 和 Cadence。2025 年川普一度宣布對所有關鍵軟體實施出口管制,雖然沒有實質落地,但 7nm 以下先進製程 EDA 工具至今處於嚴格管制狀態。許可證什麼時候被切,開關在別人手裡。
資本市場的反應足夠魔幻。沐曦上市當天,股價收報 829.9 元,單日上漲 692.95%。摩爾線程上市後股價一度升至 A 股第三,僅次於貴州茅台和寒武紀,有媒體按當時股價測算,其總市值約為 3595 億元。
數字背後的真實生意是,一群仍在燒錢虧損、仍要依賴被管制的境外工具鏈才能繼續設計晶片的公司,卻在二級市場被定價成「國產 NVIDIA」的接班人。
而這些公司用來設計晶片的那套工具,正在變成 NVIDIA 生態的一部分。NVIDIA 和 Synopsys 那 20 億美元的綁定,Cadence Millennium M2000「獨家基於 NVIDIA Blackwell」的標籤,讓追趕這件事本身變成了一個悖論。
一條從設計到製造的完整鏈
回到 GTC 那場對談。
Dally 整場表現得很謙虛。「AI 還遠遠不能自己設計晶片」,這話 NVIDIA 已經講了四五年了。但每年講法在變。四年前是「AI 可以輔助設計」,三年前是「AI 可以自動化某些環節」,今年是「一晚上做完 8 個人 10 個月的活」。每年推一步,每年留一句「距離終極目標還很遠」。三年後回頭看,上一輪的「還很遠」已經做到了,新的「還很遠」被定義在了所有對手還夠不著的位置。
NVIDIA 過去十二個月做的事其實只有一件:把 AI 用在晶片產業鏈最值錢、護城河最深的那幾個環節,然後把這些工具一層層賣給整個行業。
晶片設計的前端,被 Chip Nemo 這種內部 LLM 接管;設計中端的標準單元庫遷移、版圖優化,被 NB-Cell、Prefix RL 接管;整個 EDA 工具鏈,通過 Synopsys 的 20 億美元和 Cadence 的「獨家基於 Blackwell」綁在自家 GPU 上;製造端的光刻計算,被 cuLitho 接管,TSMC 已經在用。
從設計到製造,每一段 NVIDIA 都用 AI 重做了一遍。每一段最後都通向同一個終點:你想用最快的工具,就得買 NVIDIA 的卡。
對所有想造一顆能打敗 Blackwell 的晶片的對手來說,最尷尬的事情已經發生了。設計這顆晶片要用的 EDA 工具,跑得最快的版本在 NVIDIA 的 GPU 上;製造這顆晶片要做的光刻計算,最快的算法庫由 NVIDIA 提供;訓練設計 AI 用的算力,還是 NVIDIA 的卡。
你要打敗的那個人,正在向你出租打敗它所需要的全部工具。租金按年付,合同每年漲價。


