BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

SemiAnalysis拆解华为麒麟9030:制程受阻,折叠开路

深潮TechFlow
特邀专栏作者
2026-06-15 08:20
本文約3320字,閱讀全文需要約5分鐘
SemiAnalysis拆解華為麒麟9030:製程受阻,摺疊開路出口管制沒有阻止中國的晶片進步,但改變了進步的路徑和代價。
AI總結
展開
  • 核心觀點:SemiAnalysis最新拆解報告顯示,中芯國際透過成本高昂的純DUV工藝,在N+3製程上實現了與台積電N6相當的邏輯密度,但代價是複雜度與成本劇增;華為則在製程受限下,轉向透過3D堆疊路徑以突破性能瓶頸。
  • 關鍵要素:
    1. SMIC N+3製程的電晶體密度達113.4 MTr/mm²,略超台積電N6(107.7 MTr/mm²),其最小金屬間距(32.5nm)甚至優於Intel 18A製程(36nm),但這是刻意挑選的指標。
    2. SMIC為實現高密度,在M0層採用自對準四重圖案化(SAQP),相比台積電的雙重圖案化(SADP),成本更高、工藝控制更複雜,導致溝槽呈倒梯形輪廓。
    3. 麒麟9030 GPU性能(Maleoon 935)追平2022年旗艦(略超驍龍8+ Gen 1),但CPU大核IPC處於2021年Arm Cortex-X2水平,與最新蘋果M5相比性能差距達2.7倍。
    4. 華為提出τ縮放定律和LogicFolding路線圖,計劃透過3D垂直堆疊邏輯模組,在2031年將大核頻率推至5GHz,等效密度對標台積電14A級別。
    5. 出口管制改變了中國晶片進步路徑:SMIC製程向華虹擴散,華為旗艦供應鏈已引入長鑫存儲DRAM,國產EDA工具正在為3D堆疊做協同優化。

在半导体逆向工程領域,TechInsights 統治了幾十年。上週末,Dylan Patel 的 SemiAnalysis 正式發佈了旗下 STEEL 實驗室(Teardown Engineering & Evaluation Lab)的第一份公開拆解報告,對象直指全球最受關注的晶片之一,華為 Mate 80 Pro 搭載的麒麟 9030 Pro,採用中芯國際最先進的 N+3 製程。

時機耐人尋味。TechInsights 正在被私募股權出售,而 SemiAnalysis 的營收已經超過了這家老牌巨頭。Dylan 選擇在這個節點亮劍,用的是一份技術含量極高的拆解報告,配合俄勒岡州實驗室的實拍晶片照片。

報告的標題就是一顆炸彈:SMIC N+3 的最小金屬間距(M0 pitch)僅 32.5nm,比 Intel 最新 Panther Lake 處理器使用的 18A 製程的 36nm 還小。

中芯國際在沒有 EUV 光刻機的情況下,金屬間距做到了比 Intel 還細?

這條消息如果只看標題,足以讓整個半導體圈炸鍋,但 SemiAnalysis 自己在報告第二段就潑了冷水,這是一個"cherry picked metric",一個被刻意挑選的指標。

本文將為你解讀這份拆解報告,

密度追平,代價高昂

SMIC 的 N+3 製程在電晶體密度上,確實追平了台積電的 N6。

STEEL 實驗室透過 TEM(透射電子顯微鏡)截面分析,測量出 N+3 的 Bohr 密度為 113.4 MTr/mm²,略高於台積電 N6 的 107.7 MTr/mm²。單元高度從 N+2 的 252nm 縮減到 228nm,接觸閘極間距(CGP)從 63nm 縮減到 57nm。這些數字放在一起,意味著 SMIC 在沒有 EUV 的條件下,透過純 DUV 光刻,把邏輯密度做到了台積電成熟 7nm 級別。

代價是什麼?

SMIC 的 M0 層使用的是自對準四重圖案化(SAQP),即把一張光罩的圖案經過四次加工來實現更精細的線條。台積電 N6 在同一層只需要雙重圖案化(SADP)。四重意味著更多的光罩數量、更高的套刻精度要求、更複雜的工藝流程,以及更高的成本。

SemiAnalysis 在截面圖中直接看到了 SAQP 的代價:N+3 的 M0 溝槽呈現明顯的倒梯形輪廓(底部比頂部窄),溝槽底部有清晰的阻擋層富集帶。這種形貌雖然有助於銅填充,但在 32.5nm 這個間距上,工藝控制的難度急劇上升。

用一個交易員能聽懂的比喻:SMIC 在做同樣面額的鈔票,但每張的印刷成本是台積電的數倍,而且良率風險更大。密度一樣,經濟學完全不同。

麒麟 9030:在受限條件下,把每一吋矽片都榨乾

華為海思的晶片設計能力是另一個維度的故事。

從晶片面積看,麒麟 9030 和上一代 9020 幾乎一樣大(約 140mm²),但內部塞進了更多的東西:CPU 從 1 個大核 +3 個中核升級到 1 大 +4 中,GPU 計算單元從 4 個增加到 6 個,NPU 也多了一個 Tiny 核心,各級快取全線擴容。N+3 的密度提升讓華為在同樣的晶片尺寸裡裝下了更多邏輯單元。

性能上,STEEL 實驗室引用了公開跑分數據,給出的定位很清晰:麒麟 9030 的 GPU 性能(Maleoon 935)大致追平了 2022 年的旗艦級別,3DMark WLE 跑分比上一代提升 70%,略超驍龍 8+ Gen 1,但與當前旗艦驍龍 8 Elite Gen 5 相比,差距在 2.4 到 2.6 倍。

CPU 的情況更能說明問題。大核 TaiShan Prime 的每時脈性能(IPC)大致處於 Arm Cortex-X2 水準,一個 2021 年的設計。蘋果 2020 年發佈的 M1 Firestorm 核心,IPC 仍然高出 35%。最新的 Apple M5 P 核心,IPC 高出 60%,絕對性能是 2.7 倍。

差距的根源不在設計,在製程。蘋果和高通用的是台積電 N4、N3P,這些製程在電壓-頻率曲線上有本質優勢:同樣面積可以塞進更多電晶體,同樣功耗可以跑更高頻率。華為的核心設計水準對標的是行業一線的上一代,但被困在了兩代以前的製造工藝裡。

當製程走不動了,華為準備「摺疊」

報告最具前瞻價值的部分,是華為在 2026 年 ISCAS 會議上公佈的τ縮放定律和 LogicFolding 路線圖。

傳統的半導體縮放在二維平面上推進:把電晶體做小,把金屬線做細。摩爾定律走了幾十年,本質就是在幹這件事。華為現在提出的τ縮放,把優化目標從空間域轉移到了時間域,核心是縮短數據移動和處理的時間成本,包括電晶體開關延遲、訊號傳播延遲、計算和儲存的延遲。

LogicFolding 是這套理論的工程實現。簡單說,就是把同一個邏輯模組拆成上下兩層,面對面堆疊,透過超精細間距的混合鍵合連接。這樣做的直接好處是縮短了最長的訊號路徑。現代晶片裡,很大一部分功耗和延遲花在了驅動長連線和中繼緩衝器上。把邏輯垂直摺疊後,關鍵路徑變短,頻率可以上去,功耗可以下來。

華為給出了一條激進的路線圖:麒麟 9030 的大核頻率是 2.75GHz,實驗室裡已經跑通 3.39GHz 的樣片,目標是 2031 年達到 5GHz,同時透過 3D 堆疊將等效密度推到 295 MTr/mm²,對標台積電 14A 級別。

SemiAnalysis 對此保持警惕。他們指出,華為的密度計算方式和傳統代工廠不同:3D 堆疊的密度是按封裝面積算的,把多層有源邏輯疊在一起,自然會得到更高的數字。如果用同樣的方法去算 AMD 的 MI450X(N2 頂層+N3P 底層),理論密度高達 460.2 MTr/mm²,遠超華為 2031 年的目標。

但方向本身值得重視。華為走這條路,本質上是在製程受限的前提下,把「代工廠的活攬到了系統設計公司身上」。AMD 的 V-Cache 在快取上做 3D 堆疊,AMD MI350X 把 IO 和互連挪到底層晶片,華為要做的更徹底,直接把同一個邏輯塊拆開,垂直分佈,這在工程難度上是另一個量級的挑戰。

出口管制重塑了競賽的維度

SemiAnalysis 最後的結論直截了當:出口管制沒有阻止中國的晶片進步,但改變了進步的路徑和代價。

SMIC 的 N+3 證明,不用 EUV 也能做到 N6 級別的邏輯密度。但這條路的成本更高,工藝更複雜,良率更難控制。往下走,每一步的邊際難度都在加大:更多的光罩、更嚴格的套刻精度、更昂貴的多重圖案化。理論上 N+4 可以做到 137.8 MTr/mm²(對標台積電 N5),N+5 如果加入背面供電,甚至可以接近 Intel 18A 的 HP 庫。但每一步都比上一步更難、更貴、容錯空間更小。

與此同時,SMIC 的 N+2 和 N+3 製程正在向華虹轉移,阿里平頭哥、寒武紀等設計公司也可能成為受益者。晶片製造知識從單一代工廠向生態系統擴散,這讓針對單一企業的制裁效力進一步稀釋。

而在設計端,華為和北京大學已經在為 LogicFolding 開發國產 EDA 工具原型。這不等於替代了 Synopsys 和 Cadence 的完整工具鏈,但國產 EDA 正在朝著「架構-製程-封裝協同優化」的方向演進。

一個有意思的細節:STEEL 在拆解中發現,麒麟 9030 Pro 的 DRAM 來自三星(K4L2E165YD, LPDDR5X-9600, 1a 工藝節點),而 16GB 的 Pro Max 版本同時出現了三星和長鑫存儲(CXMT)的封裝。長鑫的晶片封裝日期標註為 2025 年第 45 週,製程密度與業界 1z 級別相當。這意味著中國存儲晶片已經開始進入華為旗艦供應鏈,儘管製程仍落後於三星和 SK 海力士一到兩代。

對投資者而言,真正值得跟蹤的信號在於華為的 3D 堆疊路線能不能在成本可控的前提下,讓中國產晶片在手機、AI 推理、網路設備等場景中達到夠用的門檻。

一旦夠用成立,這條供應鏈的戰略價值就會被重新定價。

AI
歡迎加入Odaily官方社群