“Bộ nhớ giảm một nửa” chỉ là sự hiểu lầm? Lợi ích thật và giả đằng sau đợt lao dốc của cổ phiếu AI bộ nhớ
- Quan điểm cốt lõi: Việc giảm cấu hình bộ nhớ hệ thống phía CPU của tủ rack Rubin của Nvidia đã gây ra sự điều chỉnh đồng loạt trong lĩnh vực cổ phiếu AI bộ nhớ, nhưng thị trường hiểu nhầm đây là sự sụt giảm đồng bộ của nhu cầu HBM. Tác động thực tế nằm ở việc phân bổ lại lợi nhuận, giá trị của SOCAMM/LPDDR phía CPU đối mặt với áp lực điều chỉnh giảm, trong khi logic nhu cầu HBM4 phía GPU tương đối độc lập.
- Các yếu tố chính:
- Báo cáo của SemiAnalysis chỉ ra rằng cấu hình bộ nhớ hệ thống phía CPU của tủ rack Rubin NVL72 có thể giảm từ khoảng 55 TB xuống còn 28 TB, khiến cổ phiếu Micron giảm 7,7% trong một ngày, và SK Hynix giảm hơn 8% vào ngày hôm sau; phản ứng của thị trường rất mạnh mẽ nhưng thiếu sự phân biệt chi tiết.
- Việc điều chỉnh chủ yếu nhắm vào SOCAMM và LPDDR phía CPU, có thể chuyển từ mô-đun 192 GB sang mô-đun 96 GB, ảnh hưởng đến giá trị bộ nhớ trên mỗi tủ rack; tác giả báo cáo làm rõ rằng sự điều chỉnh này không phải là "lợi ích tiêu cực thảm họa", nhưng dòng vốn trong các giao dịch đông đúc ưu tiên giảm vị thế trước.
- Nhu cầu HBM4 phía GPU không bị ảnh hưởng; thông tin hiện tại không cho thấy dung lượng HBM4 hoặc sản lượng xuất xưởng GPU Rubin bị điều chỉnh giảm; HBM vẫn được coi là khâu khan hiếm và có quyền định giá trong máy chủ AI, với SK Hynix là bên hưởng lợi chính.
- Chi phí tủ rack có thể giảm từ khoảng 7,6 triệu USD xuống còn 6,8 triệu USD (giảm khoảng 800.000 USD) do điều chỉnh cấu hình; kỳ vọng lạc quan cho rằng việc giảm cấu hình có thể đẩy nhanh tiến độ giao hàng và tăng tổng sản lượng xuất xưởng, nhưng suy luận này vẫn chưa được xác nhận bởi dữ liệu chính thức.
- Do Micron có mức độ tiếp xúc SOCAMM lớn, việc giảm giá trị trên mỗi đơn vị trực tiếp ảnh hưởng đến kỳ vọng doanh thu của họ; logic HBM của SK Hynix tương đối độc lập, nhưng sự liên kết tâm lý ngành khiến cổ phiếu này giảm theo; cần theo dõi sự phân tách doanh thu sản phẩm trong các báo cáo tài chính tiếp theo.
- Logic giao dịch ban đầu của thị trường là "càng nhiều tủ rack AI, càng thiếu bộ nhớ", nhưng sau khi tích lũy tăng giá, dòng vốn bắt đầu kiểm tra việc thực hiện lợi nhuận; sự kiện điều chỉnh SOCAMM đã gây ra sự thu hẹp mức độ chấp nhận rủi ro của ngành, và trên thực tế, điểm neo định giá được quyết định bởi dữ liệu xuất xưởng (tổng số tủ rack).
TL;DR
- Việc điều chỉnh giảm cấu hình bộ nhớ của hệ thống thùng máy Rubin gây ra đợt điều chỉnh đồng loạt của nhóm cổ phiếu bộ nhớ AI.
- Thị trường thực sự đang định giá lại không phải là nhu cầu bộ nhớ AI, mà là sự phân bổ lợi nhuận giữa các phân khúc bộ nhớ khác nhau.
- Các mã chứng khoán liên quan: MU (Mỹ), NVDA (Mỹ), 000660.KS (Hàn Quốc), 005930.KS (Hàn Quốc), SMH (ETF Mỹ), SOXX (ETF Mỹ)
Một báo cáo về chuỗi cung ứng thùng máy Rubin của Nvidia đã khiến nhóm cổ phiếu bộ nhớ AI giảm điểm trước tiên.
Báo cáo đề cập rằng dung lượng bộ nhớ mỗi thùng máy có thể giảm từ khoảng 55TB xuống còn khoảng 28TB. Ngay sau đó, Micron giảm khoảng 7,7% trong một ngày, SK Hynix giảm hơn 8% vào đầu phiên giao dịch ngày hôm sau. Tinh tế hơn, tác giả báo cáo Dylan Patel sau đó đã làm rõ rằng nhiều bài chia sẻ chỉ trích phần giật gân nhất, và đây không phải là một báo cáo "tiêu cực thảm họa".
Sự việc này gây ra phản ứng lớn như vậy bởi vì nó chạm vào vị trí nhạy cảm nhất của thị trường phần cứng AI. Trong một khoảng thời gian trước đó, thị trường giao dịch không phải là chu kỳ bộ nhớ thông thường, mà là sau khi nền tảng Rubin được sản xuất hàng loạt, các thùng máy AI sẽ tiếp tục thúc đẩy nhu cầu về HBM và bộ nhớ đi kèm, và doanh thu cũng như khả năng định giá của các nhà cung cấp bộ nhớ sẽ được nâng lên. Kể từ GTC năm nay, HBM4, thị phần của SK Hynix, và Micron đuổi theo bộ nhớ AI, đều là những chủ đề chính được thị trường giao dịch đi giao dịch lại.
Nhưng cách nói "bộ nhớ bị cắt" quá thô thiển.
Sự điều chỉnh được SemiAnalysis tiết lộ chủ yếu đề cập đến những thay đổi trong cấu hình SOCAMM và LPDDR ở phía CPU trong thùng máy Rubin NVL72. Hầu hết các hệ thống có thể sử dụng module 96GB thay vì module 192GB dung lượng cao hơn, khiến dung lượng bộ nhớ mỗi thùng máy giảm từ khoảng 55TB theo kế hoạch xuống còn khoảng 28TB. Sự thay đổi này sẽ ảnh hưởng đến giá trị bộ nhớ hệ thống trên mỗi thùng máy, nhưng chưa thể suy ra trực tiếp rằng nhu cầu HBM4 ở phía GPU cũng bị điều chỉnh giảm đồng bộ.
Điều thực sự cần phân tích rõ là sự điều chỉnh này ảnh hưởng đến nhóm lợi nhuận nào, và thị trường hiện đang giao dịch kỳ vọng nào.
Tại sao cổ phiếu bộ nhớ AI lại giảm mạnh hàng loạt?
Thị trường giảm là phản ứng điều chỉnh vị thế của các chủ đề nóng khi gặp phải từ khóa tiêu cực.
Phần đã được xác nhận hiện tại là phản ứng thị trường rất nặng nề, nhưng bản thân sự kiện vẫn chỉ dừng lại ở cấp độ báo cáo chuỗi cung ứng. SemiAnalysis tiết lộ rằng Nvidia, để đảm bảo tiến độ giao hàng Rubin NVL72, có thể sẽ điều chỉnh giảm cấu hình SOCAMM ở phía CPU. Các con số được đề cập trong báo cáo bao gồm dung lượng bộ nhớ thùng máy giảm từ khoảng 55TB xuống còn khoảng 28TB, và chi phí thùng máy giảm từ khoảng 7,6 triệu USD xuống còn khoảng 6,8 triệu USD. Những con số này nên được hiểu là theo cách tính của SemiAnalysis, chưa phải là BOM (Bảng vật liệu) cuối cùng do Nvidia xác nhận chính thức.

Trong vài quý vừa qua, cổ phiếu bộ nhớ AI tăng dựa trên một câu chuyện rất thuận lợi: càng nhiều thùng máy AI, bộ nhớ tiên tiến càng khan hiếm, lợi nhuận nhà cung cấp càng dày.
Câu chuyện càng đơn giản, sức sát thương của các tiêu đề tiêu cực càng lớn. Một khi "dung lượng bộ nhớ giảm một nửa" xuất hiện, thị trường sẽ trước tiên điều chỉnh giảm giá trị bộ nhớ trên mỗi thùng máy, hiếm khi phân biệt ngay lập tức loại bộ nhớ nào bị điều chỉnh.
Phản ứng của Micron cho thấy rõ nhất vấn đề.
Nó vừa là nhà cung cấp DRAM truyền thống, vừa là người hưởng lợi từ việc nâng cấp bộ nhớ máy chủ AI. Mức độ co giãn mà thị trường trước đây dành cho nó, một phần lớn đến từ sự định giá lại rằng "bộ nhớ AI không còn chỉ là hàng hóa chu kỳ". Nếu dung lượng bộ nhớ hệ thống của thùng máy Rubin giảm, dòng vốn sẽ ngay lập tức lo lắng liệu kỳ vọng doanh thu trên mỗi thùng máy của Micron ở các khâu SOCAMM và LPDDR có bị đẩy lên quá cao hay không.
SK Hynix cũng giảm theo, cho thấy tác động lần này đã vượt ra ngoài phạm vi một nhà cung cấp đơn lẻ.
Nó mạnh hơn trong lĩnh vực HBM, và thị trường trước đó còn đồn đoán rằng họ đã giành được phần lớn thị phần đơn hàng HBM liên quan đến Vera Rubin. Nhưng khi giao dịch bộ nhớ AI trở nên chật chội, dòng vốn sẽ không chờ đợi làm rõ mọi chi tiết rồi mới hành động. Cổ phiếu bộ nhớ giảm đồng loạt phản ánh sự thu hẹp mức độ ưa thích rủi ro của ngành, chứ không phải mọi công ty đều chịu cùng một cú sốc cơ bản.
Sự làm rõ sau đó của Dylan Patel cũng chỉ ra điều này. Ông nói rằng báo cáo không có ý định tạo ra một câu chuyện "thảm họa", và nhiều người đã bỏ qua bối cảnh.
Nói theo ngôn ngữ thị trường, đó là dòng vốn không giao dịch hoàn chỉnh một phân tích chuỗi cung ứng, mà là giao dịch việc giảm vị thế nhanh chóng của một ngành nóng khi gặp từ khóa tiêu cực.
Bộ nhớ AI bắt đầu phân chia lại nhóm lợi nhuận
Phần bị điều chỉnh giảm chủ yếu lần này là bộ nhớ hệ thống phía CPU, chứ không phải HBM4 bên cạnh GPU.
Bộ nhớ trong thùng máy Rubin không thể được tóm tắt bằng một từ duy nhất. Cách phân tích đơn giản nhất là hai lớp:
Lớp thứ nhất là HBM4 phía GPU, phục vụ cho chính chip tăng tốc;
Lớp thứ hai là SOCAMM và LPDDR phía CPU, giống như bộ nhớ hoạt động của toàn bộ hệ thống.

Lớp trước quyết định tốc độ nạp dữ liệu cho GPU, lớp sau ảnh hưởng đến việc điều phối toàn bộ máy, bảo trì và hiệu suất của một số khối lượng công việc nhất định.
"55TB xuống 28TB" mà SemiAnalysis đề cập, chủ yếu rơi vào bộ nhớ hệ thống phía CPU.
Nó có thể thay đổi số lượng module SOCAMM, dung lượng và giá trị mua sắm trên mỗi thùng máy Rubin NVL72. Nếu hầu hết các hệ thống chuyển từ module 192GB sang module 96GB, giá trị trên mỗi thùng máy của SOCAMM dung lượng cao thực sự giảm, và độ co giãn doanh thu của các nhà cung cấp liên quan sẽ chịu áp lực.
Nhưng HBM4 phía GPU là một câu chuyện khác.
Nền tảng Rubin vẫn xoay quanh Rubin GPU và Vera CPU, HBM4 vẫn là khâu bộ nhớ cốt lõi cho việc đóng gói GPU và giải phóng sức mạnh tính toán. Thông tin hiện tại không cho thấy dung lượng HBM4 hoặc sản lượng xuất xưởng Rubin GPU bị điều chỉnh giảm đồng bộ. Nhiều dự báo trước đó vẫn coi HBM là một trong những khâu khan hiếm nhất và có khả năng định giá mạnh nhất trong máy chủ AI, và SK Hynix cũng được thị trường coi là người hưởng lợi chính.
Có thể hiểu thùng máy AI như một máy chủ hiệu suất cao cực kỳ đắt đỏ.
HBM gần giống như bộ nhớ tốc độ cao gắn liền với GPU, trong khi SOCAMM giống như bộ nhớ hệ thống có thể thay thế của toàn bộ máy. Sự điều chỉnh chính lần này là ở cái sau.
Đối với các vị thế nắm giữ, sự khác biệt rất trực tiếp: nếu Micron có mức độ tiếp xúc lớn hơn ở khâu SOCAMM, việc điều chỉnh giảm giá trị trên mỗi thùng máy sẽ ảnh hưởng đến kỳ vọng của nó trước; logic HBM của SK Hynix tương đối độc lập, nhưng trong một giao dịch chật chội, nó cũng sẽ bị kéo xuống bởi tâm lý ngành.
Việc suy diễn trực tiếp việc giảm cấu hình bộ nhớ hệ thống thành sự sụp đổ nhu cầu HBM4 là chưa đủ bằng chứng.
Cách phân tích hợp lý hơn là, nhóm lợi nhuận phía CPU thực sự đang đối mặt với áp lực điều chỉnh giảm, trong khi HBM phía GPU vẫn phụ thuộc vào tổng sản lượng xuất xưởng Rubin và nhịp độ đơn hàng HBM4.
Diễn biến thị trường bộ nhớ AI không thể chỉ dùng một tuyến "bộ nhớ đều mạnh" để bao trùm tất cả các nhà cung cấp. Mức độ tiếp xúc của Micron, SK Hynix, Samsung Electronics trong HBM, SOCAMM, DRAM truyền thống và NAND là khác nhau, và các loại bộ nhớ khác nhau trong cùng một thùng máy cũng tương ứng với các mức giá, lợi nhuận gộp và ràng buộc cung cầu khác nhau.
Giảm chi phí có thể đổi lại nhiều thùng máy xuất xưởng hơn không?
Giải thích lạc quan đến từ chi phí và tiến độ giao hàng.
Tính toán của SemiAnalysis cho thấy chi phí thùng máy Rubin NVL72 có thể giảm từ khoảng 7,6 triệu USD xuống còn khoảng 6,8 triệu USD, mức giảm khoảng 800.000 USD.

Đối với các nhà cung cấp dịch vụ đám mây như Microsoft, Google, Amazon, Meta, thùng máy AI không chỉ đơn thuần là mua phần cứng, mà là tính toán chi phí sức mạnh tính toán mỗi giờ, thời gian cung ứng và sự ổn định khi triển khai quy mô lớn.
Nếu việc giảm cấu hình giúp Rubin được giao hàng nhanh hơn, thì một phần giá trị giảm trên mỗi thùng máy có thể được bù đắp bởi số lượng thùng máy nhiều hơn.
Logic không phức tạp. Nếu nguồn cung SOCAMM dung lượng cao bị thắt chặt, Nvidia chọn cấu hình dễ giao hàng hơn có thể giảm BOM mỗi thùng máy, đồng thời cũng giảm rủi ro một linh kiện nào đó làm tắc nghẽn việc giao hàng toàn bộ máy.
Đối với người mua, nếu cấu hình bộ nhớ hệ thống thấp hơn không ảnh hưởng đáng kể đến khối lượng công việc cốt lõi, thì việc nhận được thùng máy sớm hơn có thể hấp dẫn hơn là chờ đợi phiên bản đầy đủ.
Vấn đề là, bước này hiện vẫn chỉ là suy diễn.
Chi phí giảm không tự động đồng nghĩa với đơn hàng tăng. Để "giá trị trên mỗi thùng máy giảm" được bù đắp bởi "tổng số thùng máy tăng", Nvidia cần giao nhiều Rubin NVL72 hơn, và các nhà cung cấp dịch vụ đám mây cũng cần đặt thêm hoặc đặt hàng sớm hơn.
Tài liệu hiện tại chưa có đơn hàng công khai, hướng dẫn hàng quý hoặc dữ liệu xuất xưởng thực tế để chứng minh điều này.
Hiểu bằng một kịch bản đơn giản, nếu dung lượng của một loại SOCAMM nào đó trong một thùng máy gần như giả


