Toàn văn bài phát biểu của Jensen Huang tại GTC: Thời đại suy luận đã đến, tôm hùm là hệ điều hành mới
- Quan điểm cốt lõi: Tại hội nghị GTC 2026, NVIDIA đã trình bày quá trình chuyển đổi từ một công ty sản xuất chip sang "công ty cơ sở hạ tầng và nhà máy AI", đồng thời dựa trên logic kinh doanh "Kinh tế học nhà máy Token", đưa ra dự báo nhu cầu mạnh mẽ ít nhất 1 nghìn tỷ USD vào năm 2027.
- Yếu tố then chốt:
- Hướng dẫn kết quả kinh doanh: Jensen Huang cho biết, NVIDIA dự báo nhu cầu đến năm 2027 ít nhất là 1 nghìn tỷ USD và tin rằng nhu cầu thực tế sẽ cao hơn, dự báo này từng thúc đẩy cổ phiếu tăng hơn 4,3%.
- Kinh tế học nhà máy Token: Trung tâm dữ liệu trong tương lai là "nhà máy" sản xuất AI Token, dưới giới hạn điện năng cố định, hệ thống có thông lượng Token cao nhất trên mỗi watt có chi phí sản xuất thấp nhất, trực tiếp quyết định doanh thu.
- Đột phá công nghệ: Hệ thống tính toán AI thế hệ mới Vera Rubin thông qua thiết kế hợp tác từ đầu đến cuối, đã nâng tốc độ tạo Token lên 350 lần trong vòng hai năm, vượt xa mức tăng 1,5 lần theo Định luật Moore.
- Cách mạng hệ sinh thái và phần mềm: Dự án mã nguồn mở OpenClaw được coi là "hệ điều hành" của thời đại Agent, Jensen Huang khẳng định tất cả các công ty SaaS đều sẽ chuyển đổi thành công ty AaaS (Agent như một dịch vụ).
- Cấu trúc thị trường: 60% hoạt động kinh doanh của NVIDIA đến từ năm nhà cung cấp dịch vụ đám mây hàng đầu, 40% phân bổ rộng rãi trên các lĩnh vực như đám mây chủ quyền, doanh nghiệp, công nghiệp, robot và điện toán biên, cho thấy sự phủ sóng ngành rộng rãi.
Tác giả gốc: Bao Yilong
Nguồn gốc: Wall Street Insights

Ngày 16 tháng 3 năm 2026, Hội nghị GTC 2026 của NVIDIA chính thức khai mạc, người sáng lập kiêm CEO NVIDIA, Jensen Huang, đã có bài phát biểu chính.
Tại hội nghị được coi là "cuộc hành hương hàng năm của ngành AI" này, Jensen Huang đã trình bày sự chuyển mình của NVIDIA từ một "công ty chip" thành một "công ty cơ sở hạ tầng và nhà máy AI". Đối mặt với vấn đề được thị trường quan tâm nhất về tính bền vững của kết quả kinh doanh và không gian tăng trưởng, Jensen Huang đã phân tích chi tiết logic kinh doanh cốt lõi thúc đẩy tăng trưởng trong tương lai - "Kinh tế học Nhà máy Token".
Hướng dẫn kết quả kinh doanh cực kỳ lạc quan, "Nhu cầu ít nhất 1 nghìn tỷ USD vào năm 2027"
Hai năm qua, nhu cầu tính toán AI toàn cầu đã bùng nổ theo cấp số nhân. Khi các mô hình lớn tiến hóa từ "nhận thức", "tạo sinh" sang "suy luận" và "hành động (thực hiện nhiệm vụ)", mức tiêu thụ sức mạnh tính toán đã tăng vọt. Đối với vấn đề trần đơn hàng và doanh thu được thị trường hết sức quan tâm, Jensen Huang đã đưa ra kỳ vọng cực kỳ mạnh mẽ.
Jensen Huang thẳng thắn nói trong bài phát biểu:
Vào thời điểm này năm ngoái, tôi đã nói rằng chúng tôi thấy nhu cầu xác suất cao 500 tỷ USD, bao phủ Blackwell và Rubin cho đến năm 2026. Bây giờ, ngay tại đây, tôi thấy ít nhất 1 nghìn tỷ USD nhu cầu (ít nhất 1 nghìn tỷ USD) vào năm 2027.

Kỳ vọng nghìn tỷ của Jensen Huang từng thúc đẩy cổ phiếu NVIDIA tăng hơn 4,3%.

Không chỉ vậy, ông còn bổ sung cho con số này:
Điều đó có hợp lý không? Đó là điều tôi sẽ nói tiếp theo. Thực tế, chúng tôi thậm chí sẽ không đủ cung cấp. Tôi chắc chắn, nhu cầu tính toán thực tế sẽ cao hơn nhiều so với con số này.
Jensen Huang chỉ ra rằng hệ thống NVIDIA hiện nay đã chứng minh mình là "cơ sở hạ tầng chi phí thấp nhất toàn cầu". Vì NVIDIA có thể chạy các mô hình AI trong hầu hết mọi lĩnh vực, tính phổ dụng này cho phép 1 nghìn tỷ USD mà khách hàng đầu tư được tận dụng triệt để và duy trì vòng đời lâu dài.
Hiện tại, 60% hoạt động kinh doanh của NVIDIA đến từ năm nhà cung cấp dịch vụ đám mây siêu lớn hàng đầu, trong khi 40% còn lại phân bổ rộng rãi trên các lĩnh vực như đám mây chủ quyền, doanh nghiệp, công nghiệp, robot và điện toán biên.
Kinh tế học Nhà máy Token, Hiệu suất trên mỗi Watt quyết định mạch máu kinh doanh
Để giải thích tính hợp lý của nhu cầu 1 nghìn tỷ này, Jensen Huang đã trình bày cho các CEO doanh nghiệp toàn cầu một tư duy kinh doanh hoàn toàn mới. Ông chỉ ra rằng trung tâm dữ liệu trong tương lai không còn là kho lưu trữ tệp, mà là "nhà máy" sản xuất Token (đơn vị cơ bản do AI tạo ra).

Jensen Huang nhấn mạnh:
Theo định nghĩa, mọi trung tâm dữ liệu, mọi nhà máy đều bị giới hạn bởi điện năng. Một nhà máy 1GW (gigawatt) sẽ không bao giờ trở thành 2GW, đó là định luật của vật lý và nguyên tử. Với công suất cố định, ai có thông lượng Token trên mỗi watt cao nhất, chi phí sản xuất của người đó sẽ thấp nhất.
Jensen Huang chia các dịch vụ AI trong tương lai thành năm cấp độ kinh doanh:
- Cấp miễn phí (thông lượng cao, tốc độ thấp)
- Cấp trung cấp (~3 USD mỗi triệu token)
- Cấp cao cấp (~6 USD mỗi triệu token)
- Cấp tốc độ cao (~45 USD mỗi triệu token)
- Cấp siêu tốc (~150 USD mỗi triệu token)
Ông chỉ ra rằng khi các mô hình ngày càng lớn và ngữ cảnh ngày càng dài, AI sẽ trở nên thông minh hơn, nhưng tốc độ tạo token sẽ giảm. Jensen Huang nói:
Trong nhà máy Token này, thông lượng và tốc độ tạo token của bạn sẽ trực tiếp chuyển thành doanh thu chính xác của bạn vào năm sau.
Jensen Huang nhấn mạnh kiến trúc của NVIDIA cho phép khách hàng đạt được thông lượng cực cao ở cấp miễn phí, đồng thời tăng hiệu suất lên 35 lần đáng kinh ngạc ở cấp suy luận có giá trị cao nhất.

Vera Rubin đạt tốc độ 350 lần trong hai năm, Groq lấp đầy khoảng trống suy luận cực nhanh
Dưới ràng buộc của giới hạn vật lý này, NVIDIA giới thiệu hệ thống tính toán AI phức tạp nhất từ trước đến nay của họ, Vera Rubin. Jensen Huang nói:
Trước đây khi nhắc đến Hopper, tôi sẽ giơ một con chip lên, điều đó rất dễ thương. Nhưng khi nhắc đến Vera Rubin, mọi người nghĩ đến toàn bộ hệ thống. Trong hệ thống làm mát bằng chất lỏng 100%, hoàn toàn loại bỏ cáp truyền thống này, giá đỡ trước đây cần hai ngày để lắp đặt, bây giờ chỉ cần hai giờ.
Jensen Huang chỉ ra rằng thông qua thiết kế phối hợp phần mềm-phần cứng đầu cuối đến đầu cuối tối ưu, Vera Rubin đã tạo ra bước nhảy vọt dữ liệu đáng kinh ngạc trong cùng một trung tâm dữ liệu 1GW:
Trong vòng hai năm ngắn ngủi, chúng tôi đã tăng tốc độ tạo token từ 22 triệu lên 700 triệu, đạt mức tăng trưởng 350 lần. Định luật Moore trong cùng thời kỳ chỉ có thể mang lại cải tiến khoảng 1,5 lần.
Để giải quyết nút cổ chai băng thông trong điều kiện suy luận cực nhanh (như 1000 Tokens/giây), NVIDIA đã đưa ra giải pháp cuối cùng để tích hợp công ty được mua lại Groq: suy luận phân tách không đối xứng. Jensen Huang giải thích:
Hai bộ xử lý này có đặc điểm hoàn toàn khác nhau. Chip Groq có 500MB SRAM, trong khi một chip Rubin có 288GB bộ nhớ.

Jensen Huang chỉ ra rằng NVIDIA thông qua hệ thống phần mềm Dynamo, giao giai đoạn "điền trước (Pre-fill)" cần lượng tính toán và bộ nhớ đồ họa khổng lồ cho Vera Rubin, và giao giai đoạn "giải mã" cực kỳ nhạy cảm với độ trễ cho Groq. Jensen Huang cũng đưa ra đề xuất về cấu hình sức mạnh tính toán cho doanh nghiệp:
Nếu công việc của bạn chủ yếu là thông lượng cao, sử dụng 100% Vera Rubin; nếu bạn có nhiều nhu cầu tạo token cấp lập trình có giá trị cao, hãy dành 25% quy mô trung tâm dữ liệu cho Groq.
Theo tiết lộ, chip Groq LP30 do Samsung sản xuất đã được sản xuất hàng loạt, dự kiến xuất xưởng vào quý ba, trong khi giá đỡ Vera Rubin đầu tiên đã chạy trên đám mây Microsoft Azure.
Ngoài ra, đối với công nghệ kết nối quang, Jensen Huang đã trình diễn bộ chuyển mạch quang học đóng gói chung (CPO) Spectrum X đầu tiên trên thế giới được sản xuất hàng loạt, và xoa dịu cuộc tranh luận về lộ trình "đồng rút, quang tiến" trên thị trường:
Chúng tôi cần nhiều công suất cáp đồng hơn, nhiều công suất chip quang hơn, nhiều công suất CPO hơn.
Agent kết thúc SaaS truyền thống, "Lương hàng năm + Token" trở thành tiêu chuẩn ở Thung lũng Silicon
Ngoài rào cản phần cứng, Jensen Huang dành nhiều thời gian cho cuộc cách mạng phần mềm và hệ sinh thái AI, đặc biệt là sự bùng nổ của Agent (tác nhân thông minh).
Ông mô tả dự án mã nguồn mở OpenClaw là "dự án mã nguồn mở được yêu thích nhất trong lịch sử loài người", nói rằng nó chỉ mất vài tuần để vượt qua thành tựu mà Linux đạt được trong 30 năm qua. Jensen Huang thẳng thắn nói, OpenClaw về bản chất là "hệ điều hành" của máy tính Agent.
Jensen Huang khẳng định:
Mọi công ty SaaS (Phần mềm như một Dịch vụ) sẽ trở thành công ty AaaS (Agent-as-a-Service, Tác nhân Thông minh như một Dịch vụ). Không còn nghi ngờ gì nữa, để đảm bảo an toàn cho loại tác nhân thông minh có khả năng truy cập dữ liệu nhạy cảm và thực thi mã này, NVIDIA đã ra mắt thiết kế tham chiếu cấp doanh nghiệp NeMo Claw, bổ sung động cơ chính sách và bộ định tuyến riêng tư.
Đối với người lao động bình thường, cuộc cách mạng này cũng đang rất gần. Jensen Huang mô tả hình thái mới của nơi làm việc trong tương lai:
Trong tương lai, mỗi kỹ sư trong công ty chúng tôi sẽ cần một ngân sách token hàng năm. Lương cơ bản hàng năm của họ có thể là vài trăm nghìn USD, tôi sẽ lấy thêm khoảng một nửa số tiền đó làm hạn mức token cho họ, để họ đạt được hiệu suất tăng 10 lần. Điều này đã trở thành lá bài tuyển dụng mới ở Thung lũng Silicon: offer của bạn đi kèm bao nhiêu token?
Cuối bài phát biểu, Jensen Huang còn "tiết lộ" kiến trúc tính toán thế hệ tiếp theo Feynman, lần đầu tiên thực hiện mở rộng quy mô ngang đồng thời cho cáp đồng và CPO. Gợi mở hơn nữa, NVIDIA đang nghiên cứu và phát triển máy tính trung tâm dữ liệu triển khai trong không gian "Vera Rubin Space-1", hoàn toàn mở ra không gian tưởng tượng cho sức mạnh tính toán AI mở rộng ra ngoài Trái đất.
Toàn văn bài phát biểu GTC 2026 của Jensen Huang, bản dịch toàn văn như sau (có sự hỗ trợ của công cụ AI):
Người dẫn chương trình: Xin chào mừng người sáng lập kiêm Giám đốc điều hành NVIDIA, Jensen Huang, lên sân khấu.
Jensen Huang, Người sáng lập kiêm Giám đốc điều hành:
Chào mừng đến với GTC. Tôi muốn nhắc nhở mọi người rằng đây là một hội nghị công nghệ. Thật vui khi thấy rất nhiều người xếp hàng vào cửa từ sáng sớm, thật vui khi thấy tất cả các bạn ở đây.
Tại GTC, chúng tôi sẽ tập trung vào ba chủ đề chính: Công nghệ, Nền tảng và Hệ sinh thái. NVIDIA hiện có ba nền tảng: Nền tảng CUDA-X, Nền tảng Hệ thống và nền tảng mới nhất của chúng tôi, Nền tảng Nhà máy AI.
Trước khi bắt đầu, tôi muốn cảm ơn những người dẫn chương trình khởi động của chúng tôi - Sarah Guo từ Conviction, Alfred Lin từ Sequoia Capital (nhà đầu tư mạo hiểm đầu tiên của NVIDIA) và nhà đầu tư tổ chức chính đầu tiên của NVIDIA, Gavin Baker. Ba người này có hiểu biết sâu sắc về công nghệ và có ảnh hưởng rộng khắp toàn bộ hệ sinh thái công nghệ. Tất nhiên, tôi cũng muốn cảm ơn tất cả các khách mời đặc biệt mà tôi đã mời cá nhân tham dự ngày hôm nay.


