Jensen Huang's Latest Article: The "Five-Layer Cake" of AI
- Core Viewpoint: Nvidia believes artificial intelligence (AI) is evolving into infrastructure akin to electricity and the internet. Its industry can be deconstructed into a five-layer technology stack: energy, chips, infrastructure, models, and applications. This represents an unprecedented global industrial construction project, still in its early stages.
- Key Elements:
- The AI technology stack is divided into five layers: the foundational layer is energy, followed upwards by chips, data centers and other infrastructure, AI models, and finally the application layer that generates economic value.
- The core shift in AI is moving from "prefabricated software" to intelligence that can understand unstructured information and "generate in real-time," which requires the entire computing technology stack to be reinvented.
- The construction of AI as infrastructure is massive in scale. Current investments are only in the hundreds of billions of dollars, but trillions will be needed in the future, creating numerous technical jobs such as electricians and operations/maintenance personnel.
- Over the past year, AI models have crossed critical thresholds in reasoning capabilities and reducing hallucinations, beginning to create real economic value in fields like drug discovery and customer service.
- Open-source models (such as DeepSeek‑R1), while driving application growth, also stimulate demand across the entire underlying technology stack for computing power, chips, and energy.
Tác giả gốc: Jensen Huang
Biên dịch gốc: Peggy, BlockBeats
Lời tựa của biên tập viên: Trí tuệ nhân tạo đang dần phát triển từ một công nghệ tiên phong thành cơ sở hạ tầng hỗ trợ vận hành nền kinh tế hiện đại. Trong bài viết dài đầu tiên được đăng trên tài khoản chính thức của mình, NVIDIA đã cố gắng xuất phát từ nguyên lý cơ bản để hệ thống hóa cấu trúc ngành công nghiệp AI: từ năng lượng và chip, đến cơ sở hạ tầng trung tâm dữ liệu, rồi đến mô hình và ứng dụng, tạo thành một chồng công nghệ hoàn chỉnh gồm năm tầng.
Bài viết chỉ ra rằng AI không chỉ là cuộc cạnh tranh về phần mềm hay mô hình, mà là một cuộc xây dựng công nghiệp toàn cầu liên quan đến năng lượng, sức mạnh tính toán, sản xuất và ứng dụng, với quy mô có thể trở thành một trong những sự mở rộng cơ sở hạ tầng lớn nhất trong lịch sử nhân loại. Thông qua góc nhìn "chiếc bánh năm tầng" này, NVIDIA cố gắng giải thích: Ý nghĩa thực sự của AI không chỉ là phần mềm thông minh hơn, mà là một cuộc cách mạng cơ sở hạ tầng với quy mô sánh ngang với điện lực và internet.
Dưới đây là nội dung gốc:
Trí tuệ nhân tạo là một trong những lực lượng mạnh mẽ nhất đang định hình thế giới ngày nay. Nó không phải là một ứng dụng thông minh, cũng không phải là một mô hình đơn lẻ, mà là một loại cơ sở hạ tầng, quan trọng như điện lực và internet.
AI vận hành trên phần cứng thực, năng lượng thực và hệ thống kinh tế thực. Nó biến nguyên liệu thô thành "trí tuệ" được sản xuất trên quy mô lớn. Mọi công ty sẽ sử dụng nó, mọi quốc gia sẽ xây dựng nó.
Để hiểu tại sao AI lại triển khai theo cách này, việc xuất phát từ nguyên lý cơ bản và xem xét những thay đổi căn bản thực sự đang diễn ra trong lĩnh vực tính toán sẽ rất hữu ích.
Từ "Phần mềm được tạo sẵn" đến "Trí tuệ được tạo ra theo thời gian thực"
Trong phần lớn lịch sử phát triển của máy tính, phần mềm đều được "tạo sẵn". Con người trước tiên mô tả một thuật toán, sau đó máy tính thực thi theo chỉ dẫn. Dữ liệu phải được cấu trúc hóa cẩn thận, lưu vào bảng và được truy xuất thông qua các truy vấn chính xác. SQL trở nên không thể thiếu vì nó cho phép toàn bộ hệ thống này hoạt động.
Và AI đã phá vỡ mô hình này.
Lần đầu tiên, chúng ta sở hữu một loại máy tính có thể hiểu thông tin phi cấu trúc. Nó có thể xem hình ảnh, đọc văn bản, nghe âm thanh và hiểu ý nghĩa của chúng; nó có thể suy luận ngữ cảnh và ý định. Quan trọng hơn, nó có thể tạo ra trí tuệ theo thời gian thực.
Mỗi phản hồi đều là một lần tạo mới. Mỗi câu trả lời đều phụ thuộc vào ngữ cảnh bạn cung cấp. Đây không còn là việc phần mềm truy xuất các chỉ dẫn có sẵn từ cơ sở dữ liệu, mà là phần mềm đang suy luận theo thời gian thực và tạo ra trí tuệ theo nhu cầu.
Chính vì trí tuệ được tạo ra theo thời gian thực, toàn bộ chồng công nghệ tính toán hỗ trợ nó cũng phải được phát minh lại.
AI với tư cách là Cơ sở hạ tầng
Nếu nhìn AI từ góc độ ngành công nghiệp, nó thực tế có thể được chia tách thành một cấu trúc năm tầng.
Năng lượng (Energy)
Tầng dưới cùng là năng lượng.
Trí tuệ được tạo ra theo thời gian thực cần điện năng được tạo ra theo thời gian thực. Việc tạo ra mỗi token đều có nghĩa là các electron đang di chuyển, nhiệt lượng đang được quản lý, năng lượng đang được chuyển hóa thành khả năng tính toán.
Bên dưới tầng này, không có bất kỳ sự trừu tượng hóa nào. Năng lượng là nguyên lý đầu tiên của cơ sở hạ tầng AI, và cũng là ràng buộc cơ bản quyết định hệ thống có thể sản xuất bao nhiêu trí tuệ.
Chip (Chips)
Trên năng lượng là chip. Mục tiêu thiết kế của các bộ xử lý này là chuyển hóa năng lượng thành khả năng tính toán với hiệu suất cực cao, trong điều kiện quy mô lớn.
Khối lượng công việc AI đòi hỏi khả năng tính toán song song khổng lồ, bộ nhớ băng thông cao và kết nối tốc độ cao. Sự tiến bộ ở tầng chip quyết định tốc độ mở rộng của AI, và cũng quyết định cuối cùng "trí tuệ" sẽ trở nên rẻ đến mức nào.
Cơ sở hạ tầng (Infrastructure)
Trên chip là cơ sở hạ tầng. Điều này bao gồm đất đai, truyền tải điện, hệ thống tản nhiệt, công trình xây dựng, hệ thống mạng và hệ thống điều phối tổ chức hàng chục nghìn bộ xử lý thành một cỗ máy.
Về bản chất, các hệ thống này là nhà máy AI. Chúng không được thiết kế để lưu trữ thông tin, mà để sản xuất trí tuệ.
Mô hình (Models)
Trên cơ sở hạ tầng là các mô hình. Mô hình AI có thể hiểu các loại thông tin khác nhau: ngôn ngữ, sinh học, hóa học, vật lý, tài chính, y học và bản thân thế giới thực.
Mô hình ngôn ngữ chỉ là một loại trong số đó. Một trong những công việc mang tính biến đổi nhất đang diễn ra trong các lĩnh vực sau: AI protein, AI hóa học, mô phỏng vật lý, robot, hệ thống tự trị.
Ứng dụng (Applications)
Tầng trên cùng là tầng ứng dụng, nơi giá trị kinh tế thực sự được tạo ra. Ví dụ: nền tảng phát hiện thuốc, robot công nghiệp, trợ lý pháp lý Copilot, xe tự hành.
Về bản chất, một chiếc xe tự hành là một "ứng dụng AI được mang theo bởi máy móc"; một robot hình người thì là một "ứng dụng AI được mang theo bởi cơ thể". Chồng công nghệ cơ bản là như nhau, chỉ là hình thức thể hiện cuối cùng khác nhau.
Vì vậy, đây là cấu trúc năm tầng của AI: Năng lượng → Chip → Cơ sở hạ tầng → Mô hình → Ứng dụng. Mỗi ứng dụng thành công sẽ kéo theo tất cả các tầng bên dưới, cho đến nhà máy điện ở tầng dưới cùng cung cấp năng lượng cho nó.
Một Cuộc Xây Dựng Cơ Sở Hạ Tầng Vẫn Còn Ở Giai Đoạn Đầu
Chúng ta mới chỉ bắt đầu cuộc xây dựng này. Quy mô đầu tư hiện tại chỉ là vài nghìn tỷ đô la, trong khi tương lai vẫn cần xây dựng cơ sở hạ tầng trị giá hàng chục nghìn tỷ đô la.
Trên phạm vi toàn cầu, chúng ta đang chứng kiến: Nhà máy sản xuất chip, nhà máy lắp ráp máy tính, nhà máy AI.
Đang được xây dựng với quy mô chưa từng có. Điều này đang trở thành một trong những cuộc xây dựng cơ sở hạ tầng lớn nhất trong lịch sử nhân loại.
Nhu Cầu Lao Động Trong Thời Đại AI
Quy mô lực lượng lao động cần thiết để hỗ trợ việc xây dựng này là rất lớn.
Nhà máy AI cần: Thợ điện, thợ sửa ống nước, thợ lắp đặt đường ống, công nhân kết cấu thép, kỹ thuật viên mạng, nhân viên lắp đặt thiết bị, nhân viên vận hành và bảo trì
Đây đều là những vị trí có kỹ năng cao, được trả lương hậu hĩnh và hiện đang cực kỳ thiếu hụt. Tham gia vào quá trình chuyển đổi này không nhất thiết phải có bằng tiến sĩ khoa học máy tính.
Đồng thời, AI đang thúc đẩy tăng năng suất trong nền kinh tế tri thức. Lấy ngành X-quang làm ví dụ. AI đã bắt đầu hỗ trợ đọc phim y tế, nhưng nhu cầu về bác sĩ X-quang vẫn đang tăng.
Điều này không mâu thuẫn.
Trách nhiệm thực sự của bác sĩ X-quang là chăm sóc bệnh nhân, và đọc phim chỉ là một phần công việc. Khi AI đảm nhận ngày càng nhiều nhiệm vụ lặp đi lặp lại, bác sĩ có thể dành nhiều thời gian hơn cho việc đánh giá, giao tiếp và điều trị.
Hiệu quả của bệnh viện được nâng cao, có thể phục vụ nhiều bệnh nhân hơn, và do đó cũng cần nhiều nhân lực hơn. Năng suất tạo ra năng lực, năng lực tạo ra tăng trưởng.
Điều Gì Đã Thay Đổi Trong Năm Qua?
Trong năm qua, AI đã vượt qua một ngưỡng cửa quan trọng.
Các mô hình đã đủ tốt để thực sự phát huy tác dụng trong các kịch bản quy mô lớn.
- Khả năng suy luận được cải thiện đáng kể
- Ảo giác giảm đáng kể
- "Mỏ neo" với thế giới thực (grounding) được tăng cường mạnh mẽ
Lần đầu tiên, các ứng dụng dựa trên AI bắt đầu tạo ra giá trị kinh tế thực sự.
Đã xuất hiện sự phù hợp thị trường sản phẩm rõ ràng trong các lĩnh vực sau: Nghiên cứu và phát triển thuốc, hậu cần, dịch vụ khách hàng, phát triển phần mềm, sản xuất
Những ứng dụng này đang kéo mạnh toàn bộ chồng công nghệ cơ bản bên dưới.
Vai Trò Của Mô Hình Mã Nguồn Mở
Mô hình mã nguồn mở đóng vai trò then chốt trong đó. Phần lớn mô hình AI trên thế giới là miễn phí. Các nhà nghiên cứu, công ty khởi nghiệp, doanh nghiệp và thậm chí cả các quốc gia đều dựa vào mô hình mã nguồn mở để tham gia cuộc cạnh tranh AI tiên tiến.
Khi mô hình mã nguồn mở đạt đến trình độ công nghệ tiên phong, chúng không chỉ thay đổi phần mềm mà còn kích hoạt nhu cầu cho toàn bộ chồng công nghệ.
DeepSeek‑R1 là một ví dụ điển hình. Bằng cách làm cho một mô hình suy luận mạnh mẽ có sẵn rộng rãi, nó thúc đẩy sự tăng trưởng nhanh chóng ở tầng ứng dụng, đồng thời cũng làm tăng nhu cầu về sức mạnh tính toán cho đào tạo, cơ sở hạ tầng, chip và năng lượng.
Điều Này Có Nghĩa Là Gì?
Khi bạn coi AI là cơ sở hạ tầng, mọi thứ trở nên rõ ràng. AI có thể bắt đầu với Transformer và mô hình ngôn ngữ lớn, nhưng nó còn hơn thế rất nhiều.
Đó là một cuộc biến đổi ở cấp độ công nghiệp, sẽ định hình lại:
- Cách thức sản xuất và tiêu thụ năng lượng
- Cách thức xây dựng nhà máy
- Cách thức tổ chức công việc
- Mô hình tăng trưởng kinh tế
Nhà máy AI được xây dựng vì trí tuệ giờ đây có thể được tạo ra theo thời gian thực. Chip được thiết kế lại vì hiệu quả quyết định tốc độ mở rộng của trí tuệ. Năng lượng trở thành cốt lõi vì nó quyết định hệ thống có thể sản xuất tối đa bao nhiêu trí tuệ. Ứng dụng bùng nổ vì các mô hình cuối cùng đã vượt qua ngưỡng "có thể sử dụng trên quy mô lớn".
Mỗi tầng đang củng cố các tầng khác.
Đó là lý do tại sao quy mô của cuộc xây dựng này lại lớn như vậy, tại sao nó đồng thời ảnh hưởng đến


