Dòng tiền AI hàng tháng của bạn đang bị ai chia sẻ? Một bức ảnh phân tích chuỗi cung ứng tính toán đằng sau 20 đô la
- Quan điểm cốt lõi: Phí đăng ký ứng dụng AI (ví dụ: Claude Pro 20 đô la/tháng) khác với SaaS truyền thống, vì chi phí suy luận biên của nó không bằng không. Các nhà đầu tư cần đánh giá lại giá trị của doanh thu ứng dụng AI, tập trung vào việc liệu tỷ suất lợi nhuận gộp có thể tiếp tục được cải thiện khi khối lượng sử dụng mở rộng hay không, thay vì đơn giản áp dụng logic định giá SaaS có biên lợi nhuận cao.
- Yếu tố chính:
- Phí cố định của đăng ký AI và chi phí suy luận biến đổi có mâu thuẫn cấu trúc. Mỗi lần người dùng đặt câu hỏi, tạo mã, v.v., đều tiêu thụ tài nguyên như GPU, điện năng. Khối lượng sử dụng càng lớn, chuỗi chi phí càng nặng, thách thức trực tiếp giả định về tỷ suất lợi nhuận gộp cao của SaaS truyền thống.
- Biểu đồ phân tích chi phí 20 đô la được lưu truyền trên thị trường cho thấy, phí được phân bổ cho các công ty mô hình, sức mạnh tính toán đám mây, khấu hao GPU, điện năng và chuỗi cung ứng. Giá trị cốt lõi nằm ở việc tiết lộ rằng 'tỷ suất lợi nhuận gộp theo trọng số sử dụng' mới là chìa khóa để định giá các công ty AI, chứ không phải là ý định thanh toán đơn thuần của người dùng.
- Trong ngắn hạn, sự tăng trưởng về khối lượng sử dụng AI chắc chắn hơn sẽ chảy về phía cơ sở hạ tầng (ví dụ: Nvidia, TSMC, nhà sản xuất HBM, công ty điện lực), vì doanh thu của họ được thúc đẩy bởi nhu cầu sức mạnh tính toán cứng nhắc, việc xác minh hiệu suất trực tiếp và nhanh chóng hơn.
- Quan điểm của phe hiệu quả cho rằng, các tiến bộ công nghệ như tối ưu hóa mô hình, định tuyến mô hình nhỏ, bộ nhớ đệm và chip tự thiết kế sẽ tiếp tục hạ thấp chi phí suy luận trên một đơn vị, tạo khả năng cải thiện tỷ suất lợi nhuận gộp của ứng dụng AI.
- Sự khác biệt cốt lõi nằm ở: liệu tốc độ giảm chi phí suy luận có thể vượt quá tốc độ tăng trưởng của khối lượng sử dụng trung bình của người dùng và độ phức tạp của nhiệm vụ hay không. Nếu cái sau nhanh hơn, tỷ suất lợi nhuận gộp có trọng số của các công ty ứng dụng AI vẫn sẽ chịu áp lực.
- Đối với việc đánh giá các công ty mô hình chưa niêm yết (ví dụ: OpenAI, Anthropic), cần chú ý đến cơ cấu người dùng của họ (tỷ lệ nặng nhẹ), định giá gói doanh nghiệp, cơ cấu chi phí đám mây và hiệu quả truyền dẫn thực tế của việc giảm chi phí suy luận trên một đơn vị, thay vì tổng số người dùng đăng ký.
TL;DR
- Biểu đồ phân tích chi phí đăng ký Claude 20 đô la, phân bổ phí AI hàng tháng cho các công ty mô hình, sức mạnh điện toán đám mây, GPU, điện năng và chuỗi cung ứng.
- Đăng ký AI có chi phí suy luận liên tục, không thể áp dụng trực tiếp giả định biên lợi nhuận cao của SaaS truyền thống.
- Các mã chứng khoán liên quan: OpenAI, Anthropic, Microsoft, Amazon, Google, Nvidia (NVDA), TSMC, SK Hynix, Samsung, Micron, trung tâm dữ liệu và chuỗi điện năng.
Một biểu đồ ước tính phân bổ khoản thanh toán hàng tháng khoảng 20 đô la Mỹ của Claude Pro cho các công ty mô hình, sức mạnh điện toán đám mây, khấu hao GPU, điện năng và chuỗi cung ứng đang khiến các nhà đầu tư thảo luận lại về cách định giá doanh thu từ ứng dụng AI.

Biểu đồ này không phải là dữ liệu phân chia doanh thu chính thức từ Anthropic, AWS hay Nvidia, và cũng không thể được coi là sổ sách thực tế của bất kỳ công ty nào. Giá trị của nó nằm ở việc đặt ra một câu hỏi cơ bản hơn: Bao nhiêu trong số tiền đăng ký mà người dùng trả cho các ứng dụng AI có thể được giữ lại dưới dạng lợi nhuận gộp phần mềm, tương tự như SaaS truyền thống?
Định giá của SaaS truyền thống rất rõ ràng. Sau khi phần mềm được viết xong, chi phí biên cho mỗi tài khoản mới thường thấp, và tỷ suất lợi nhuận gộp của các công ty phần mềm thuần túy trưởng thành thường ở mức 70% hoặc thậm chí trên 80%. Các nhà đầu tư sẵn sàng trả bội số cao vì khi quy mô doanh thu mở rộng, tỷ suất lợi nhuận có cơ hội tiếp tục tăng.
Rắc rối của các ứng dụng AI nằm ở chỗ, mỗi lần người dùng đặt câu hỏi, viết code, phân tích tệp hoặc gọi agent, đều tiêu tốn thời gian GPU, điện năng, băng thông bộ nhớ và tài nguyên đám mây. Bề ngoài là phí cố định hàng tháng, nhưng bên dưới là một chuỗi chi phí thay đổi theo mức độ sử dụng. Người dùng nhẹ có thể có lợi nhuận gộp cao, nhưng người dùng nặng, những người liên tục chạy các tác vụ trong giới hạn gói hoặc các gói công cụ liên quan, có thể khiến chi phí tăng nhanh.
Vì vậy, biểu đồ phân tích 20 đô la không nhằm thách thức việc công ty nào kiếm được bao nhiêu đô la, mà là "liệu doanh thu từ ứng dụng AI có tự nhiên bằng doanh thu SaaS hay không". Các công ty AI muốn chứng minh mình xứng đáng với bội số cao, không chỉ cần chứng minh người dùng sẵn sàng trả tiền, mà còn phải chứng minh tỷ suất lợi nhuận gộp, khi tính theo trọng số mức độ sử dụng, có thể liên tục được cải thiện.
Đằng sau phí đăng ký là một chuỗi chi phí suy luận
Sự khác biệt lớn nhất giữa đăng ký AI và đăng ký phần mềm thông thường là chi phí biên cho "một lần sử dụng" không còn gần bằng 0.
Trong SaaS truyền thống, khi một nhóm mở thêm một tài khoản, nhà cung cấp dịch vụ cũng có chi phí máy chủ, hỗ trợ khách hàng và băng thông, nhưng những chi phí này thường không tăng tuyến tính với mỗi lần nhấp chuột. Thứ thực sự đắt đỏ là nghiên cứu và phát triển ban đầu, bán hàng và thu hút khách hàng. Sau khi sản phẩm được mở rộng quy mô, một phần đáng kể doanh thu mới có thể được giữ lại.
Các sản phẩm mô hình lớn thì khác. Người dùng nhập câu hỏi, mô hình tạo ra câu trả lời, quá trình này được gọi là suy luận, tức là tính toán thực tế khi mô hình được người dùng gọi. Token là đơn vị đo lường cơ bản để mô hình đọc và viết văn bản. Người dùng hỏi càng nhiều, ngữ cảnh càng dài, nội dung tạo ra càng phức tạp, thì token và sức mạnh tính toán tiêu thụ càng nhiều.
Điều này tạo ra mâu thuẫn giữa đăng ký cố định và chi phí biến đổi. Khoản thanh toán hàng tháng của Claude Pro tại Mỹ là khoảng 20 đô la, giá có thể thay đổi tùy theo khu vực, thuế và điều chỉnh của Anthropic. Người dùng thấy một mức giá cố định, nhưng các công ty mô hình lại đối mặt với các hành vi sử dụng rất khác nhau. Có người chỉ viết email và tra cứu thông tin, người khác xử lý tài liệu dài, chạy tác vụ code hoặc gọi các quy trình tự động hóa phức tạp hơn.
Biểu đồ phân tích lan truyền trên thị trường cố gắng hình dung điều này: Trong 20 đô la, một phần dành cho công ty mô hình, một phần trả cho nhà cung cấp đám mây và sức mạnh tính toán. Chi phí tính toán bao gồm điện năng, vận hành và bảo trì, khấu hao GPU. Việc mua GPU sau đó chảy ngược lên Nvidia, TSMC, các nhà cung cấp HBM (bộ nhớ băng thông cao), mô-đun quang, ODM và các doanh nghiệp liên quan đến điện năng.

"Khấu hao GPU" ở đây có thể hiểu là GPU đắt tiền không được tính một lần vào chi phí, mà được phân bổ dần vào dịch vụ AI theo thời gian sử dụng, cường độ sử dụng hoặc phương pháp kế toán. Phân bổ thực tế bị ảnh hưởng bởi giới hạn gói, tỷ lệ người dùng nhẹ/nặng, giá thanh toán nội bộ của nhà cung cấp đám mây, chiết khấu sức mạnh tính toán dự trữ, tỷ lệ sử dụng GPU và thời gian khấu hao. Chi phí trung bình cũng không bằng chi phí biên.
Điều các nhà đầu tư thực sự cần theo dõi là xu hướng: Các công ty ứng dụng AI không chỉ công bố tăng trưởng doanh thu, mà còn phải trả lời liệu chi phí sức mạnh tính toán đằng sau tăng trưởng doanh thu có tăng đồng bộ hay không. Nếu khối lượng sử dụng mở rộng nhanh hơn hiệu quả mô hình, doanh thu đăng ký càng cao, áp lực lên lợi nhuận gộp càng rõ rệt. Chỉ khi cải thiện hiệu quả đủ nhanh, các công ty mô hình mới có cơ hội tiếp cận lại cấu trúc lợi nhuận của các công ty phần mềm.
Cơ sở hạ tầng nhận được doanh thu chắc chắn hơn trước
Ở giai đoạn hiện tại, tăng trưởng khối lượng sử dụng AI chảy trực tiếp hơn vào cơ sở hạ tầng, thay vì hoàn toàn lắng đọng ở lớp ứng dụng.
Bất kể người dùng sử dụng mô hình trên Claude, ChatGPT, Gemini hay agent nội bộ doanh nghiệp, suy luận cuối cùng đều phải dựa vào sức mạnh tính toán, điện năng, bộ nhớ và mạng. Lớp ứng dụng có thể có sự thay thế sản phẩm, nhưng mức tiêu thụ tài nguyên cơ bản có tính cứng nhắc hơn. Miễn là khối lượng sử dụng AI tiếp tục tăng, chi tiêu vốn cho đám mây, mua GPU, nhu cầu HBM và tiêu thụ điện của trung tâm dữ liệu sẽ được kéo theo.
Đây cũng là lý do tại sao chuỗi cơ sở hạ tầng như Nvidia, TSMC, SK Hynix liên tục được thị trường định giá lại. Tỷ suất lợi nhuận gộp tổng thể của Nvidia trong những năm gần đây ở mức cao. Tỷ suất lợi nhuận gộp GAAP và non-GAAP cho năm tài chính 2026 ước tính khoảng 71,1% và 71,3%, và hướng dẫn các quý tiếp theo cũng duy trì ở mức cao. Cần lưu ý rằng các quý riêng lẻ có thể bị ảnh hưởng bởi các khoản chi phí cụ thể, và báo cáo tài chính công khai không phải lúc nào cũng có thể tách biệt trực tiếp cấu trúc lợi nhuận gộp thực sự của trung tâm dữ liệu AI, nhưng thực tế là cơ sở hạ tầng khan hiếm có quyền định giá đã được phản ánh trong kết quả kinh doanh.
HBM là mắt xích điển hình nhất trong chuỗi này. Nó không phải là bộ nhớ thông thường, mà là thành phần chính hỗ trợ tính toán thông lượng cao trong các bộ tăng tốc AI. Khi quy mô mô hình, độ dài ngữ cảnh và nhu cầu suy luận đồng thời tăng lên, các chip AI phụ thuộc nhiều hơn vào bộ nhớ băng thông cao. Các ước tính chuỗi cung ứng cho thấy tỷ trọng của HBM trong chi phí chip AI thế hệ mới đang tăng lên, đây cũng là lý do quan trọng khiến SK Hynix, Samsung, Micron được định giá lại trong chu kỳ AI.
Điện năng và trung tâm dữ liệu cũng chuyển từ chi phí nền tảng thành chủ đề đầu tư chính. Mức tiêu thụ năng lượng cho một truy vấn văn bản thông thường có thể không quá lớn, nhưng các agent phức tạp, ngữ cảnh dài, tạo mã và các tác vụ nhiều vòng sẽ khuếch đại khối lượng tính toán. Đối với các nhà khai thác đám mây và trung tâm dữ liệu, điều quan trọng không phải là một truy vấn cụ thể tiêu thụ bao nhiêu điện, mà là khi có một lượng lớn yêu cầu suy luận liên tục xảy ra, tỷ lệ sử dụng cụm, giá điện, làm mát, dung lượng phòng máy và khả năng kết nối lưới điện đều trở thành chi phí và nút thắt cổ chai.
Lợi thế của phía cơ sở hạ tầng là xác minh kết quả kinh doanh nhanh hơn. Chi tiêu vốn AI của các nhà cung cấp đám mây đã xảy ra, doanh thu và lợi nhuận của Nvidia được phản ánh trong báo cáo tài chính, đơn đặt hàng và giá cả của các nhà sản xuất HBM cũng sẽ nhanh chóng đi vào báo cáo lãi lỗ. Lớp ứng dụng mô hình giao dịch nhiều hơn với kỳ vọng trong tương lai: chuyển đổi đăng ký, tỷ lệ thâm nhập doanh nghiệp, doanh thu API và giải phóng lợi nhuận sau khi đường cong chi phí giảm xuống.

Cải thiện hiệu quả vẫn là cốt lõi của phe đầu cơ giá lên
Các nhà đầu tư phần mềm và phe đầu cơ giá lên AI không phải là không có lý lẽ phản bác. Quan điểm cốt lõi của phe hiệu quả là chi phí suy luận cao ngày nay chỉ là hiện tượng giai đoạn đầu. Tối ưu hóa mô hình, bộ nhớ đệm, mô hình nhỏ, chip tự phát triển và tỷ lệ sử dụng cụm cao hơn sẽ liên tục giảm chi phí đơn vị. Miễn là chi phí giảm đủ nhanh, các ứng dụng AI vẫn có thể quay trở lại logic lợi nhuận gộp cao của phần mềm.
Sự phản bác này có cơ sở thực tế. Một số mô hình chính thống, với cùng hoặc khả năng cao hơn, đã giảm giá đơn vị đáng kể. OpenAI từng tiết lộ rằng GPT-4o mini đã giảm 99% chi phí mỗi token so với text-davinci-003 ban đầu. Nhịp độ của các công ty khác nhau không hoàn toàn giống nhau. Anthropic gần đây thể hiện nhiều hơn ở việc nâng cấp cùng giá và phân tầng mô hình, nhưng xu hướng của ngành vẫn là cung cấp khả năng mạnh hơn với chi phí thấp hơn.

Các công ty mô hình cũng có nhiều cách để cải thiện tính kinh tế đơn vị. Các tác vụ đơn giản được giao cho mô hình nhỏ, các yêu cầu phổ biến được tái sử dụng thông qua bộ nhớ đệm, ngữ cảnh dài và các tác vụ phức tạp được giao cho mô hình mạnh hơn. Các nhà cung cấp đám mây giảm chi phí sức mạnh tính toán đơn vị thông qua chip tự phát triển và điều phối cụm. Google có TPU, Microsoft ra mắt Maia dùng cho


