BTC
ETH
HTX
SOL
BNB
Xem thị trường
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

Toàn cảnh giao thức AI mã hóa: Từ chiến trường chính của Ethereum, làm thế nào để xây dựng hệ điều hành mới cho AI Agent?

imToken
特邀专栏作者
2026-04-16 02:00
Bài viết này có khoảng 4591 từ, đọc toàn bộ bài viết mất khoảng 7 phút
Khi AI Agent cần danh tính, cần thanh toán, cần được xác minh, blockchain đang trở thành hệ điều hành của chúng.
Tóm tắt AI
Mở rộng
  • Quan điểm cốt lõi: Năm 2026, sự hội tụ giữa blockchain và AI bước vào giai đoạn then chốt. Các blockchain công cộng như Ethereum đang nỗ lực xây dựng một chồng giao thức cơ sở hạ tầng mở, có thể xác minh cho các AI Agent tự vận hành, bao gồm danh tính, thanh toán, thực thi và xác minh, nhằm hướng dẫn AI phát triển trong môi trường có thể kiểm toán, có thể kiểm soát, thay vì chỉ đơn thuần tăng tốc khả năng của nó.
  • Yếu tố then chốt:
    1. Định vị chiến lược của Ethereum: Vitalik Buterin đề xuất Ethereum nên trở thành "lớp tin cậy" của thế giới AI, cốt lõi là để AI chạy trong môi trường có thể xác minh, có thể kiểm toán, phi tập trung, thay vì tham gia "cuộc đua AGI".
    2. Giao thức danh tính (ERC-8004): Cung cấp cho AI Agent một khuôn khổ tiêu chuẩn hóa về danh tính dựa trên NFT, danh tiếng dựa trên tương tác thực tế và xác minh năng lực của bên thứ ba, giải quyết vấn đề "Agent là ai".
    3. Giao thức thanh toán (x402): Tiêu chuẩn thanh toán HTTP mở do Linux Foundation tiếp quản, cho phép AI Agent truy cập liền mạch vào các API và dịch vụ trả phí thông qua các phương thức thanh toán như stablecoin, là "hệ thống thanh toán được thiết kế cho máy móc".
    4. Giao thức thực thi (ERC-8211): Nhằm mục đích đơn giản hóa các thao tác phức tạp trên chuỗi của AI Agent, cho phép thực thi nguyên tử các giao dịch DeFi nhiều bước thông qua cơ chế "xử lý hàng loạt thông minh", nâng cao hiệu quả.
    5. Cơ cấu phân công hệ sinh thái: Ethereum tập trung vào các tiêu chuẩn giao thức và lớp tin cậy; Solana với lợi thế độ trễ thấp, chi phí thấp, chiếm lĩnh các kịch bản ứng dụng thực tế ở lớp thanh toán và thực thi tần suất cao; các mạng lưới tính toán phi tập trung cung cấp hỗ trợ nền tảng.
    6. Chồng công nghệ bước đầu định hình: Bản đồ giao thức AI mã hóa đã hình thành phác thảo các lớp danh tính, lớp thanh toán, lớp thực thi và lớp xác minh (như zkML), các giao thức ở mỗi lớp bắt đầu tích hợp sâu.

Năm 2026 đang trở thành một bước ngoặt quan trọng trong sự giao thoa sâu sắc giữa Crypto và AI.

Hai năm qua, chúng ta đã chứng kiến sự biến đổi của AI từ "công cụ hỗ trợ" thành "tác nhân kinh tế tự chủ". AI Agent không còn chỉ là chatbot trả lời câu hỏi, chúng đã bắt đầu tự chủ khởi tạo giao dịch, gọi API, quản lý danh mục tài sản, thậm chí thuê các Agent khác để hoàn thành nhiệm vụ.

Nhưng tiền đề cho tất cả điều này là các Agent này cần có danh tính, cần kênh thanh toán, cần hồ sơ uy tín, cần môi trường thực thi có thể xác minh.

Và những nhu cầu này lại chính là những vấn đề mà blockchain giỏi giải quyết nhất.

Vẫn là chủ đề quen thuộc, Ethereum Foundation đã thành lập nhóm AI phi tập trung (dAI) vào tháng 9/2025, Vitalik Buterin đã công bố một khung chiến lược AI có hệ thống vào đầu năm 2026, và một loạt các tiêu chuẩn giao thức xoay quanh danh tính, thanh toán, thực thi của Agent đã được triển khai và chạy trên mainnet. Đồng thời, các hệ sinh thái blockchain mới như Solana cũng đang xây dựng cơ sở hạ tầng AI trên con đường riêng của họ.

Do đó, bài viết này cũng cố gắng lấy hệ sinh thái Ethereum làm trục chính, bổ sung bằng những tiến triển quan trọng từ các blockchain khác, để sắp xếp lại bản đồ toàn cảnh của các giao thức AI mã hóa hiện tại.

1. Bản thiết kế AI của Vitalik: Ethereum muốn trở thành "Lớp Tin cậy" của thế giới AI

Tháng 2/2026, Vitalik Buterin đã đăng một bài viết có hệ thống trên X, chuyên sửa đổi khung giao thoa "Crypto × AI" mà ông đề xuất hai năm trước.

Trong bài viết, ông đã xem xét lại các quan điểm đề xuất hai năm trước, cho rằng việc thúc đẩy nhanh chóng hướng tới trí tuệ nhân tạo phổ quát thường tương tự như tốc độ và quy mô không bị hạn chế mà chính Ethereum đã thách thức khi được tạo ra, và phản đối rõ ràng việc đơn giản hóa sự phát triển AI thành "cuộc đua AGI", thay vào đó chủ trương rằng Ethereum nên trở thành người dẫn đường cho thế giới AI.

Nói cách khác, điều ông thực sự quan tâm không phải là làm thế nào để AI mất kiểm soát nhanh hơn, mà là làm thế nào để sự mở rộng của AI được xây dựng trên cơ sở hạ tầng có thể xác minh, kiểm toán và kiềm chế.

Nhìn chung, khung của Vitalik bao gồm bốn trụ cột cốt lõi.

Đầu tiên là các công cụ tương tác AI đáng tin cậy. Ông ủng hộ việc sử dụng các công cụ như mô hình ngôn ngữ lớn cục bộ (local LLM), cơ chế thanh toán bằng chứng không tiết lộ thông tin (zero-knowledge proof) để cho phép người dùng sử dụng dịch vụ AI mà không tiết lộ danh tính và dữ liệu gốc.

Thái độ này không chỉ dừng lại ở diễn đạt trừu tượng. Tháng 4/2026, Vitalik còn công khai chia sẻ phương án sử dụng LLM cục bộ của mình. Sau khi thử nghiệm nhiều bộ phần cứng, ông chọn chạy mô hình mã nguồn mở Qwen3.5 với 35 tỷ tham số cục bộ trên máy tính được trang bị GPU NVIDIA 5090, tất cả tính toán được thực hiện cục bộ, mục tiêu là nâng tốc độ suy luận lên mức có thể sử dụng hàng ngày và giảm thiểu sự phụ thuộc vào các mô hình đám mây.

Tất nhiên, việc này có ý nghĩa biểu tượng lớn hơn ý nghĩa thực tế, nhưng cũng cho thấy ít nhất trong mắt ông, hướng đi thực sự đáng theo đuổi của AI không chỉ là các mô hình mạnh hơn, mà là các mô hình kiểm soát được hơn.

Thứ hai là lớp điều phối kinh tế của AI, điều này bao gồm việc Ethereum có thể hỗ trợ thanh toán lẫn nhau giữa các Agent, tiền ký quỹ an toàn, giải quyết tranh chấp và tích lũy uy tín thông qua hợp đồng thông minh, cho phép hình thành mối quan hệ kinh tế có thể lập trình giữa máy móc với nhau; Thứ ba là AI với tư cách là giao diện của Web3, ví dụ như trợ lý AI cục bộ có thể giúp người dùng soạn thảo giao dịch, kiểm toán hợp đồng thông minh, giải thích bằng chứng xác minh hình thức, trở thành cầu nối cho người bình thường bước vào thế giới trên chuỗi phức tạp.

Cuối cùng là hệ thống quản trị được tăng cường bởi AI, như việc sử dụng AI để nâng cấp các cơ chế như thị trường dự đoán, bỏ phiếu bậc hai, phân bổ vốn công, tìm ra sự cân bằng giữa tự động hóa và phán đoán của con người.

Nhìn chung, ý tưởng cốt lõi của khung này có thể được cô đọng thành một câu: Ethereum không nhằm mục đích tăng tốc AI, mà là để AI chạy trong một môi trường có thể xác minh, kiểm toán và phi tập trung.

Vậy cuối cùng phải thực hiện như thế nào?

2. Từ giao thức danh tính, đến giao thức thanh toán, đến giao thức thực thi, đến AI có thể xác minh

Nếu khung của Vitalik là bản thiết kế vĩ mô, thì làn sóng tiến hóa giao thức gần đây của hệ sinh thái Ethereum đã bắt đầu đưa phương pháp luận này vào ngăn xếp công nghệ cụ thể.

Nút cơ sở hạ tầng đầu tiên đáng chú ý nhất là ERC-8004.

Là tiêu chuẩn danh tính, uy tín và xác minh được Ethereum thiết kế cho AI Agent, nó do nhóm dAI của Ethereum Foundation dẫn đầu, cùng với sự tham gia xây dựng của Google, Coinbase và MetaMask, hầu như bao gồm ba cổng vào quan trọng: AI, giao dịch và ví (đọc thêm "Vé tàu mới cho thời đại AI Agent: Ethereum đang đặt cược vào điều gì khi thúc đẩy ERC-8004?").

Như tên chính thức của nó là Trustless Agents, logic cốt lõi của nó không phải là thuật toán phức tạp, mà nhằm mục đích cho phép AI có danh tính, danh tiếng và bằng chứng năng lực có thể xác minh trên chuỗi. Tóm tắt một cách đơn giản, thiết kế của nó rất kiềm chế, chỉ làm ba việc:

  • Sổ đăng ký danh tính: Dựa trên tiêu chuẩn ERC-721, mỗi AI Agent sẽ được "NFT hóa", có nghĩa là AI Agent có thể được tra cứu, tham chiếu, tích hợp vào các giao thức khác giống như địa chỉ ví;
  • Sổ đăng ký uy tín: Có thể hiểu là "Điểm bình luận đại chúng" của giới AI, cho phép người dùng hoặc Agent khác đã thực sự tương tác với Agent gửi phản hồi, và những đánh giá này có thể được liên kết với hành vi thanh toán hoặc ủy thác trên chuỗi, đảm bảo rằng danh tiếng không phải là câu chuyện được tạo ra từ hư không, mà là hồ sơ lịch sử được xây dựng dựa trên hành vi kinh tế thực tế;
  • Sổ đăng ký xác minh: Đối với các nhiệm vụ có giá trị cao hoặc rủi ro cao, danh tiếng lịch sử tự nó là không đủ, do đó ERC-8004 dành sẵn giao diện xác minh của bên thứ ba, cho phép xác nhận năng lực hoặc quá trình thực thi của Agent thông qua các phương thức như môi trường thực thi đáng tin cậy (TEE), bằng chứng không tiết lộ thông tin (ZK-proof);

Nếu danh tính trả lời câu hỏi "Agent là ai", thì cơ sở hạ tầng thanh toán đại diện bởi giao thức x402 trả lời câu hỏi "Agent giao dịch như thế nào".

Như đã biết, x402 là một giao thức thanh toán HTTP mở, được khởi xướng chung bởi Coinbase và Cloudflare, nguyên lý cơ bản của nó rất tinh tế, hồi sinh mã trạng thái 402 (Payment Required) vốn bị bỏ quên lâu nay trong giao thức HTTP. Khi một Agent cố gắng truy cập dịch vụ trả phí, máy chủ trả về mã trạng thái 402 và yêu cầu thanh toán, Agent hoàn thành thanh toán bằng stablecoin để có quyền truy cập.

Toàn bộ quá trình được nhúng trong yêu cầu HTTP, không cần đăng ký tài khoản, không cần thẻ tín dụng, không cần can thiệp thủ công. Nói cách khác, đây là một hệ thống thanh toán được thiết kế cho máy móc chứ không phải con người.

Đáng chú ý, ngay đầu tháng này, Linux Foundation đã chính thức tiếp quản x402 Foundation và nhận giao thức x402 do Coinbase đóng góp. Tuyên bố chính thức rất rõ ràng: x402 muốn làm là nhúng thanh toán trực tiếp vào tương tác HTTP, cho phép AI agents, API, ứng dụng trao đổi giá trị giống như trao đổi dữ liệu.

Tác giả cho rằng tầm quan trọng của tin này đã bị bỏ qua rất nhiều, một mặt là khả năng thâm nhập và ảnh hưởng quan trọng của x402 trong thanh toán AI và internet, mặt khác là đội hình cực kỳ ấn tượng. Tất nhiên, việc quảng bá x402 từ trước đến nay đều do các gã khổng lồ này thực hiện, nhưng lần này rõ ràng có hiệu ứng 1+1 lớn hơn 2.

Ngoài ra, phiên bản V2 của x402 cũng đang nỗ lực mở rộng phương thức thanh toán, bao gồm không chỉ hỗ trợ stablecoin trên chuỗi, mà còn tương thích với mạng lưới ACH (Automated Clearing House, hệ thống thanh toán bù trừ tự động) và thẻ ngân hàng truyền thống, để xóa nhòa ranh giới giữa AI Agent và hệ thống tài chính thực tế.

Cuối cùng, ngoài danh tính và thanh toán, mảnh ghép thứ ba mà Ethereum bổ sung gần đây, là lớp thực thi.

Tháng 4/2026, Biconomy cùng với hướng Cải thiện UX của Ethereum Foundation đã thúc đẩy ERC-8211, cố gắng giải quyết chính điểm nghẽn thực tế nhất của AI Agent trong thế giới DeFi, ví dụ như các thao tác phức tạp trên chuỗi thường không phải là một lần gọi, mà là một chuỗi thực thi nhiều bước, động và dễ bị lỗi.

Chúng ta thực sự có thể hiểu đơn giản nó như một cơ chế "xử lý hàng loạt thông minh" được thiết kế riêng cho AI Agent và các thao tác DeFi phức tạp, bởi vì trong các thao tác trên chuỗi truyền thống, việc hoàn thành một chiến lược DeFi phức tạp thường yêu cầu nhiều giao dịch độc lập: rút vốn từ giao thức cho vay, trao đổi token, sau đó gửi vào một giao thức khác.

Mỗi bước đều cần ký và xác nhận riêng biệt, điều này đã rườm rà đối với người dùng con người, và càng là nút thắt cổ chai đối với AI Agent cần thao tác tự chủ tần suất cao. Giải pháp của ERC-8211 là cho phép nhiều thao tác blockchain được kết hợp thực thi trong một giao dịch, mỗi bước phân tích giá trị thực tế động khi thực thi, và phải đáp ứng các điều kiện xác định trước mới có thể tiếp tục bước tiếp theo.

Ví dụ, một Agent có thể hoàn thành trong một giao dịch ký: Rút vốn từ Aave → Trao đổi số tiền thực tế nhận được trên Uniswap → Gửi kết quả trao đổi vào Compound — tất cả được thực thi nguyên tử, không cần viết hợp đồng thông minh mới.

Nhìn chung ba yếu tố này, đường hướng gần đây của Ethereum đã khá rõ ràng, đó là ERC-8004 trả lời "Bạn là ai, tại sao người khác tin bạn", x402 trả lời "Bạn thanh toán cho dịch vụ như thế nào", ERC-8211 trả lời "Bạn hoàn thành thao tác phức tạp

AI
Chào mừng tham gia cộng đồng chính thức của Odaily
Nhóm đăng ký
https://t.me/Odaily_News
Nhóm trò chuyện
https://t.me/Odaily_GoldenApe
Tài khoản chính thức
https://twitter.com/OdailyChina
Nhóm trò chuyện
https://t.me/Odaily_CryptoPunk
Tìm kiếm
Mục lục bài viết
Tải ứng dụng Odaily Nhật Báo Hành Tinh
Hãy để một số người hiểu Web3.0 trước
IOS
Android