Để AI Agent tự động gọi API, mua quyền và hoàn tất thanh toán, ERC-8257 thực hiện điều này như thế nào?
- Quan điểm cốt lõi: OpenSea đề xuất bản thảo tiêu chuẩn ERC-8257, nhằm thiết lập một danh mục công cụ trên chuỗi phi tập trung và không cần cấp phép cho AI Agent, giúp chúng có thể tự động khám phá, hiểu các quy tắc truy cập, và sau khi đáp ứng điều kiện sẽ tự động hoàn tất việc gọi công cụ và thanh toán, lấp đầy khoảng trống về việc thiếu một tiêu chuẩn thống nhất và quy trình thanh toán khi AI Agent tự động gọi công cụ hiện nay.
- Các yếu tố chính:
- Động lực từ vấn đề: Khi gọi công cụ, AI Agent phải đối mặt với các rào cản như điểm truy cập phân tán, thiếu kênh khám phá thống nhất và quy trình thanh toán tiêu chuẩn, khó có thể tự động hoàn tất việc đăng ký, lấy chứng thực và xác minh quyền như người dùng con người.
- Kiến trúc cốt lõi – Sổ đăng ký công cụ: Cốt lõi của ERC-8257 là một hợp đồng thông minh trên chuỗi, dùng để ghi lại thông tin công cụ. Để giảm chi phí, mô tả chi tiết về công cụ (Manifest) được lưu trữ ngoài chuỗi dưới định dạng JSON, trên chuỗi chỉ ghi lại giá trị băm của nó để xác minh chống giả mạo.
- Quyền truy cập linh hoạt: Quyền truy cập được xác định thông qua các hợp đồng thông minh độc lập, nhà phát triển có thể tùy chỉnh các quy tắc (ví dụ: nắm giữ NFT cụ thể, Token hoặc hoàn tất đăng ký), yêu cầu AI Agent phải có được chứng thực tương ứng trước khi gọi.
- Tính mở và tương thích: Tiêu chuẩn này không giới hạn mô hình quyền (hỗ trợ Soulbound NFT hoặc điểm uy tín), cũng không định nghĩa logic thanh toán, mà chỉ khai báo các giao thức thanh toán được hỗ trợ (ví dụ: x402), để đối phó với rủi ro biến động giá và đầu cơ.
- Quy trình làm việc tự động hóa: AI Agent có thể khám phá công cụ bằng cách quét sổ đăng ký trên chuỗi, đọc quy tắc, lấy quyền và cuối cùng tự động hoàn tất thanh toán và gọi mà không cần sự can thiệp của con người.
- Thách thức tiềm ẩn: Định nghĩa quyền của các nhà phát triển khác nhau có sự khác biệt, khiến AI Agent khi gọi cần phải tương thích với logic phức tạp; đồng thời, tiêu chuẩn này không thể đảm bảo logic vận hành, độ tin cậy và khả năng sử dụng lâu dài của các công cụ ngoài chuỗi, cần phải dựa vào cơ chế uy tín bên ngoài.
Tác giả gốc: ShirleyLi, Nhà nghiên cứu tại Web3Caff Research
Làm thế nào để dễ dàng nắm bắt các điểm nóng thị trường, xu hướng công nghệ, tiến triển hệ sinh thái và tình hình quản trị đang diễn ra trong ngành Công nghệ Tài chính (FinTech) thế hệ mới? Chuyên mục "Phân tích Mạch đập Thị trường" của Web3Caff Research sẽ đi sâu vào thực tế, tìm kiếm và sàng lọc các sự kiện nóng hiện tại, đồng thời đưa ra những diễn giải giá trị, nhận xét và phân tích nguyên lý. Nhìn thấu bản chất qua hiện tượng, hãy ngay lập tức theo dõi chúng tôi để nhanh chóng nắm bắt xu hướng thị trường tuyến đầu.
So với người dùng là con người, lợi thế lớn nhất của AI Agent nằm ở khả năng thực thi tự chủ mạnh mẽ hơn trong điều kiện lý tưởng: nó có thể tự mình hoàn thành nhiệm vụ, tự thực hiện các thao tác và chủ động gọi các công cụ bên ngoài mà không cần sự can thiệp liên tục của con người. Tuy nhiên, trong quá trình thực tế AI Agent gọi các công cụ (ví dụ: API sàn giao dịch, công cụ phân tích dữ liệu, oracle), vẫn sẽ gặp phải một số vấn đề.
Đầu tiên, các điểm truy cập của những công cụ này bị phân tán trên GitHub, trang web chính thức, nền tảng API tập trung, v.v., thiếu một kênh khám phá thống nhất. AI Agent rất khó tự động định vị và kết nối với các công cụ cần thiết nếu không có sự can thiệp của con người. Hơn nữa, phương thức thanh toán cụ thể của các nền tảng khác nhau cũng khác biệt, thiếu một quy trình tiêu chuẩn hóa. Điều này gây ra một số khó khăn cho quá trình gọi công cụ của AI Agent.
Thứ hai, trên internet truyền thống, việc gọi API thường yêu cầu nhà phát triển đăng ký tài khoản, lấy API Key và thực hiện xác thực quyền theo các quy tắc cụ thể. Quy trình này vốn được thiết kế cho những người tham gia là con người, nhưng đối với AI Agent, để tự động hoàn tất đăng ký, lấy thông tin xác thực và gọi công cụ, hiện vẫn thiếu các giải pháp triển khai công khai và tiêu chuẩn hóa.
Mặc dù hiện tại giao thức x402 đã có thể hỗ trợ AI Agent tự động hoàn tất thanh toán, nhưng nó chủ yếu áp dụng cho các giao diện mở kiểu "trả tiền là dùng", khó đối phó với các tình huống phân quyền phức tạp hơn, ví dụ: chỉ người dùng đã đăng ký mới có thể truy cập dịch vụ, hoặc người dùng có một loại chứng chỉ nào đó mới được hưởng chiết khấu ưu đãi, v.v.
Để lấp đầy khoảng trống này, OpenSea gần đây đã thử nghiệm đưa ra bản thảo tiêu chuẩn ERC-8257, nhằm mục đích thiết lập một danh mục công cụ trên chuỗi mở và không cần cấp phép cho AI Agent, cho phép AI Agent có thể tự động khám phá công cụ, hiểu các quy tắc truy cập và sau khi đáp ứng đủ điều kiện, tự động hoàn tất việc gọi và thanh toán.
Nói một cách đơn giản, cốt lõi của ERC-8257 là một sổ đăng ký công cụ trên chuỗi. Sổ đăng ký này về bản chất là một hợp đồng thông minh, cho phép các nhà phát triển công cụ đăng ký thông tin liên quan và quyền truy cập của công cụ lên chuỗi, công khai cho toàn mạng.
Tuy nhiên, do chi phí đưa toàn bộ dữ liệu trực tiếp lên chuỗi khá cao, ERC-8257 cho phép nhà phát triển lưu trữ thông tin chi tiết hơn về công cụ trên máy chủ hoặc tên miền do họ tự quản lý, dưới dạng tệp định dạng JSON (Manifest), trong khi sổ đăng ký trên chuỗi chỉ ghi lại liên kết đến tệp đó. Tệp ngoài chuỗi này thường bao gồm: tên công cụ, mô tả chức năng, giao diện API, cách thức gọi, thông tin định giá, giao thức thanh toán, quy tắc truy cập, v.v. Còn sổ đăng ký trên chuỗi cần ghi lại địa chỉ của tệp ngoài chuỗi, giá trị băm của tệp và thông tin nhà phát triển công cụ, v.v. Thiết kế này nhằm ngăn chặn nhà phát triển tự ý sửa đổi nội dung công cụ sau này. Khi AI Agent gọi công cụ, nó có thể xác minh nội dung ngoài chuỗi có khớp với thông tin đã đăng ký trên chuỗi hay không bằng cách kiểm tra giá trị băm của tệp.
Trong ERC-8257, còn có một thiết kế rất quan trọng: quyền truy cập không phải là định dạng cố định, mà được xác định thông qua một hợp đồng thông minh độc lập. Nhà phát triển công cụ có thể tự do định nghĩa hợp đồng này để quy định ai có tư cách gọi công cụ của họ. Ví dụ, nhà phát triển có thể kiểm tra xem AI Agent có nắm giữ một loại NFT nào đó, có nắm giữ một loại Token nào đó, đã đăng ký hay chưa, có nằm trong danh sách trắng nào đó hay không, v.v.
Hãy xem một ví dụ: Một công cụ phân tích trên chuỗi quy định: phí gọi API thông thường cho người dùng là 0,05 đô la Mỹ/lần, trong khi người dùng nắm giữ một loại NFT nào đó chỉ phải trả 0,01 đô la Mỹ/lần. Đồng thời, nếu người dùng đăng ký dịch vụ của họ (thanh toán liên tục thông qua Token chỉ định hoặc giao thức thanh toán), họ còn có thể có quyền truy cập vào giao diện phân tích nâng cao.
Trong kịch bản này, "nắm giữ một loại NFT nào đó", "đăng ký dịch vụ" là hai loại chứng chỉ truy cập đặc biệt. Nếu AI Agent hiện không có quyền tương ứng, nó có thể mua các điều kiện này (ví dụ: mua NFT hoặc hoàn tất đăng ký) trên chuỗi hoặc trên thị trường, sau đó gửi lại yêu cầu gọi.
Nhưng cần lưu ý rằng, khi quyền truy cập tồn tại dưới dạng tài sản như NFT hoặc Token, bản thân chúng có thể tham gia vào hệ thống lưu thông thị trường, do đó chịu ảnh hưởng của cung cầu, dẫn đến biến động giá trị cao hoặc hành vi đầu cơ.
Vì vậy, ERC-8257 không giới hạn hệ thống phân quyền ở một mô hình tài sản duy nhất, mà chọn cách duy trì tính mở. Các nhà phát triển công cụ hoặc dịch vụ có thể chọn các cơ chế truy cập khác nhau dựa trên nhu cầu cụ thể, ví dụ: giới thiệu Soulbound NFT (NFT gắn liền với linh hồn) không thể chuyển nhượng để tránh biến động giá trị do hành vi giao dịch, hoặc giới thiệu các cơ chế phi tài sản như điểm uy tín để giảm tác động của hành vi đầu cơ.
Về mặt thanh toán, ERC-8257 cũng không chịu trách nhiệm định nghĩa logic thanh toán cụ thể, mà chỉ yêu cầu nhà phát triển khai báo trong tệp JSON xem hỗ trợ giao thức thanh toán nào, ví dụ: x402, thanh toán ERC-20 trên chuỗi, hoặc các giao thức thanh toán máy móc khác. Việc thực thi thanh toán thực tế sẽ do giao thức tương ứng hoàn thành.
Nhìn từ quy trình tổng thể, cách thức hoạt động của ERC-8257 như sau:
- Nhà phát triển công cụ triển khai dịch vụ công cụ, viết quyền truy cập tương ứng, sau đó gửi thông tin liên quan lên sổ đăng ký trên chuỗi;
- Khi AI Agent cần gọi một công cụ hoặc dịch vụ nào đó, nó có thể quét sổ đăng ký trên chuỗi, tìm thấy công cụ hoặc dịch vụ phù hợp với nhu cầu của mình, sau đó có thể đọc thêm tệp mô tả chi tiết để hiểu các quy tắc gọi;
- Nếu AI Agent không đáp ứng điều kiện truy cập, nó có thể cố gắng lấy quyền tương ứng, sau đó thực hiện gọi lại;
- Cuối cùng, AI Agent có thể tự động hoàn thành toàn bộ quy trình khám phá công cụ, xác thực quyền, thanh toán và gọi mà không cần sự tham gia của con người.

Nguồn ảnh: The App Store for Agent Tools: ERC-8257
Nhìn chung, ERC-8257 cố gắng giải quyết không chỉ đơn thuần là vấn đề làm thế nào để đưa API lên chuỗi, mà còn là làm thế nào AI Agent có thể, giống như người dùng là con người, tự động khám phá công cụ, hiểu các quy tắc truy cập, lấy quyền truy cập và gọi các công cụ này theo cách thức tiêu chuẩn hóa. Từ mục tiêu thiết kế, ERC-8257 sẽ hình thành mối quan hệ bổ sung cùng với giao thức x402:
- ERC-8257 hứa hẹn cho phép AI Agent khám phá công cụ trên phạm vi toàn cầu và dựa trên các quy tắc để xác định xem mình có quyền truy cập hay không;
- Giao thức x402 chịu trách nhiệm thanh toán và quyết toán trong quá trình gọi công cụ. Sau khi công cụ được phép gọi, nó hỗ trợ AI Agent thanh toán theo từng lần hoặc theo tần suất gọi.
Tuy nhiên, ngoài việc như đã đề cập ở trên, nếu quyền truy cập tồn tại dưới dạng tài sản như NFT hoặc Token, có thể gây ra biến động giá trị và rủi ro đầu cơ, tiêu chuẩn ERC-8257 trong quá trình triển khai thực tế còn có thể đối mặt với một số thách thức rủi ro tiềm ẩn khác.
Ví dụ, mặc dù ERC-8257 cung cấp một khuôn khổ đăng ký và truy cập công cụ tiêu chuẩn hóa, nhưng các nhà phát triển khác nhau vẫn có sự khác biệt khi đặt ra các điều kiện truy cập. Mặc dù AI Agent có thể dựa vào đường dẫn lập chỉ mục trên chuỗi thống nhất ở cấp độ khám phá công cụ, nhưng trong quá trình gọi thực tế, nó vẫn cần tương thích với các logic xác định quyền khác nhau, điều này sẽ mang lại một độ phức tạp kỹ thuật nhất định.
Ngoài ra, về mặt cơ chế tin cậy, hiện tại AI Agent sẽ so sánh giá trị băm được ghi lại trên chuỗi với tệp mô tả công cụ ngoài chuỗi để xác minh xem tệp có bị giả mạo trong quá trình truyền tải hay không. Tuy nhiên, cơ chế này chỉ có thể giải quyết vấn đề dữ liệu có nhất quán hay không, chứ không thể đảm bảo thêm rằng logic vận hành của công cụ có đúng hay không, giao diện của nó có đáng tin cậy hay không, và liệu có rủi ro rò rỉ thông tin tiềm ẩn trong quá trình xử lý dữ liệu hay không. Đồng thời, vì các dịch vụ công cụ thường được triển khai trên cơ sở hạ tầng ngoài chuỗi, tính khả dụng và ổn định lâu dài của chúng vẫn phụ thuộc vào năng lực vận hành của nhà phát triển, điều này có nghĩa là AI Agent cũng cần phải sàng lọc thông qua các cơ chế uy tín bên ngoài.
Từ đó có thể thấy, trước khi tiêu chuẩn ERC-8257 được áp dụng thực tế, nó vẫn cần được xác minh và hoàn thiện thêm ở các khía cạnh như độ tin cậy của công cụ, tính nhất quán của các quy tắc phân quyền, v.v.
Sơ đồ cấu trúc chính:

Tài liệu tham khảo:
[1] The App Store for Agent Tools: ERC-8257
[2] ERC-8257: Agent Tool Registry
Tuyên bố miễn trừ trách nhiệm
Báo cáo này do Web3Caff Research biên soạn, thông tin trong đó chỉ mang tính tham khảo, không cấu thành bất kỳ dự báo hay khuyến nghị đầu tư, đề xuất ho


