1. Giới thiệu
Với sự phát triển của Mô hình Ngôn ngữ Lớn (LLM), việc tương tác với blockchain thông qua ngôn ngữ tự nhiên đã trở thành một hướng phát triển quan trọng của Web3. Orcamind đã ra mắt Ví Đại lý AI Orcamind dựa trên Giao thức Bối cảnh Mô hình (MCP). Không giống như các ví truyền thống phản hồi thụ động theo hướng dẫn của người dùng, quản lý các địa chỉ riêng biệt và các giao dịch đơn lẻ, Ví Đại lý AI vượt qua những hạn chế của quản lý khóa riêng tư và chữ ký giao dịch đơn lẻ, đồng thời tập trung vào việc cung cấp cho người dùng khả năng vận hành đa chuỗi an toàn và tự động. Nó cung cấp cho người dùng một giải pháp tương tác thông minh trên chuỗi đơn giản, nhanh chóng và bảo mật. Bài viết này sẽ khám phá sâu hơn về kiến trúc kỹ thuật tiên tiến này, đồng thời phân tích chi tiết các nguyên lý hoạt động, lợi thế cốt lõi và cách nó có thể mang lại cho người dùng trải nghiệm Web3 an toàn và thuận tiện hơn.
2. Các khái niệm cốt lõi
Trước khi tìm hiểu sâu hơn về kiến trúc, trước tiên chúng ta cần hiểu hai khái niệm chính:
2.1 MCP (Giao thức ngữ cảnh mô hình)
MCP (Model Context Protocol) là một giao thức truyền thông chuẩn hóa trong lĩnh vực AI, nhằm mục đích giải quyết vấn đề tích hợp các mô hình lớn (LLM) với các nguồn dữ liệu, công cụ và dịch vụ bên ngoài.
Thỏa thuận được chia thành:
MCP Client: Các thiết bị đầu cuối tương tác của người dùng (như Claude, Cursor và Orcamind App) trực tiếp nhận các lệnh ngôn ngữ tự nhiên từ người dùng, phân tích ý định của người dùng thông qua mô hình ngôn ngữ lớn, khớp các công cụ tương ứng và trích xuất các tham số mà công cụ yêu cầu.
Máy chủ MCP: thực thi logic công cụ và cung cấp phản hồi cho Máy khách
Các nhà phát triển có thể mở rộng chức năng bằng cách đăng ký các công cụ mới (như staking, tương tác Dapp) mà không cần sửa đổi giao thức cốt lõi. Đối với ứng dụng Orcamind, dịch vụ MCP đóng vai trò là cầu nối giữa mô hình ngôn ngữ và tương tác blockchain.
2.2 Ví AI Agent
AI Agent Wallet là một ứng dụng ví thông minh do Orcamind đề xuất và được hỗ trợ bởi một tác nhân back-end đáng tin cậy. Thông qua dịch vụ MCP được kết nối với LLM, các lệnh ngôn ngữ tự nhiên của người dùng có thể trực tiếp điều khiển Agent Wallet tự động thực hiện một loạt các thao tác phức tạp trên chuỗi (chẳng hạn như chuyển khoản, tương tác hợp đồng) đồng thời đảm bảo tính bảo mật của tài sản, mà không cần các thao tác chữ ký rườm rà hoặc hiểu các chi tiết kỹ thuật cơ bản của blockchain.
3. Kiến trúc kỹ thuật của ví đại lý
3.1 MCP
Trong khuôn khổ MCP, Agent Wallet hoạt động như một Máy chủ MCP độc lập, cung cấp một bộ công cụ vận hành ví chuyên dụng. Khi mô hình phân tích cú pháp các lệnh của người dùng, lớp định tuyến MCP sẽ gọi các công cụ tương ứng theo các tham số, ban đầu phân tích các tác vụ lệnh (Job) thành các tác vụ chi tiết hơn và gửi chúng đến Agent Wallet để thực hiện các thao tác tiếp theo tương ứng.
3.2 Ví đại lý
Là công cụ thực thi cốt lõi của ví proxy blockchain, Agent Wallet áp dụng thiết kế mô-đun để hiện thực hóa vòng lặp khép kín liên kết đầy đủ của proxy tài khoản, lập lịch tác vụ và chữ ký bảo mật. Kiến trúc của nó bao gồm hai mô-đun cốt lõi, hoạt động cùng nhau thông qua các giao diện được chuẩn hóa:
1. Lõi quản lý và điều phối thông minh (SMOC)
Trung tâm quản lý/lập lịch thông minh quản lý thống nhất hệ thống tài khoản toàn cầu và luồng tác vụ, đảm bảo các hướng dẫn do người dùng đưa ra bằng ngôn ngữ tự nhiên có thể được chuyển đổi chính xác và an toàn thành các hoạt động trên chuỗi. Các tính năng cốt lõi của nó tích hợp hai chức năng chính là quản lý tài khoản và lập lịch tác vụ. Mô-đun này bao gồm các tính năng sau:
Quản lý tài khoản thống nhất
Dựa trên giao thức OIDC, mối quan hệ ràng buộc chặt chẽ giữa danh tính người dùng và tài khoản proxy đa chuỗi được thiết lập. SMOC sẽ thực hiện xác minh thông tin đăng nhập theo thời gian thực trước mỗi giao dịch để tránh nguy cơ bị chiếm đoạt tài khoản. Đồng thời, thông qua công nghệ trừu tượng hóa tài khoản động, một danh tính người dùng duy nhất được ánh xạ đến địa chỉ proxy của các blockchain khác nhau (như EVM, Solana), cung cấp một mục nhập thống nhất cho các giao dịch đa chuỗi và ẩn đi tính phức tạp của chuỗi cơ sở.
Thích ứng tài sản thông minh
Người dùng chỉ cần gửi một token chính thống duy nhất (chẳng hạn như USDC hoặc ETH). SMOC sẽ tự động phân tích các yêu cầu vận hành trước khi thực hiện tác vụ và tự động trao đổi các tài sản cần thiết, bao gồm Token gốc của chuỗi mục tiêu (chẳng hạn như ETH, SOL) và các token cụ thể cần thiết cho tương tác DApp (chẳng hạn như WETH của Uniswap), đảm bảo luồng thực thi liền mạch và loại bỏ các thao tác rườm rà của người dùng khi trao đổi và tính phí token tương ứng theo cách thủ công.
Lên lịch tác vụ thông minh
Đối với luồng tác vụ đã phân tích cú pháp, SMOC phân tích thông minh các tác vụ phức tạp thành các tác vụ con nguyên tử thông qua bộ lập lịch DAG, quản lý động các phụ thuộc và chuỗi thực thi giữa các tác vụ, đồng thời hỗ trợ tự động khôi phục và tiếp tục điểm dừng. Sau khi tác vụ sẵn sàng, các thao tác tiền xử lý chính sẽ được tự động thực hiện, bao gồm phân bổ động các chuỗi Nonce, tối ưu hóa chiến lược Gas theo thời gian thực và xây dựng chính xác Calldata xuyên chuỗi để tối đa hóa hiệu quả thực thi và tỷ lệ thành công.
Giám sát thực hiện liên kết đầy đủ
SMOC sẽ theo dõi toàn bộ trạng thái vòng đời (Đang chờ/Đã xác nhận/Thất bại) từ khi phát hành tác vụ đến khi xác nhận trên chuỗi theo thời gian thực, và chủ động xác định tắc nghẽn hoặc rủi ro bất thường bằng cách kết hợp phân tích chuyên sâu về nhóm giao dịch với dự đoán xác nhận khối. Khi một giao dịch thất bại (chẳng hạn như không đủ Gas, lỗi thực hiện hợp đồng), hệ thống sẽ tự động chẩn đoán và đảm bảo tính nhất quán có thể kiểm chứng giữa ý định của người dùng và hoạt động trên chuỗi.
2. Hệ thống chữ ký MPC
Mô-đun này xây dựng nền tảng bảo mật cho ví proxy và đạt được bảo vệ khóa và bảo mật chữ ký đầu cuối bằng cách tích hợp môi trường thực thi đáng tin cậy (TEE) và giao thức chữ ký ngưỡng chuẩn hóa. Tất cả các phân đoạn khóa riêng được lưu trữ nghiêm ngặt trong môi trường TEE được mã hóa ở cấp độ phần cứng để đảm bảo việc tính toán chữ ký được hoàn tất trong vùng bộ nhớ được mã hóa của CPU, cô lập hoàn toàn các mối đe dọa tấn công ở cấp độ hệ điều hành (chẳng hạn như lỗ hổng bảo mật hạt nhân và chiếm đoạt bộ nhớ). Dựa trên cơ chế chữ ký ngưỡng (k, n), hệ thống chia toàn bộ khóa riêng thành nhiều phân đoạn không hợp lệ về mặt mật mã. Một phân đoạn duy nhất không thể suy ra khóa riêng ban đầu hoặc tạo chữ ký hợp lệ một cách độc lập. Chỉ khi các nút phân tán hợp tác trong tính toán thì chữ ký blockchain hợp lệ mới có thể được tạo ra mà không cần tái tạo khóa riêng. Kiến trúc này đáp ứng đồng thời hai tính năng bảo mật cốt lõi:
1. Nguyên tắc tái cấu trúc bằng không của khóa riêng: Khóa riêng hoàn chỉnh chưa bao giờ và sẽ không bao giờ xuất hiện trong bất kỳ thiết bị vật lý hoặc bộ nhớ nào trong suốt vòng đời của nó;
2. Khả năng phục hồi động: Khi một phần của phân đoạn khóa riêng bị mất do tai nạn (không vượt quá ngưỡng chịu lỗi), hệ thống có thể tái tạo phân đoạn mới một cách an toàn và phá hủy phân đoạn cũ thông qua sự hợp tác mật mã của các phân đoạn còn lại, đảm bảo rằng quyền kiểm soát tài sản không bao giờ bị mất.
Thiết kế này, kết hợp giữa tính cô lập ở cấp độ phần cứng và mật mã phân tán, tạo nên ranh giới bảo mật không thể thay đổi cho hoạt động của ví proxy, đảm bảo quyền sở hữu tài sản ngay cả khi đối mặt với các mối đe dọa dai dẳng nâng cao (APT).
Ngoài ra, Orcamind Agent Wallet còn hỗ trợ người dùng nắm giữ và duy trì một node phân mảnh MPC và cùng tham gia vào quá trình ký kết tiếp theo để mang lại độ tin cậy cao hơn.
3.3 Quy trình làm việc của ví AI Agent
Giai đoạn 1: Khởi tạo tài khoản (sử dụng lần đầu)
Khi người dùng khởi động và sử dụng Ví Đại lý lần đầu tiên, hệ thống sẽ thực hiện quy trình khởi tạo tài khoản tự động và nghiêm ngặt. Mục tiêu cốt lõi của quy trình này là hoàn tất việc xác minh độ tin cậy của danh tính kỹ thuật số của người dùng, xây dựng hệ thống tài khoản đại lý liên mạng và lưu trữ khóa an toàn theo tiêu chuẩn bảo mật cao. Toàn bộ quy trình xoay quanh ba liên kết chính:
1. Ràng buộc danh tính:
Bước đầu tiên của quá trình khởi tạo là thiết lập mối liên kết giữa danh tính người dùng và hệ thống. Để đạt được mục đích này, Agent Wallet sử dụng nghiêm ngặt giao thức OIDC (OpenID Connect) tiêu chuẩn ngành làm cầu nối. Người dùng có thể hoàn tất thao tác bằng cách chỉ cần thực hiện xác thực chữ ký trên trang để ủy quyền. Sau khi trung tâm quản lý phân tích và xác minh chữ ký và tính hợp lệ, nó sẽ tạo ra một mã định danh có thể đại diện duy nhất cho người dùng thông qua một thuật toán mã hóa cụ thể. Mã định danh duy nhất toàn cầu này là nền tảng của tất cả các thao tác tiếp theo. Nó không chỉ gắn kết chặt chẽ người dùng với các hoạt động ví của họ mà còn cung cấp một cơ sở không thể thay đổi cho việc quản lý tài khoản và theo dõi kiểm toán sau này.
2. Tạo tài khoản proxy:
Sau khi xác định thành công danh tính người dùng, hệ thống chữ ký sẽ sử dụng giải pháp phân mảnh MPC để tạo một tập hợp các tài khoản proxy chuỗi chéo một cách an toàn. Quá trình này sẽ được hoàn thành thông qua mạng lưới nút MPC phân tán, được cấu hình sẵn. Các nút này sẽ cùng tham gia vào các phép tính phân mảnh trong môi trường TEE. Đồng thời, trung tâm quản lý sẽ thiết lập mối liên kết tương ứng giữa mã định danh duy nhất của người dùng được tạo ở bước trước và tập hợp các tài khoản proxy này.
3. Lưu trữ khóa an toàn:
Các phân đoạn khóa riêng sẽ được lưu trữ hoàn toàn trong môi trường TEE để đảm bảo chúng không thể bị truy cập hoặc đánh cắp trái phép, do đó giảm thiểu rủi ro mất tài sản do rò rỉ khóa riêng hoặc lỗi điểm đơn.
Giai đoạn 2: Thực hiện lệnh
Khi người dùng đưa ra lệnh Sử dụng địa chỉ A1 và A2 để cam kết 0,5 ETH cho hợp đồng 0x Stake, hệ thống sẽ thực hiện việc thực hiện an toàn và tự động thông qua quy trình vòng kín sau:
1. Phân tích ngữ nghĩa và đóng gói ý định
Công cụ LLM phân tích cú pháp các hướng dẫn bằng ngôn ngữ tự nhiên của người dùng, xác định loại hoạt động (agent_wallet_staking) và hoàn thiện các tham số ngữ cảnh (danh sách địa chỉ, số lượng mã thông báo, địa chỉ hợp đồng) và tạo ra một khuôn khổ hoạt động có cấu trúc để truyền đến SMOC.
2. Lập lịch thống nhất và phân chia nhiệm vụ
Xác thực tài khoản: Xác minh quyền sở hữu tài khoản proxy thông qua mã định danh và thực hiện xác minh thông tin đăng nhập OIDC theo thời gian thực để đảm bảo tính hợp pháp của các hoạt động.
Điều chỉnh tài sản động: Kiểm tra số dư của địa chỉ Quỹ và tự động đổi nếu ETH không đủ
Phân tích nhiệm vụ thông minh:
→ Nhiệm vụ phụ 1: Chuyển 0,5 ETH từ địa chỉ Quỹ sang A 1
→ Nhiệm vụ phụ 2: Chuyển 0,5 ETH từ địa chỉ Quỹ sang A 2
→ Nhiệm vụ phụ 3: A 1 gọi phương thức deposit() của hợp đồng Stake 0x → Nhiệm vụ phụ 4: A 2 gọi phương thức deposit() của hợp đồng Stake 0x (sự phụ thuộc giữa các nhiệm vụ: việc đặt cược chỉ có thể được thực hiện sau khi quá trình chuyển giao hoàn tất)
3. Xây dựng và ký giao dịch tự động
Tạo tham số theo thời gian thực: phân bổ Nonce động dựa trên trạng thái trên chuỗi, tối ưu hóa chiến lược Gas và xây dựng Calldata (chẳng hạn như mã hóa ABI của hợp đồng đặt cược).
Chữ ký bảo mật phân tán: Hệ thống chữ ký khởi tạo yêu cầu chữ ký cộng tác đến cụm nút MPC trong môi trường TEE thông qua một kênh được mã hóa. Mỗi nút sử dụng phân mảnh khóa riêng để tính toán chữ ký một phần trong môi trường tách biệt phần cứng, và cuối cùng tổng hợp các chữ ký giao dịch hợp lệ với điều kiện không cần tái tạo khóa riêng.
4. Thực hiện giao dịch và theo dõi trạng thái
Phát các giao dịch đã ký đến mạng và theo dõi độ sâu của nhóm giao dịch và trạng thái xác nhận khối theo thời gian thực.
Toàn bộ chuỗi theo dõi vòng đời (ví dụ: Đang chờ chuyển 1 → Đã xác nhận cam kết). Nếu một tác vụ phụ không thành công (ví dụ: không đủ gas), lệnh khôi phục sẽ tự động được kích hoạt và cảnh báo sẽ được đưa ra.
Tạo nhật ký hoạt động, bao gồm toàn bộ chuỗi bằng chứng từ quá trình phân tích LLM đến xác nhận trên chuỗi.
3.4 Khả năng mở rộng ví đại lý
Agent Wallet cũng cung cấp một cổng tích hợp chức năng mạnh mẽ cho các nhà phát triển bên thứ ba thông qua thiết kế kiến trúc chuẩn hóa và có khả năng mở rộng cao. Các nhà phát triển có thể triển khai logic công cụ Agent Wallet tùy chỉnh theo yêu cầu của kịch bản kinh doanh (chẳng hạn như định tuyến tài sản xuyên chuỗi, chiến lược DeFi tùy chỉnh, tự động hóa quản trị trên chuỗi, v.v.). Công cụ chỉ cần tuân theo đường dẫn tích hợp đơn giản sau:
1. Triển khai tuân thủ giao diện: Các nhà phát triển triển khai logic cốt lõi của công cụ theo các thông số kỹ thuật giao thức được cài đặt trước, chẳng hạn như phân tích các tham số lệnh cụ thể và tạo các bước hoạt động nguyên tử;
2. Khai báo đăng ký khả năng: đăng ký siêu dữ liệu công cụ (mô tả chức năng, định dạng đầu vào và đầu ra, tài nguyên phụ thuộc) vào thư mục lập lịch toàn cầu của SMOC (Lõi quản lý và điều phối thông minh);
3. Đưa quy trình động vào: Xác định các quy tắc phân tích tác vụ trong khuôn khổ lập lịch DAG của SMOC và ánh xạ các luồng nghiệp vụ phức tạp vào các nút nguyên tử có thể gọi công cụ.
Sau khi kết nối hoàn tất, các nhà phát triển có thể cho phép người dùng trực tiếp điều khiển các quy trình tùy chỉnh thông qua ngôn ngữ tự nhiên. Thiết kế tách biệt này cho phép các công cụ của bên thứ ba tái sử dụng nền tảng bảo mật (TEE+MPC) và khả năng lập lịch thông minh của Agent Wallet, giúp giảm đáng kể ngưỡng phát triển cho các hoạt động phức tạp trên chuỗi.
4. Kết luận
Bằng cách kết hợp mô hình ngôn ngữ lớn, Orcamind AI Agent Wallet có thể chuyển đổi các lệnh của người dùng thành các hoạt động an toàn và tự động. Lõi Quản lý và Lập lịch Thông minh (SMOC) của ví sẽ phân tách các tác vụ một cách linh hoạt, tối ưu hóa các tham số Gas/Nonce và giám sát trạng thái của toàn bộ chuỗi theo thời gian thực, đồng thời dựa vào khả năng cô lập phần cứng TEE và chữ ký ngưỡng MPC để đảm bảo bảo mật tài khoản. Đồng thời, các nhà phát triển có thể mở rộng công cụ MCP Server thông qua các giao diện được chuẩn hóa, tái sử dụng cơ sở bảo mật và công cụ lập lịch để xây dựng các quy trình tùy chỉnh, và cuối cùng cho phép người dùng thực hiện các tương tác phức tạp trên chuỗi (chẳng hạn như đặt cược nhiều địa chỉ, định tuyến tài sản xuyên chuỗi) bằng ngôn ngữ tự nhiên, hoàn toàn từ bỏ gánh nặng vận hành của việc quản lý Gas, Nonce và tài sản đa chuỗi thủ công, và trở thành một tác nhân thực thi trên chuỗi thực sự tự chủ.