以太坊力推「所见即所签」:为什么 Clear Signing 是 AI 时代必需的能力补丁?
- 核心观点:随着AI Agent进入加密钱包与链上执行场景,钱包安全正从“私钥控制权”转向“交易意图验证”,Clear Signing与Verifiable UI成为防止用户因盲签或误导性签名而损失资产的核心路径。
- 关键要素:
- AI Agent提升效率的同时拉长安全边界,攻击者可通过prompt注入诱导系统执行异常转账(如30亿枚DRB代币事件),资产安全不再仅依赖私钥。
- 多数用户“盲签”时看不懂交易数据(如十六进制参数),以太坊基金会强调ERC-7730(Clear Signing标准)将原始数据转化为人类可读内容,如“Swap 1,000 USDC for 0.42 WETH”。
- Verifiable UI要求用户看到的交易内容与链上执行结果建立可信对应,防止DApp前端被篡改或伪造成真正的资产转移。
- ERC-7730通过结构化的JSON文件补充ABI信息,供钱包和交易模拟系统直接消费,提升签名前的验证能力。
- AI Agent时代,钱包需从“确认按钮”升级为“签名前最后一层验证”,在自动化交易中守住资产边界,确保用户理解每笔操作的意图与后果。
ในช่วงเวลาที่ยาวนานที่ผ่านมา เมื่อพูดถึงความปลอดภัยของกระเป๋าเงิน สิ่งที่เรามักถูกเตือนอยู่เสมอคือสองเรื่องหลัก ได้แก่ การเก็บรักษา seed phrase อย่างปลอดภัย และไม่คลิกลิงก์ฟิชชิ่ง
เนื่องจากในกระเป๋าเงินแบบ self-custody seed phrase / private key หมายถึงการควบคุมสินทรัพย์เสมอ ความสำคัญนั้นไม่ว่าจะเน้นย้ำมากแค่ไหนก็ไม่มากเกินไป อย่างไรก็ตาม เมื่อ AI Agent เริ่มเข้ามามีบทบาทในกระเป๋าเงิน การซื้อขาย การชำระเงิน และสถานการณ์การดำเนินการบนเชน ปัญหาใหม่กำลังมีความสำคัญมากขึ้นเรื่อยๆ นั่นคือ แม้ว่า private key ของคุณจะไม่รั่วไหล สินทรัพย์ก็อาจถูกโอนออกไปได้เนื่องจากการอนุญาตที่ผิดพลาด การเซ็นชื่อที่ทำให้เข้าใจผิด หรือคำสั่งอัตโนมัติที่ถูกปนเปื้อน
กล่าวอีกนัยหนึ่ง ความปลอดภัยของกระเป๋าเงินกำลังเปลี่ยนจาก "ใครสามารถควบคุมสินทรัพย์" ไปสู่ "ทำไมสินทรัพย์ถึงถูกย้าย ถูกย้ายด้วยวิธีใด และสอดคล้องกับความตั้งใจที่แท้จริงของผู้ใช้หรือไม่"
และนี่คือเหตุผลสำคัญที่ทำให้ Clear Signing ถูกผลักดันเข้าสู่กระบวนการมาตรฐานแบบเปิดของ Ethereum ในวันที่ 12 พฤษภาคม ตามความเป็นจริงแล้ว ปัญหาที่จะแก้ไขไม่ใช่ปัญหาใหม่ แต่เป็นปัญหาเก่าที่มีมายาวนานในโลกคริปโต: ผู้ใช้จำนวนมากไม่ได้ไม่ใส่ใจเรื่องความปลอดภัย แต่ก่อนที่จะคลิกยืนยัน พวกเขาไม่เข้าใจด้วยซ้ำว่ากำลังเซ็นอะไรลงไป

1. ยุคของ AI Agent ขอบเขตความปลอดภัยของ Web3 กำลังถูกขยายออกไปอย่างเงียบๆ
ดังที่เราทราบกันดี ด้วยการเกิดขึ้นของ AI Agent ปฏิสัมพันธ์บนเชนของ Web3 ก็กำลังพัฒนาไปในทิศทางที่ใกล้เคียงกับภาษาธรรมชาติมากขึ้น
ตัวอย่างเช่น ในอดีตหากคุณต้องการดำเนินการบางอย่าง คุณต้องเปิด DApp ด้วยตัวเอง เชื่อมต่อกระเป๋าเงิน เลือกเส้นทาง ยืนยันการอนุญาต และ发起ธุรกรรม ทุกขั้นตอนต้องดำเนินการเองและยืนยันผ่านป๊อปอัป ในขณะที่อนาคต กระบวนการนี้อาจถูกย่อให้สั้นลงเหลือเพียงประโยคเดียว เช่น ช่วยฉันหา stablecoin pool ที่ให้ผลตอบแทนสูงกว่านี้หน่อย ช่วยฉันรับ airdrop แล้วแปลงเป็น ETH เป็นต้น
จากมุมมองของประสบการณ์ผู้ใช้ นี่คือความก้าวหน้าอย่างแน่นอน AI Agent สามารถช่วยผู้ใช้ในการทำความเข้าใจข้อมูล แยกย่อยขั้นตอน สร้างธุรกรรม เพิ่มประสิทธิภาพ และแม้กระทั่งดำเนินการโดยอัตโนมัติภายในขอบเขตสิทธิ์ที่กำหนด
แต่ในอีกด้านหนึ่งของการเพิ่มประสิทธิภาพคือขอบเขตด้านความปลอดภัยที่ถูกขยายออกไป
เพราะในขณะนี้ สิ่งที่กำหนดทิศทางการไหลของเงินทุนอย่างแท้จริง ไม่ใช่แค่ตัวผู้ใช้เท่านั้น แต่ยังรวมถึงความเข้าใจของ Agent, แหล่งข้อมูลภายนอก และปัจจัยอื่นๆ อีกมากมาย หากจุดใดจุดหนึ่งถูกปนเปื้อน สิ่งที่ผู้ใช้เห็นว่า "ช่วยฉันดำเนินการ" อาจกลายเป็น "โอนเงินให้ฉัน" ที่ผู้โจมตีต้องการ
เมื่อไม่นานมานี้ มีผู้โจมตีใช้ prompt injection บน X เพื่อ诱导ระบบที่เกี่ยวข้องกับ AI Agent ให้ทำการโอนเงินที่ผิดปกติ ซึ่งเกี่ยวข้องกับโทเค็น DRB จำนวน 3 พันล้านเหรียญ มูลค่าประมาณ 150,000 ถึง 200,000 ดอลลาร์สหรัฐ แก่นของเหตุการณ์ประเภทนี้ไม่ใช่การรั่วไหลของ private key แบบดั้งเดิม แต่เป็นปัญหาว่าระบบ AI ตีความอินพุตอย่างไร ได้รับสิทธิ์อย่างไร และส่งต่อคำสั่งไปยังชั้นการดำเนินการบนเชนอย่างไร
นี่เป็นการยืนยันว่าผู้โจมตีไม่จำเป็นต้องเจาะกระเป๋าเงินโดยตรง เพียงแค่ทำให้ Agent ภายใต้สิทธิ์ที่สูงเกินไปเข้าใจผิดว่าอินพุตที่เป็นอันตรายเป็นคำสั่งที่ถูกต้อง ก็อาจทำให้เกิดการสูญเสียเงินทุนที่เกิดขึ้นจริงได้

ท้ายที่สุดแล้ว ในสถานการณ์อินเทอร์เน็ตแบบดั้งเดิม หาก AI ได้รับผลกระทบจาก prompt injection อาจส่งผลให้ตอบผิด รั่วไหลบริบท หรือเรียกใช้ API ที่ผิดพลาด แต่ในสถานการณ์คริปโต เมื่อ Agent เชื่อมต่อกระเป๋าเงิน มีสิทธิ์ในการอนุญาต และสามารถ发起ธุรกรรมได้ คำสั่งที่ผิดพลาดอาจกลายเป็นการโอนเงินบนเชนโดยตรง และธุรกรรมบนเชนนั้นไม่สามารถย้อนกลับได้ สิ่งนี้ทำให้ปัญหาด้านความปลอดภัยของ AI Agent ไม่ใช่แค่ "ความปลอดภัยของโมเดล" อีกต่อไป แต่เป็น "ความปลอดภัยของสินทรัพย์"
ดังนั้น ความปลอดภัยของกระเป๋าเงินในยุค AI Agent จึงไม่สามารถแก้ไขได้ด้วยการ "ทำให้ AI ฉลาดขึ้น" เท่านั้น สิ่งสำคัญอย่างแท้จริงคือ ระหว่างที่ Agent สร้างธุรกรรมและผู้ใช้ยืนยันการเซ็นชื่อ จะต้องมีชั้นอินเทอร์เฟซด้านความปลอดภัยที่ชัดเจนเพียงพอ ตรวจสอบได้ และเข้าใจได้
อินเทอร์เฟซนี้ก็คือกระเป๋าเงิน
2. การคลิก "ยืนยัน" หมายความว่าผู้ใช้เข้าใจจริงๆ หรือ?
สำหรับผู้ใช้ทั่วไป การกระทำที่คุ้นเคยที่สุดในกระเป๋าเงิน可能就是 "ยืนยัน"
การเชื่อมต่อ DApp ต้องยืนยัน การ Swap ต้องยืนยัน การอนุญาตโทเค็นต้องยืนยัน การ跨链ต้องยืนยัน การรับ airdrop ต้องยืนยัน การ Staking / การให้กู้ยืมหรือการสร้าง NFT ก็ต้องยืนยันเช่นกัน
ปัญหาคือ หน้า yืนยันจำนวนมากไม่ได้บอกผู้ใช้จริงๆ ว่า "จะเกิดอะไรขึ้นหลังจากยืนยัน"
ในหลายๆ ครั้ง สิ่งที่ผู้ใช้เห็นเป็นเพียงชื่อฟังก์ชันหนึ่งชุด บางครั้งเป็นข้อมูลเลขฐานสิบหกที่看不懂 บางครั้งเป็นเพียง Approve หรือ Sign Message ที่คลุมเครือมาก ในทางเทคนิคแล้ว ข้อมูลเหล่านี้อาจไม่ผิด แต่สำหรับผู้ใช้ส่วนใหญ่แล้ว ข้อมูลเหล่านี้ไม่เพียงพอต่อการตัดสินใจที่มีประสิทธิภาพ
นี่คือจุดที่อันตรายที่สุดของ "blind signing"
Blind signing ไม่ได้หมายความว่าผู้ใช้ไม่ได้ดูเลย แต่หมายถึงข้อมูลที่เขาเห็นนั้นไม่เพียงพอต่อการตัดสินใจ เปรียบเสมือนคุณกำลังจะเซ็นสัญญา แต่เนื้อหาของสัญญาเขียนด้วยภาษาที่คุณไม่เข้าใจ และสุดท้ายมีเพียงปุ่ม "ยินยอม" เท่านั้นที่โผล่มา คุณรู้ว่าคุณกำลังเซ็นชื่อ แต่คุณไม่รู้ว่าจะต้องรับผิดชอบอะไรหลังจากเซ็นชื่อ
มูลนิธิ Ethereum ยังเน้นย้ำในประกาศเกี่ยวกับ Clear Signing ว่าขั้นตอนสุดท้ายของการโจมตีครั้งใหญ่หลายครั้งไม่ใช่ช่องโหว่ของโค้ด แต่เป็นผู้ใช้ที่อนุมัติธุรกรรมที่ตัวเองไม่สามารถเข้าใจได้อย่างแท้จริง หากการยืนยันธุรกรรมควรเป็นแนวป้องกันสุดท้ายสำหรับผู้ใช้ในการควบคุมสินทรัพย์ Blind Signing จะทำให้แนวป้องกันนี้失效
ดังนั้น หากพูดว่าช่วงไม่กี่ปีที่ผ่านมา Account Abstraction แก้ปัญหาเรื่อง "วิธีการดำเนินการที่สะดวกยิ่งขึ้น" นั้น Clear Signing ก็กำลังแก้ปัญหาเรื่อง "วิธีการตรวจสอบที่ชัดเจนยิ่งขึ้นก่อนดำเนินการ" ทั้งสองสิ่งนี้เป็นเหมือนสองด้านของเหรียญเดียวกัน เพราะ หากไม่มีคำอธิบายการเซ็นชื่อที่ดีขึ้น ยิ่งระบบอัตโนมัติซับซ้อนมากขึ้น และความสามารถของบัญชีที่แข็งแกร่งขึ้น ก็ยิ่งมีโอกาสเกิดข้อผิดพลาดในการดำเนินการมากขึ้น
ERC-7730 ปรากฏขึ้น ณ จุดนี้ ตามคำอธิบายของข้อเสนอ EIP-7730 เอง มันคือรูปแบบข้อมูลที่มีโครงสร้างสำหรับ Clear Signing ซึ่งใช้ไฟล์ JSON เพื่อเสริมข้อมูลนอกเหนือจาก ABI และประเภทข้อความ แปลงข้อมูลธุรกรรมดิบให้เป็นเนื้อหาที่แสดงผลที่เหมาะสมกว่าสำหรับการตรวจสอบโดยมนุษย์ ในขณะเดียวกันก็สามารถถูกใช้โดยระบบเครื่องจักร เช่น การจำลองธุรกรรมได้โดยตรง
พูดให้ชัดเจนยิ่งขึ้น ERC-7730 ไม่ได้เปลี่ยนแปลงธุรกรรมบนเชนด้วยตัวเอง แต่เพิ่มชั้นการตีความที่เป็นมาตรฐานระหว่างธุรกรรมและผู้ใช้ ตัวอย่างต่อไปนี้จะช่วยให้เข้าใจได้โดยสัญชาตญาณ ดังรูปด้านล่าง ในอดีตกระเป๋าเงินอาจแสดงเฉพาะ function selector และพารามิเตอร์ แต่หลังจากรวม ERC-7730 แล้ว จะแสดงเนื้อหาการดำเนินการเฉพาะที่ผู้ใช้สามารถอ่านได้

บนพื้นฐานนี้ กระเป๋าเงินใดๆ ที่รองรับ ERC-7730 สามารถเปลี่ยน function selector ดั้งเดิมและพารามิเตอร์จำนวนเต็มให้เป็นเนื้อหาที่มนุษย์อ่านได้ เช่น "Swap 1,000 USDC for at least 0.42 WETH" ซึ่งดูเผินๆ เหมือนเป็นการปรับปรุง UI เท่านั้น แต่แท้จริงแล้วคือการยกระดับความสามารถด้านความปลอดภัยขั้นพื้นฐาน:
只有当ผู้ใช้เข้าใจเนื้อหาของธุรกรรม การยืนยันจึงจะมีความหมาย และ只有เมื่อกระเป๋าเงินสามารถแสดงเจตนาของธุรกรรมในรูปแบบที่มีโครงสร้างได้ ผู้ใช้จึงจะมีโอกาสพบปัญหาก่อนการเซ็นชื่อ
3. Verifiable UI: ทำให้สิ่งที่ผู้ใช้เห็น คือสิ่งที่จะเกิดขึ้นจริง
สิ่งนี้พาเรากลับมาที่ Verifiable UI ที่เราเน้นย้ำเมื่อเร็วๆ นี้
หากเป้าหมายของ Clear Signing คือการทำให้ผู้ใช้เข้าใจว่าตนเองเซ็นอะไรไป Verifiable UI ก็กำลังแก้ปัญหาที่ลึกซึ้งยิ่งขึ้น นั่นคือ เนื้อหาที่ผู้ใช้เห็นนั้น สามารถสร้างความสัมพันธ์ที่น่าเชื่อถือกับการดำเนินการบนเชนจริงได้หรือไม่?
สิ่งนี้สำคัญอย่างยิ่งในสถานการณ์ Web3
ผู้ใช้จำนวนมากคุ้นเคยกับการเชื่อถือ前端ของ DApp เมื่อหน้าเว็บเขียนว่า "รับรางวัล" ผู้ใช้ก็คิดว่ากำลังรับรางวัล เมื่อหน้าเว็บเขียนว่า "Stake" ผู้ใช้ก็คิดว่ากำลัง Stake เมื่อหน้าเว็บเขียนว่า "การยืนยันความปลอดภัย" ผู้ใช้ก็คิดว่าเป็นเพียงการยืนยันตัวตน
แต่สิ่งที่จะสามารถเคลื่อนย้ายสินทรัพย์ได้จริง ไม่ใช่ปุ่มบนหน้าเว็บ แต่เป็นธุรกรรมที่เซ็นลงไปในกระเป๋าเงินในที่สุด
前端ของ DApp อาจถูกโจมตี ชื่อโดเมนอาจถูกปลอมแปลง ข้อความบนหน้าอาจถูกแอบอ้าง แม้แต่ข้อมูลที่ AI Agent อ่านได้ก็อาจมาจากหน้าเว็บหรือเนื้อหาโซเชียลที่ถูกปนเปื้อน หากกระเป๋าเงินเพียงแค่แสดงปุ่มยืนยันโดยอัตโนมัติ ผู้ใช้ก็ยังคงอยู่ในสถานะ "เชื่อถือ前端"
นี่คือความสำคัญที่ imToken วางแผนที่จะรองรับ ERC-7730 และผลักดัน Verifiable UI + Clear Signing
มันไม่ใช่แค่การแสดงข้อความเพิ่มอีกสองสามบรรทัดบนหน้ายืนยัน แต่เป็นการทำให้กระเป๋าเงินเปลี่ยนจาก "ปุ่มสุดท้ายของธุรกรรม" เป็น "ชั้นการตรวจสอบสุดท้ายก่อนการเซ็นชื่อ" เมื่อผู้ใช้หรือ AI Agent เตรียมที่จะ发起ธุรกรรม กระเป๋าเงินควรจะบอกผู้ใช้ให้มากที่สุดเท่าที่จะเป็นไปได้ว่า ธุรกรรมนี้เรียกใช้สัญญาใดจริงๆ โอนสินทรัพย์ใดออกไปจริงๆ ใครคือผู้รับอนุญาต ขอบเขตการอนุญาตมากน้อยแค่ไหน และผลลัพธ์สุดท้ายสอดคล้องกับสิ่งที่แสดงบนหน้าหรือไม่
ความสามารถนี้จะยิ่งมีความสำคัญมากขึ้นในยุค AI Agent
เพราะ Agent สามารถช่วยผู้ใช้ทำหลายสิ่งหลายอย่าง แต่ Agent ก็อาจผิดพลาดได้ ผู้ใช้ไม่สามารถมอบการตัดสินใจทั้งหมดให้กับ Agent และกระเป๋าเงินก็ไม่สามารถส่งต่อธุรกรรมที่ Agent สร้างให้ผู้ใช้ยืนยันโดยไม่ผ่านการกลั่นกรอง ที่จริงแล้ว แนวทางที่สมเหตุสมผลกว่าคือ Agent รับผิดชอบในการเพิ่มประสิทธิภาพ ในขณะที่กระเป๋าเงินรับผิดชอบในการรักษาขอบเขต
นี่คือคุณค่าของ Verifiable UI + Clear Signing มันไม่ได้มีจุดประสงค์เพื่อ阻止ผู้ใช้จากการใช้เทคโนโลยีใหม่ แต่เพื่อให้เทคโนโลยีใหม่เกิดขึ้นภายในขอบเขตที่ตรวจสอบได้มากขึ้น โดยเฉพาะอย่างยิ่งหลังจากที่ Smart Account, AI Agent, การซื้อขายอัตโนมัติ และ跨链ดำเนินการกลายเป็นเรื่องปกติมากขึ้น หน้ายืนยันของกระเป๋าเงินไม่ควร停留在สถานะที่มีข้อมูลความหนาแน่นต่ำเช่น "Confirm / Approve" ต่อไป แต่ควรกลายเป็นอินเทอร์เฟซสำคัญที่ผู้ใช้ใช้เพื่อทำความเข้าใจพฤติกรรมบนเชน (อ่านเพิ่มเติมในบทความ 《จากเหตุการณ์ Kelp DAO สู่ Verifiable UI: ทำไม "อินเทอร์เฟซที่ตรวจสอบได้" ถึงกลายเป็นมาตรฐานความปลอดภัยแบบกระจายอำนาจใหม่?》)
บทสรุป
อุตสาหกรรมคริปโตแสวงหาประสบการณ์ผู้ใช้ที่ดีขึ้นอย่างต่อเนื่อง
จาก seed phrase สู่ Smart Account จากการดำเนินการด้วยตนเองสู่ AI Agent จากธุรกรรมเดี่ยวสู่การดำเนินการแบบกลุ่ม กระเป๋าเงินกำลังแข็งแกร่งขึ้นและใกล้เคียงกับวิธีการใช้งานผลิตภัณฑ์อินเทอร์เน็ตในชีวิตประจำวันมากขึ้น แต่ยิ่งเป็นเช่นนี้ ก็ยิ่งไม่ควรมองข้ามข้อเท็จจริงพื้นฐาน นั่นคือ ธุรกรรมบนเชนไม่สามารถย้อนกลับได้ และการเซ็นชื่อยังคงเป็นขั้นตอนที่สำคัญที่สุดก่อนที่สินทรัพย์ของผู้ใช้จะเคลื่อนย้าย
ในอดีต เรามักพูดว่า "อย่า泄露 seed phrase" ในอนาคต เมื่อความสามารถของ AI Agent แทรกซึมเข้าสู่ Web3 และเชนในวงกว้าง เราอาจต้องพูดเพิ่มอีกประโยคว่า: อย่าเซ็นชื่อในธุรกรรมที่คุณไม่เข้าใจ และอย่าให้ Agent ดำเนินการคำสั่งที่ไม่สามารถตรวจสอบได้ในนามของคุณ
ท้ายที่สุดแล้ว ไม่ว่ามูลนิธิ Ethereum จะผลักดันมาตรฐาน Clear Signing หรือ imToken วางแผนรองรับ ERC-7730 และ推进 Verifiable UI + Clear Signing สิ่งเหล่านี้ล้วนชี้ไปในทิศทางเดียวกัน:
กระเป๋าเงินในยุคใหม่ ไม่เพียงแต่ต้องใช้งานได้ดีขึ้น แต่ยังต้องน่าเชื่อถือมากขึ้น กลายเป็นผู้ช่วยที่แท้จริงให้ผู้ใช้เข้าใจบนเชน


