จาก “ขยะในการคำนวณ” สู่ “การคำนวณที่มีประโยชน์”: Transformer-PoW ปรับเปลี่ยนกลไกฉันทามติใหม่ได้อย่างไร
ผู้เขียนต้นฉบับ: Anastasia Matveeva , Gonka.ai
การบรรลุฉันทามติผ่าน “ความสิ้นเปลือง”
บิตคอยน์ประสบความสำเร็จอย่างน่าทึ่ง: มันได้แสดงให้เห็นผ่านการปฏิบัติอย่างกว้างขวางว่าคนแปลกหน้าที่ไร้ความน่าเชื่อถือสามารถร่วมมือกันได้โดยไม่ต้องพึ่งพาธนาคาร รัฐบาล หรือหน่วยงานกลางใดๆ เป็นครั้งแรกที่ผู้คนสามารถโอนเงินให้กับผู้คนอีกฟากหนึ่งของโลกได้โดยไม่ต้องขออนุญาตจากใคร เครือข่ายไม่สามารถถูกปิดได้ สินทรัพย์ไม่ถูกเซ็นเซอร์ และธุรกรรมก็มีประสิทธิภาพอย่างแท้จริง
Bitcoin เสนอกลไก Proof-of-Work (PoW) ให้เป็นกลไกฉันทามติในหมู่ผู้เข้าร่วมที่ไม่ไว้วางใจ ตรรกะหลักของมันนั้นเรียบง่ายและชัดเจน: นักขุดจะแข่งขันกันแก้ "ปริศนา" โดยการหาตัวเลขสุ่ม (Nonce) ผสมกับข้อมูลบล็อก และป้อนลงในฟังก์ชันแฮช SHA-256 เพื่อให้ผลลัพธ์ตรงตามเงื่อนไขเฉพาะ ซึ่งโดยทั่วไปคือ "ค่าแฮชที่เริ่มต้นด้วยเลขศูนย์นำหน้าจำนวนหนึ่ง" ยกตัวอย่างเช่น การสร้างค่าแฮชโดยให้ 70 บิตแรกเป็นเลขศูนย์ฐานสอง จำเป็นต้องใช้ความพยายามเฉลี่ย 2 ยกกำลัง 70 ไม่มีทางลัดหรืออัลกอริทึมอันชาญฉลาดใด ๆ ที่จะหลีกเลี่ยงการลองตัวเลขสุ่มที่แตกต่างกัน กระบวนการนี้สามารถเสร็จสมบูรณ์ได้ด้วยการคำนวณอย่างต่อเนื่องจนกว่าจะได้ "โชคเข้าข้าง"
ความสำคัญเชิงปฏิวัติของกลไกนี้อยู่ที่ต้นทุนการโจมตีบล็อกเชนที่เพิ่มขึ้นอย่างมาก โดยในการแก้ไขบันทึกทางประวัติศาสตร์ ผู้โจมตีจะต้องทำงานประมวลผลทั้งหมดใหม่ นอกจากนี้ กลไกนี้ยังช่วยให้เกิดความสอดคล้องของแรงจูงใจ โดยผลตอบแทนของนักขุดจะแปรผันตามผลลัพธ์จากการประมวลผล แทนที่จะขึ้นอยู่กับความมั่งคั่งที่มีอยู่ (แม้ว่าในทางปฏิบัติ เงินทุน ฮาร์ดแวร์ และค่าไฟฟ้ายังคงมีบทบาทสำคัญ) นี่นับเป็นครั้งแรกที่มีการนำระบบแบบกระจายอำนาจอย่างแท้จริงมาใช้ในวงกว้าง
อย่างไรก็ตาม ต้นทุนก็คือการคำนวณเหล่านี้ไม่มีคุณค่าในตัวเอง ค่าไฟฟ้าที่ใช้ไปจะถูกนำไปใช้คำนวณ "ค่าแฮชของเลขศูนย์นำหน้า" เท่านั้น และไม่มีประโยชน์อื่นใดในทางปฏิบัติ ดังนั้น บิตคอยน์จึงจำเป็นต้องแลกกับความสิ้นเปลืองในการคำนวณจำนวนมหาศาลเพื่อแลกกับความปลอดภัยของเครือข่าย เป็นเวลากว่าทศวรรษแล้วที่การแลกเปลี่ยนนี้ถือว่า "ดีพอ" ในทางปฏิบัติ ทำให้บิตคอยน์เป็นสินทรัพย์ที่ทรงพลัง
ยุคใหม่ของการกระจายอำนาจ
ปัจจุบัน ปัญญาประดิษฐ์กำลังอยู่ในช่วงการเปลี่ยนแปลงอย่างรวดเร็ว แบบจำลองภาษาขนาดใหญ่ (LLM) กำลังกลายเป็นโครงสร้างพื้นฐาน ซึ่งเป็นบริการที่ทั้งองค์กรและผู้ใช้ต่างพึ่งพา อย่างไรก็ตาม ในปัจจุบัน งานอนุมาน LLM ส่วนใหญ่ทำงานบนเซิร์ฟเวอร์ส่วนกลางที่ควบคุมโดยบริษัทเพียงไม่กี่แห่ง ซึ่งก่อให้เกิดปัญหาเร่งด่วนหลายประการ:
- ความเสี่ยงจากจุดควบคุมเดียว: บริษัทเดียวจะตัดสินใจเกี่ยวกับประเภทของโมเดลที่สามารถใช้ได้และใครมีสิทธิ์ในการเข้าถึง
- ความเสี่ยงจากการเซ็นเซอร์: รัฐบาลหรือธุรกิจอาจกดดันผู้ให้บริการส่วนกลางให้เซ็นเซอร์หรือจำกัดบริการของตน
- การล็อกอินของซัพพลายเออร์: ผู้ใช้และนักพัฒนาไม่มีทางเลือกอื่นนอกจากต้องพึ่งพา "ผู้ดูแลระบบ" ในปัจจุบัน
นี่คือปัญหาหลักที่ Bitcoin ตั้งใจจะแก้ไขตั้งแต่แรก สิ่งนี้นำไปสู่คำถามสำคัญ: เราสามารถสร้างเครือข่าย LLM แบบกระจายศูนย์ที่แก้ไขปัญหาเหล่านี้ได้ โดยไม่ซ้ำรอยความผิดพลาดของ Bitcoin ในเรื่อง "การสิ้นเปลืองทรัพยากร" ได้หรือไม่?
โซลูชันที่มีอยู่และข้อจำกัดของพวกเขา
Proof-of-Stake (PoS) พยายามแก้ไขปัญหาทรัพยากรคอมพิวเตอร์ที่สูญเปล่าโดย "ทดแทนพลังในการประมวลผลด้วยเงินทุน" ผู้ตรวจสอบจะต้องล็อกโทเค็นจำนวนหนึ่งเป็นหลักประกัน และความน่าจะเป็นที่จะถูกเลือกเพื่อตรวจสอบบล็อกนั้นจะแปรผันตามขนาดของหลักประกันในขณะที่ใช้พลังงานเพียงเล็กน้อยเท่านั้น
อย่างไรก็ตาม กลไกนี้มีข้อบกพร่องสำคัญประการหนึ่ง นั่นคือ การกระจายเงินทุนนั้นมีความไม่สม่ำเสมอโดยเนื้อแท้ ยกตัวอย่างเช่น เครือข่ายอย่าง Bittensor ผู้ตรวจสอบที่มีเงินทุนจำนวนมากจะดึงดูดผู้ถือโทเค็นรายย่อยให้มอบสิทธิ์ในการลงทุนแก่พวกเขา ทำให้เกิดวงจรป้อนกลับเชิงบวกที่ว่า "คนรวยยิ่งรวยขึ้น" ยิ่งมีเงินทุนมาก ยิ่งดึงดูดการมอบหมายมากขึ้น ก่อให้เกิดรางวัลมากขึ้น ซึ่งในทางกลับกันก็จะดึงดูดการมอบหมายมากขึ้นไปอีก เมื่อเวลาผ่านไป อำนาจการลงคะแนนเสียงจะกระจุกตัวอยู่ในมือของผู้ถือครองความมั่งคั่งรายแรก แม้ว่าซับเน็ตจะมี GPU ประสิทธิภาพสูงและความสามารถในการอนุมานคุณภาพสูง แต่อิทธิพลของซับเน็ตก็จะแทบไม่มีนัยสำคัญหากผู้ตรวจสอบมีเงินทุนจำกัด
ผลลัพธ์สุดท้ายคือสิทธิในการออกเสียง ซึ่งเดิมทีเป็นของผู้ที่มีส่วนร่วมสร้างพลังการประมวลผลจริง ปัจจุบันถูกผูกขาดโดยผู้ถือทุน ดังนั้น แม้ว่า PoS จะแก้ปัญหาการสิ้นเปลืองทรัพยากรได้ แต่ก็ก่อให้เกิดปัญหาใหม่ของการกระจุกตัวของความมั่งคั่ง
ทางเลือกอื่น
ดังนั้นแกนของปัญหาจึงกลายเป็นว่า เราสามารถนำทรัพยากรการคำนวณไปสู่ภารกิจที่มีมูลค่าที่แท้จริงได้ในขณะที่ยังคงรักษา "ความยุติธรรม" ของการพิสูจน์การทำงานไว้ได้หรือไม่
ทีมวิจัยได้พยายามแก้ไขปัญหาการสิ้นเปลืองทรัพยากรของ Proof-of-Work (PoW) มาเป็นเวลานานด้วยวิธีการที่หลากหลาย ประมาณปี 2017 นักวิจัยได้เริ่มศึกษา Proof of Useful Work ซึ่งเป็นกลไกที่ยังคงใช้กรอบ PoW แต่เปลี่ยนงานคำนวณของนักขุดจาก "ปริศนาแฮชแบบสุ่ม" ไปเป็นงานที่อาจมีมูลค่าทางเศรษฐกิจหรือทางวิทยาศาสตร์ โครงการบางโครงการเชื่อมโยง "ความยาก" ของ PoW เข้ากับปัญหาที่ละเอียด ในขณะที่บางโครงการพยายามรวมการเรียนรู้แบบรวมศูนย์ งานคูณเมทริกซ์ หรือการสร้างหลักฐานความรู้ศูนย์ เสน่ห์ของโครงการเหล่านี้เห็นได้ชัด: นักขุดสามารถรักษาความยุติธรรมของ PoW ได้โดยการทำ "งานที่มีประโยชน์อย่างแท้จริง" ควบคู่ไปกับการลดการสิ้นเปลืองทรัพยากร
อย่างไรก็ตาม จนกระทั่งเมื่อไม่นานนี้ ความพยายามเหล่านี้ไม่ได้มุ่งเป้าไปที่สถานการณ์อนุมาน LLM แต่มุ่งเน้นไปที่ปัญหาการคำนวณแบบแยกส่วนหรือการเรียนรู้แบบแบตช์ มากกว่า "การอนุมานทรานส์ฟอร์เมอร์แบบเรียลไทม์" ที่รองรับบริการ AI ในปัจจุบัน
ในความเป็นจริง การอนุมาน LLM เป็นตัวพา "ภาระงานที่มีประโยชน์" ที่เหมาะสมอย่างยิ่ง เนื่องจากมีต้นทุนการคำนวณสูง มีมูลค่าทางเศรษฐกิจสูง และความสำคัญก็เพิ่มขึ้นทุกวัน หากภาระงานการคำนวณของงานอนุมานสามารถนำมาใช้เพื่อการรับรองความปลอดภัยของเครือข่ายได้ ก็จะสามารถบรรลุความสอดคล้องระหว่าง "ความปลอดภัยของเครือข่ายและความต้องการการประมวลผลที่แท้จริง" ได้
กล่าวโดยสรุป นักขุดไม่จำเป็นต้องคำนวณค่าแฮชอีกต่อไป แต่พวกเขาจะเข้าร่วมในฉันทามติโดยการทำภารกิจอนุมานของ Transformer ให้สำเร็จ นี่คือแนวคิดหลักเบื้องหลังการพิสูจน์การทำงานแบบ Transformer แน่นอนว่าการออกแบบกลไกนี้ยังต้องรับมือกับความท้าทายสำคัญหลายประการ
นอกจากนี้ ควรสังเกตด้วยว่ากลไกนี้ไม่ได้จำกัดอยู่แค่ Transformer เท่านั้น แต่สามารถปรับให้เข้ากับสถาปัตยกรรมโมเดลที่ใช้งานได้จริงและเป็นกระแสหลักมากขึ้นในอนาคตได้
ความท้าทายด้านการออกแบบ
ความท้าทายที่ 1: การประเมินทรัพยากรคอมพิวเตอร์
ใน Bitcoin การ "ขุด" คืองานประจำของนักขุด อย่างไรก็ตาม สำหรับเครือข่าย LLM แบบกระจายศูนย์ที่ต้องให้บริการแก่ผู้ใช้ โหนดจะใช้เวลาส่วนใหญ่ไปกับการประมวลผลคำขออนุมานมากกว่าการทำงานแบบพิสูจน์การทำงาน ดังนั้นจึงมีสองทางเลือกที่เป็นไปได้:
วิธีแรกมีความเป็นไปได้ในทางทฤษฎี แต่จำเป็นต้องมีการวิจัยเชิงลึก โดยประเมินทรัพยากรการคำนวณของผู้เข้าร่วมโดยใช้การคำนวณอนุมานจริงจากแบบจำลองการฝึกที่มีอยู่ ผ่านการรันงานอนุมาน การวัดต้นทุนการคำนวณ และการปรับเทียบน้ำหนักโหนด วิธีนี้มีประสิทธิภาพ แต่จำเป็นต้องแก้ไขสองประเด็นหลัก ได้แก่ วิธีการปรับตัวให้เข้ากับความแตกต่างของข้อมูลอินพุตที่แตกต่างกัน และวิธีหลีกเลี่ยงช่องโหว่ในโครงสร้างแบบจำลองการฝึกที่อาจถูกนำไปใช้ประโยชน์ ดังนั้นจึงจำเป็นต้องมีการลงทุนด้านการวิจัยและพัฒนาอย่างมาก
โครงร่างข้อจำกัดเวลาแบบที่สองซึ่งใช้งานได้จริงมากกว่านั้น เกี่ยวข้องกับการออกแบบปริศนาพิสูจน์การทำงานแต่ละอันให้เป็นงาน "ระยะเวลาสั้น ระยะเวลาคงที่ และคาดการณ์ได้" (เช่น ใช้เวลาเพียงไม่กี่นาที) โดยเครือข่ายมุ่งมั่นที่จะรักษาทรัพยากรการคำนวณเดิมที่มีอยู่ตลอดทั้งยุค การออกแบบนี้ช่วยเพิ่มความยืดหยุ่นในการสร้างปริศนาที่เหมือนกัน
ความท้าทายที่ 2: การจัดแนวงานให้สอดคล้องกับการคำนวณ LLM
หากนำแนวทาง "การพิสูจน์การทำงานที่มีข้อจำกัดด้านเวลา" มาใช้ ปัญหาใหม่ก็จะเกิดขึ้น นั่นคือ หากงาน PoW มีลักษณะตามอำเภอใจ ทิศทางของการเพิ่มประสิทธิภาพฮาร์ดแวร์อาจเบี่ยงเบนไปจาก "งานที่มีประโยชน์"
กรณีของ Bitcoin ได้แสดงให้เห็นถึงผลที่ตามมาของ "ความไม่ตรงกันของแรงจูงใจ": ในช่วงเวลาที่ผ่านมา อุตสาหกรรมได้พัฒนาฮาร์ดแวร์เฉพาะทาง (ASIC) ที่ใช้คำนวณค่าแฮชเท่านั้น
Transformer ที่ใช้ Proof-of-Work (PoW) สามารถย้อนกลับตรรกะแรงจูงใจนี้ได้: หากงาน PoW เป็นการอนุมาน Transformer เอง การเพิ่มประสิทธิภาพฮาร์ดแวร์สำหรับ PoW จะปรับปรุงประสิทธิภาพการอนุมานของผู้ใช้บริการโดยธรรมชาติ ทิศทางของการเพิ่มประสิทธิภาพฮาร์ดแวร์จะสอดคล้องกับ "ความต้องการที่แท้จริง" โดยธรรมชาติ
เพื่อบรรลุเป้าหมายนี้ จำเป็นต้องแน่ใจว่ามีสองสิ่ง ประการแรก งาน PoW จะต้องเป็น "การใช้เหตุผลของ Transformer จริง" ประการที่สอง งานจะต้องได้รับการอัปเดตในแต่ละรอบเพื่อป้องกันไม่ให้ผู้เข้าร่วมคำนวณคำตอบล่วงหน้านอกกรอบเวลาที่กำหนด
โดยเฉพาะอย่างยิ่ง ในแต่ละรอบของ PoW จะสร้าง "Transformer ตัวใหม่ที่เริ่มต้นแบบสุ่ม" ผู้เข้าร่วมจะได้รับเพียงช่วงเวลาที่กำหนดไว้เท่านั้นในการแก้ปัญหา โดยไม่มีวิธีวิเคราะห์หรือคำนวณล่วงหน้า ความท้าทายแต่ละครั้งเป็นความท้าทายใหม่ทั้งหมด เพื่อให้มั่นใจว่างานสอดคล้องกับการอนุมานในโลกแห่งความเป็นจริง ภายใต้การออกแบบนี้ ไม่มีทางลัด และไม่สามารถพัฒนาฮาร์ดแวร์เฉพาะสำหรับงานเฉพาะได้ (เนื่องจากมีการอัปเดตงานในแต่ละรอบ) การปรับปรุงฮาร์ดแวร์จะช่วยเพิ่มประสิทธิภาพการอนุมานของ Transformer สำหรับการใช้งานทั่วไปเท่านั้น แทนที่จะทำหน้าที่ "ปรับแต่งเฉพาะสำหรับการขุด"
ความท้าทายที่ 3: การประกันความปลอดภัย
ท้ายที่สุด ประเด็นหลักคือ "การออกแบบระดับความยาก": PoW ปลอดภัยเพียงพอหรือไม่?
ตรรกะด้านความปลอดภัยของ Bitcoin นั้นเรียบง่ายและชัดเจน การสร้างค่าแฮชด้วยศูนย์ N ตัวแรกนั้นต้องใช้กำลัง และไม่มีทางลัดทางคณิตศาสตร์ที่ทราบสำหรับอัลกอริทึม SHA-256 อีกทั้ง "ความยาก" ของมันก็เรียบง่ายและตรวจสอบได้
กลไกของ Bitcoin นั้นเรียบง่ายมาก โดยการปรับตัวเลขสุ่ม จะช่วยตรวจสอบว่าค่าแฮชตรงตามเงื่อนไขที่ว่า "N บิตแรกเป็นศูนย์" หรือไม่
ลองมาทำความเข้าใจตรรกะการแมปโดยตรงของงาน Bitcoin ในสถานการณ์ Transformer กัน ค่า nonce ของ Bitcoin จะถูกแปลงเป็น "ลำดับอินพุต" ซึ่งอาจเป็นเวกเตอร์หรือลำดับโทเค็นที่ปรับเปลี่ยนได้แบบไดนามิก และยังคงสร้างจากจำนวนเต็มบวก เช่น ค่า nonce ของ Bitcoin ข้อกำหนดของ "เลขศูนย์นำหน้า" จะถูกแปลงเป็นข้อจำกัดของผลลัพธ์:
เวกเตอร์เอาต์พุตของหม้อแปลงไฟฟ้าต้องเป็นไปตามคุณสมบัติเฉพาะบางประการ ข้อจำกัดที่เป็นไปได้ ได้แก่ เวกเตอร์เอาต์พุตต้องอยู่ใกล้ศูนย์ ระยะห่างจากเวกเตอร์เป้าหมายต้องอยู่ในช่วงขีดจำกัด มีขนาดเฉพาะ หรือเป็นไปตามเกณฑ์อื่นๆ ที่กำหนดไว้อย่างชัดเจน คำจำกัดความเฉพาะของเงื่อนไขนี้มีความสำคัญอย่างยิ่ง เนื่องจากอาจใช้ทางลัดสำหรับโครงสร้างทางคณิตศาสตร์บางอย่างได้
ความแตกต่างที่สำคัญจาก Bitcoin อยู่ที่ต้นทุนที่สูงกว่าในการตรวจสอบว่าลำดับอินพุตของ Transformer ตรงตามเกณฑ์หรือไม่ ในขณะที่ฮาร์ดแวร์ทั่วไปสามารถคำนวณแฮชได้หลายล้านครั้งต่อวินาทีสำหรับ Bitcoin Nonces แต่การตรวจสอบอินพุตของ Transformer จำเป็นต้องใช้การคำนวณแบบ Forward Propagation Computing เต็มรูปแบบ ผู้เข้าร่วมไม่สามารถพยายามใช้ Brute-force กับลำดับตัวเลือกหลายพันล้านลำดับได้ ความสามารถของพวกเขาถูกจำกัดด้วยความเร็วในการอนุมาน และนี่คือ "ภาระงานในการคำนวณ" ที่เราจำเป็นต้องวัด
ระบบนี้จะสร้างความปลอดภัยที่เทียบเท่ากับ Bitcoin ได้อย่างไรนั้น จำเป็นต้องมีการวิเคราะห์ทางเทคนิคเพิ่มเติม (ซึ่งจะกล่าวถึงในบทความอื่น) หลักการสำคัญของระบบนี้คือ การเริ่มต้นระบบ Transformers แบบสุ่ม และผสานเข้ากับการออกแบบปัญหาอย่างเข้มงวด ทำให้เกิดพื้นที่ค้นหาที่ "สามารถแก้ไขได้ด้วยการใช้เหตุผลของ Transformer ให้ครบถ้วนเท่านั้น" การวิเคราะห์ความปลอดภัยที่สมบูรณ์จะถูกนำเสนอแยกต่างหาก
การทำให้ระบบนี้ปลอดภัยในการแข่งขันบน Bitcoin เป็นเรื่องทางเทคนิคที่ซับซ้อนกว่า ซึ่งเป็นอีกหัวข้อหนึ่ง ตรรกะหลักคือการสร้างพื้นที่ค้นหาที่ต้องใช้เหตุผลแบบ Transformer อย่างสมบูรณ์เพื่อแก้ปัญหา ผ่านการเริ่มต้นระบบ Transformer แบบสุ่มและการออกแบบปัญหาอย่างเข้มงวด การวิเคราะห์ความปลอดภัยอย่างครบถ้วนควรได้รับการพิจารณาแยกต่างหาก
กลไก Proof-of-Work ได้ดำเนินการอย่างต่อเนื่องมาเป็นเวลา 15 ปีแล้ว แต่การออกแบบของ Bitcoin ก็ได้นำปัญหาสำคัญมาด้วยเช่นกัน: เราใช้ทรัพยากรคอมพิวเตอร์จำนวนมหาศาลเพื่อสร้างค่าแฮชที่ไม่มีประโยชน์ในทางปฏิบัติ ในขณะที่ทางเลือกอื่นๆ เช่น PoS ได้แก้ปัญหาทรัพยากรที่สูญเปล่าได้ แต่ก็ทำให้เกิดการรวมศูนย์ความมั่งคั่งไว้ในมือของผู้ถือทุน
Proof-of-Work (PoW) ที่ใช้ Transformers เป็นอีกทางเลือกหนึ่ง: วิธีนี้ช่วยรักษาความปลอดภัยและความยุติธรรมของ PoW ขณะเดียวกันก็นำทรัพยากรการประมวลผลไปยังจุดที่โลกต้องการอย่างแท้จริง ในฐานะกลไกฉันทามติสำหรับยุค AI วิธีนี้ผสานรวมความปลอดภัยของ PoW เข้ากับความต้องการด้านการประมวลผลในโลกแห่งความเป็นจริง และมอบ "ความสามารถในการใช้งานได้จริงของตัวงานเอง" ซึ่งเป็นการวางรากฐานใหม่ให้กับเครือข่าย AI แบบกระจายศูนย์
- 核心观点:基于Transformer的PoW可兼顾安全与实用。
- 关键要素:
- 比特币PoW存在巨大计算资源浪费。
- PoS机制导致财富集中新问题。
- Transformer推理可替代哈希计算。
- 市场影响:为去中心化AI网络提供新基础。
- 时效性标注:长期影响


