ที่มา | Vitalik.ca
ชื่อเดิม: "Vitalik: ต่อต้านการใช้ค่าสัมประสิทธิ์ Gini มากเกินไป" โดย Vitalik Buterin
ค่าสัมประสิทธิ์ Gini (หรือที่เรียกว่าดัชนี Gini) เป็นตัววัดความไม่เท่าเทียมกันของรายได้ที่ได้รับความนิยมและเป็นที่รู้จักมากที่สุด โดยเฉพาะอย่างยิ่งความไม่เท่าเทียมกันของรายได้หรือความมั่งคั่งภายในประเทศ ภูมิภาค หรือชุมชนอื่นๆ เป็นที่นิยมเนื่องจากเข้าใจง่ายและนิยามทางคณิตศาสตร์สามารถแสดงภาพได้ง่ายด้วยแผนภาพ
อย่างไรก็ตาม เราสามารถจินตนาการได้ว่าโครงการใดๆ ที่พยายามลดความไม่เท่าเทียมกันให้เหลือเพียงจำนวนเดียวก็มีข้อจำกัด และค่าสัมประสิทธิ์จินีก็เช่นกัน แม้ในบริบทที่แต่เดิมใช้เพื่อวัดความไม่เท่าเทียมกันของรายได้และความมั่งคั่งในประเทศต่าง ๆ แต่ก็มีข้อจำกัดและเมื่อใช้กับบริบทอื่น ๆ (โดยเฉพาะโลกของสกุลเงินดิจิทัล) ค่าสัมประสิทธิ์ Gini ก็ถูกจำกัด เห็นได้ชัดเจนยิ่งขึ้น ในบทความนี้ ผมจะพูดถึงข้อจำกัดของค่าสัมประสิทธิ์ Gini และเสนอทางเลือกอื่น
ค่าสัมประสิทธิ์จินี่คืออะไร?
ค่าสัมประสิทธิ์ Gini ถูกเสนอโดย Corrado Gini ในปี 1912 เพื่อวัดความไม่เท่าเทียมกัน โดยทั่วไปจะใช้เพื่อวัดความไม่เท่าเทียมกันของรายได้และความมั่งคั่งในประเทศต่างๆ แม้ว่าจะใช้มากขึ้นในบริบทอื่นๆ
มีสองคำจำกัดความที่เทียบเท่ากันของค่าสัมประสิทธิ์ Gini:
➤ กำหนดโดยพื้นที่บนเส้นโค้ง: เขียนฟังก์ชันโดยที่ f(p) เท่ากับรายได้รวมที่ได้รับจากกลุ่มผู้มีรายได้น้อย (เช่น f(0.1) แสดงถึงส่วนแบ่งด้านล่าง 10% ของรายได้ทั้งหมด) ค่าสัมประสิทธิ์จินีคือพื้นที่ระหว่างเส้นโค้งนี้กับเส้น y=x ซึ่งเป็นส่วนหนึ่งของสามเหลี่ยมทั้งหมด:
➤ กำหนดโดยความแตกต่างของค่าเฉลี่ย: ค่าสัมประสิทธิ์ Gini คือครึ่งหนึ่งของความแตกต่างของค่าเฉลี่ยของรายได้ระหว่างคนสองคนที่เป็นไปได้ทั้งหมดหารด้วยรายได้เฉลี่ย
ตัวอย่างเช่น ในกราฟของตัวอย่างข้างต้น รายได้ของคน 4 คนคือ [1, 2, 4, 8] ดังนั้นจึงมีความแตกต่างที่เป็นไปได้ 16 รายการ ได้แก่ [0, 1, 3, 7, 1, 0, 2 , 6 , 3, 2, 0, 4, 7, 6, 4, 0]. จากนี้ ความแตกต่างเฉลี่ยคือ 2.875 ในขณะที่รายได้เฉลี่ยคือ 3.75 ดังนั้นค่าสัมประสิทธิ์ Gini=2.8752/ (2*3.75) ≈ 0.3833
ปรากฎว่าค่าทั้งสองมีค่าเท่ากัน (พิสูจน์ได้ว่านี่เป็นแบบฝึกหัดสำหรับผู้อ่าน)!
เกิดอะไรขึ้นกับค่าสัมประสิทธิ์ Gini?
ค่าสัมประสิทธิ์ Gini นั้นน่าสนใจเพราะเป็นสถิติที่ค่อนข้างเรียบง่ายและเข้าใจง่าย อาจดูไม่ง่าย แต่เชื่อฉันเถอะว่าสถิติเกือบทั้งหมดที่เกี่ยวข้องกับประชากรทุกขนาดนั้นแย่และมักจะแย่กว่านั้น ดูสูตรเป็นค่าเบี่ยงเบนมาตรฐานพื้นฐาน:
และค่าสัมประสิทธิ์ Gini คือ:
มันง่ายมาก ฉันสัญญา!
แล้วเกิดอะไรขึ้นกับมัน? จริงๆแล้วมันมีปัญหามากมาย และผู้คนก็เขียนเกี่ยวกับปัญหาต่างๆ เกี่ยวกับค่าสัมประสิทธิ์จินี่มามากแล้ว ในบทความนี้ ฉันจะมุ่งเน้นไปที่ประเด็นที่ฉันเชื่อว่ามีการพูดคุยกันไม่ทั่วถึงในฟิลด์ Gini ทั้งหมด แต่มีความเกี่ยวข้องอย่างยิ่งกับการวิเคราะห์ความไม่เท่าเทียมกันในชุมชนอินเทอร์เน็ต เช่น บล็อกเชน ค่าสัมประสิทธิ์ Gini รวมสองประเด็นที่แตกต่างกันมากจริงๆ—ความทุกข์ทรมานจากการขาดทรัพยากรและการกระจุกตัวของอำนาจ—เป็นดัชนีความไม่เท่าเทียมกันเดียว
เพื่อทำความเข้าใจความแตกต่างระหว่างสองปัญหาให้ชัดเจนยิ่งขึ้น ลองมาดูโทเปียสองแบบ:
ดิสโทเปีย A: ประชากรครึ่งหนึ่งแบ่งปันทรัพยากรทั้งหมดเท่าๆ กัน และที่เหลือไม่ได้รับอะไรเลย
Dystopia B: คนคนหนึ่งเป็นเจ้าของทรัพยากรทั้งหมดครึ่งหนึ่ง และคนอื่นๆ แบ่งครึ่งที่เหลือเท่าๆ กัน
นี่คือเส้นโค้ง Lorenz แบบดิสโทเปียสองเส้น (ไดอะแกรมที่ดีเหมือนที่เราเห็นด้านบน):
เห็นได้ชัดว่าทั้งโทเปียไม่ใช่สถานที่ที่น่าอยู่ แต่ก็ไม่เหมาะสำหรับชีวิตด้วยเหตุผลเดียวกัน ดิสโทเปีย A เปรียบได้กับการให้โอกาสผู้อยู่อาศัยแต่ละคนในการโยนเหรียญ ถ้ามันลงทางซ้าย มันจะเผชิญกับความอดอยากจำนวนมาก ถ้ามันลงทางขวา มันจะเป็นความปรองดองที่เกิดจากสันติภาพและความเสมอภาค ถ้าคุณเป็นธานอส คุณอาจจะชอบมัน! ถ้าไม่ใช่ จงหลีกเลี่ยงด้วยกำลังทั้งหมดที่มี ในทางกลับกัน Dystopia B นั้นคล้ายกับ "โลกใหม่ที่กล้าหาญ": ทุกคนมีชีวิตที่ดีพอใช้ (อย่างน้อยที่สุดเมื่อถ่ายภาพทรัพยากรของทุกคน) แต่โครงสร้างอำนาจที่ไม่เป็นประชาธิปไตยอย่างลึกซึ้งนั้นให้บริการ สำหรับราคา คุณ ดีกว่าหวังว่าคุณจะมีผู้ปกครองที่ดี หากคุณคือเคอร์ติส ยาวิน คุณอาจจะชอบ หากคุณไม่ใช่ คุณควรพยายามอย่างเต็มที่เพื่อหลีกเลี่ยง
ประเด็นทั้งสองนี้แตกต่างกันมากจนสมควรได้รับการวิเคราะห์และวัดผลแยกกัน ความแตกต่างนี้ไม่ใช่แค่ทางทฤษฎีเท่านั้น แผนภูมิด้านล่างแสดงส่วนแบ่งของรายได้รวมที่ได้รับโดยกลุ่ม 20% ล่างสุด (ซึ่งเป็นตัวบ่งชี้ที่เหมาะสมในการหลีกเลี่ยง Dystopia A) เทียบกับส่วนแบ่งรายได้รวมที่ได้รับจากกลุ่ม 1% แรก (ซึ่งใกล้เคียงกับกลุ่มต่อต้านสหรัฐฯ ตัวบ่งชี้ที่เหมาะสมของ ยูโทเปีย B) ความคมชัด:
ที่มา: https://data.worldbank.org/indicator/SI.DST.FRST.20 (ข้อมูลรวมของปี 2015 และ 2016) และ http://hdr.undp.org/en/indicators/186106
ทั้งสองมีความสัมพันธ์กันอย่างชัดเจน (ค่าสัมประสิทธิ์สหสัมพันธ์คือ -0.62 ) แต่ยังห่างไกลจากความสัมพันธ์อย่างมาก (เจ้าหน้าที่ทางสถิติเห็นได้ชัดว่า 0.7 เป็นเกณฑ์ที่ต่ำกว่าสำหรับ "ความสัมพันธ์สูง" และเราได้ค่าที่ต่ำกว่านั้น) มีมิติที่สองที่น่าสนใจในแผนภูมิที่ต้องวิเคราะห์ - ประเทศที่ 1% แรกได้รับ 20% ของรายได้ทั้งหมด ในขณะที่ 20% ล่างได้รับ 3% เทียบกับ 1% แรกที่ได้รับ 20% ของรายได้ทั้งหมดเทียบกับด้านล่าง อะไรคือความแตกต่าง ระหว่างประเทศที่คน 20% มีรายได้ 7% ของรายได้ทั้งหมด? อนิจจา การสำรวจนี้เหมาะที่สุดสำหรับนักสำรวจข้อมูลและวัฒนธรรมที่มีประสบการณ์และกล้าได้กล้าเสียมากกว่าฉัน
เหตุใดการใช้ค่าสัมประสิทธิ์ Gini ในชุมชนนอกพื้นที่ (เช่น อินเทอร์เน็ตหรือชุมชนเข้ารหัสลับ) จึงเป็นปัญหาอย่างมาก
การกระจุกตัวของความมั่งคั่งเป็นประเด็นสำคัญอย่างยิ่งในโลกของบล็อกเชน และเป็นสิ่งที่สมควรได้รับการวัดผลและทำความเข้าใจ สิ่งนี้มีความสำคัญต่อโลกของบล็อกเชน เนื่องจากผู้คนจำนวนมาก (และการไต่สวนของวุฒิสภาสหรัฐฯ) กำลังพยายามค้นหาว่าสกุลเงินดิจิตอลใดที่ต่อต้านชนชั้นสูงอย่างแท้จริง และในระดับใดที่มันจะเข้ามาแทนที่ชนชั้นสูงเก่าด้วยสกุลเงินใหม่ สิ่งนี้สำคัญมากเช่นกันเมื่อเปรียบเทียบสกุลเงินดิจิทัลต่างๆ
ในการจัดหา cryptocurrency เริ่มต้น มันเป็นความไม่เท่าเทียมกันชนิดหนึ่งที่โทเค็นบางส่วนถูกแจกจ่ายโดยตรงไปยังบุคคลภายในที่เฉพาะเจาะจง โปรดทราบว่าตัวเลขสำหรับ Ethereum ออกเล็กน้อย: คนวงในและฐานรากควรเป็น 12.3% และ 4.2% ไม่ใช่ 15% และ 5%
เมื่อพิจารณาถึงประเด็นเหล่านี้ จึงไม่น่าแปลกใจเลยที่หลายคนพยายามคำนวณดัชนี Gini สำหรับ cryptocurrencies:
ดัชนี Gini ของโทเค็น EOS ที่น่าสนใจ (2018)
ค่าสัมประสิทธิ์ Gini ของ Cryptocurrency (2018)
การวัดระดับการกระจายอำนาจใน Bitcoin และ Ethereum โดยใช้เมตริกและความละเอียดหลายรายการ (ปี 2021 รวมถึงค่าสัมประสิทธิ์ Gini และอีกสองเมตริก)
Nouriel Roubini เปรียบเทียบค่าสัมประสิทธิ์ Gini ของ Bitcoin กับเกาหลีเหนือ (2018)
ข้อมูลเชิงลึกเกี่ยวกับเครือข่ายในตลาด cryptocurrency (2021 โดยใช้ค่าสัมประสิทธิ์ Gini เพื่อวัดการรวมศูนย์)
และก่อนหน้านี้เราต้องจัดการกับบทความบล็อกบัสเตอร์จากปี 2014:
นอกเหนือจากข้อผิดพลาดเกี่ยวกับระเบียบวิธีทั่วไปที่การวิเคราะห์ดังกล่าวมักเกิดขึ้น (มักทำให้รายได้กับความมั่งคั่งหรือผู้ใช้มีบัญชี) ตรงกัน พวกเขายังมีปัญหาร้ายแรงและละเอียดอ่อนเกี่ยวกับการใช้ค่าสัมประสิทธิ์ Gini เพื่อทำการเปรียบเทียบประเภทนี้ คำถามนี้อยู่ในความแตกต่างที่สำคัญระหว่างชุมชนทางภูมิศาสตร์ทั่วไป (เช่น เมือง ประเทศ) และชุมชนอินเทอร์เน็ตทั่วไป (เช่น บล็อกเชน):
ผู้อยู่อาศัยโดยทั่วไปของชุมชนทางภูมิศาสตร์ใช้เวลาและทรัพยากรส่วนใหญ่ในชุมชนนั้น ดังนั้นความไม่เท่าเทียมกันที่วัดได้ในชุมชนทางภูมิศาสตร์จึงสะท้อนถึงความไม่เท่าเทียมกันของทรัพยากรทั้งหมดที่มีให้กับผู้คน แต่ในชุมชนอินเทอร์เน็ต การวัดความไม่เท่าเทียมกันอาจมาจากสองแหล่ง: (i) การแบ่งปันทรัพยากรทั้งหมดที่ไม่เท่ากันซึ่งผู้กระทำแต่ละคนได้รับ และ (ii) ระดับความสนใจที่แตกต่างกันในการมีส่วนร่วมในชุมชน
คนธรรมดาที่มีเงิน 15 ดอลลาร์อยู่ในเงินปกตินั้นยากจน และไม่มีความสามารถที่จะมีชีวิตที่ดีได้ ผู้ชายทั่วไปที่มีเงินดิจิทัลมูลค่า $15 เป็นงานอดิเรกที่เปิดกระเป๋าเงินเพื่อความสนุกสนาน การมีความสนใจในระดับต่างๆ กันเป็นเรื่องดี ทุกชุมชนมีทั้งมือสมัครเล่นและแฟนพันธุ์แท้ฮาร์ดคอร์ที่ไม่มีชีวิต ดังนั้นหากสกุลเงินดิจิทัลมีค่าสัมประสิทธิ์ Gini สูงมาก แต่ส่วนใหญ่ของความไม่เท่าเทียมกันนั้นเกิดจากระดับความสนใจที่แตกต่างกัน ตัวเลขดังกล่าวชี้ให้เห็นถึงความเป็นจริงที่เลวร้ายน้อยกว่าที่พาดหัวข่าวแนะนำ
Cryptocurrencies แม้กระทั่งผู้ที่มีอำนาจควบคุมอย่างสูงอยู่แล้ว จะไม่เปลี่ยนไปที่ใดในโลกใกล้กับ Dystopia A แต่สกุลเงินดิจิทัลที่มีการกระจายต่ำอาจมีลักษณะเหมือน Dystopia B และปัญหาจะทวีคูณขึ้นหากใช้การกำกับดูแลการลงคะแนนโทเค็นในการตัดสินใจเกี่ยวกับโปรโตคอล ดังนั้น เพื่อระบุปัญหาที่น่าเป็นห่วงที่สุดสำหรับชุมชนคริปโต เราต้องการเมตริกที่เฉพาะเจาะจงมากขึ้นซึ่งสะท้อนสิ่งที่ใกล้เคียงกับ Dystopia B
Proxy Metrics: ปัญหาในการวัดค่า Dystopia A และ Dystopia B แยกกัน
อีกวิธีหนึ่งในการวัดความไม่เท่าเทียมกันคือการประมาณการความทุกข์ที่เกิดจากการกระจายทรัพยากรที่ไม่เท่าเทียมกัน (เช่น ปัญหา "ดิสโทเปีย เอ") ขั้นแรก ให้เริ่มด้วยฟังก์ชันอรรถประโยชน์ซึ่งแสดงถึงมูลค่าของการมีเงินจำนวนหนึ่ง หลายคนใช้ log(x) เพราะมันให้ค่าประมาณของรายได้ที่เพิ่มขึ้นเป็นสองเท่าและใช้ได้กับทุกระดับ: ผลประโยชน์ที่เพิ่มขึ้นของการเปลี่ยนจาก $10,000 เป็น $20,000 จะเหมือนกับการเพิ่มจาก $5,000 เป็น $10,000 $ หรือจาก $40,000 เป็น 80,000 เหรียญเท่ากัน จากนั้นผลลัพธ์ที่ได้คือปริมาณสาธารณูปโภคที่สูญเสียไปเมื่อเทียบกับการที่แต่ละคนสามารถรับรายได้เฉลี่ยเท่านั้น:
เทอมแรก (ลอการิทึมของค่าเฉลี่ย) คือยูทิลิตี้ที่แต่ละคนจะได้รับหากมีการกระจายเงินอย่างสมบูรณ์ ดังนั้นทุกคนจะได้รับรายได้เฉลี่ย ระยะที่สอง (mean of the log) คือค่าเฉลี่ยของระบบเศรษฐกิจในปัจจุบัน หากคุณมองอย่างแคบๆ ว่าทรัพยากรเป็นสิ่งที่ใช้เพื่อการบริโภคส่วนบุคคล ความแตกต่างระหว่างทั้งสองหมายถึงการสูญเสียอรรถประโยชน์เนื่องจากความไม่เท่าเทียมกัน มีวิธีอื่นในการกำหนดสูตรนี้ แต่ทั้งหมดก็ใกล้เคียงกัน (เช่น เอกสารของ Anthony Atkinson ในปี 1969 เสนอดัชนี "ระดับดุลยภาพของการกระจายรายได้ที่เท่าเทียมกัน" ใน U(x) =log(x) มันคือ เป็นเพียงฟังก์ชันเสียงเดียวในสูตรด้านบน และเลขชี้กำลัง L มีค่าเท่ากับสูตรข้างต้นในทางคณิตศาสตร์โดยสมบูรณ์)
และในการวัดปัญหาการกระจุกตัวของทรัพยากร (หรือปัญหา "Dystopia B") จุดเริ่มต้นที่ดีคือดัชนี Herfindahl-Hirschman (เรียกสั้นๆ ว่า HHI) ซึ่งใช้ในการวัดการกระจุกตัวทางเศรษฐกิจในอุตสาหกรรมต่างๆ :
คำอธิบายภาพ
HHI: พื้นที่สีเขียวหารด้วยพื้นที่ทั้งหมด
มันมีทางเลือกอื่น ดัชนี Theil T มีความคล้ายคลึงกันบ้างแต่ก็มีความแตกต่างเช่นกัน ทางเลือกที่ง่ายกว่าและโง่กว่าคือค่าสัมประสิทธิ์นากาโมโตะ: จำนวนผู้เข้าร่วมขั้นต่ำที่ต้องรวมกันมากกว่า 50% ของจำนวนทั้งหมด โปรดทราบว่าตัวบ่งชี้ความเข้มข้นทั้งหมดเหล่านี้มุ่งเน้นไปที่สิ่งที่เกิดขึ้นใกล้กับจุดสูงสุด (และโดยเจตนา): มือสมัครเล่นจำนวนมากที่มีทรัพยากรน้อยมีส่วนร่วมเพียงเล็กน้อยหรือไม่มีเลยในดัชนี ในขณะที่พฤติกรรมของผู้เล่นอันดับสูงสุดสองคนรวมกันอาจมีมาก ผลกระทบอย่างมากต่อเมตริกนี้
ความเข้มข้นของทรัพยากรเป็นหนึ่งในความเสี่ยงที่ใหญ่ที่สุดต่อระบบสำหรับชุมชน crypto แต่คนที่มีโทเค็นเพียง 0.00013 ไม่ได้พิสูจน์ว่าพวกเขากำลังหิวโหย แต่นั่นคือวิธีคิดของดัชนีเหล่านี้ แต่สำหรับรัฐแล้ว การกระจุกตัวของอำนาจและความทุกข์ทรมานจากการขาดทรัพยากรควรได้รับการพูดถึงและวัดผลแยกกัน
ที่กล่าวว่า ในบางจุดเราต้องมองข้ามเมตริกเหล่านี้ อันตรายที่เกิดจากปัญหาสมาธิไม่ได้เป็นเพียงขนาดของตัวแสดงเท่านั้น แต่ยังขึ้นอยู่กับตัวแสดงและความสามารถในการสมรู้ร่วมคิดด้วย ในทำนองเดียวกัน การจัดสรรทรัพยากรขึ้นอยู่กับเครือข่าย: การขาดทรัพยากรที่เป็นทางการจะไม่เป็นอันตรายหากผู้ที่ขาดทรัพยากรเหล่านี้มีเครือข่ายที่ไม่เป็นทางการในการเข้าถึง แต่การจัดการกับปัญหาเหล่านี้นั้นยากกว่ามาก ดังนั้นเราจึงต้องการเครื่องมือที่เรียบง่ายกว่านี้ ในขณะที่เรายังมีข้อมูลให้ใช้งานน้อยกว่า
ลิงค์ต้นฉบับ: https://vitalik.ca/general/2021/07/29/gini.html
