BTC
ETH
HTX
SOL
BNB
ดูตลาด
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

คิดใหม่และทำความเข้าใจ "ข้อมูลคือน้ำมัน": การประมวลผลความเป็นส่วนตัวปกป้องอธิปไตยของ

Winkrypto
特邀专栏作者
2021-07-05 08:33
บทความนี้มีประมาณ 5104 คำ การอ่านทั้งหมดใช้เวลาประมาณ 8 นาที
ในขณะนี้ คุณค่าและความปลอดภัยของข้อมูลเป็นสิ่งที่ควรค่าแก่การคิดใหม่มากขึ้น
สรุปโดย AI
ขยาย
ในขณะนี้ คุณค่าและความปลอดภัยของข้อมูลเป็นสิ่งที่ควรค่าแก่การคิดใหม่มากขึ้น

บทความนี้เผยแพร่ครั้งแรกในปี 2019 นำเสนอความรู้เบื้องต้นพื้นฐานที่สุดสำหรับการทำความเข้าใจรูปแบบธุรกิจการประมวลผลความเป็นส่วนตัว ชื่อเดิม: "ข้อมูลมีค่ามากกว่าน้ำมัน แต่จะได้มาอย่างไร" "; ผู้แต่ง: Li Hua.

"โบรกเกอร์" เผยแพร่บทความหน้าปกเมื่อต้นปี 2560 โดยกล่าวว่า "ข้อมูลจะมาแทนที่น้ำมัน" เป็นทรัพยากรที่มีค่าที่สุดในยุคปัจจุบัน แต่จนถึงวันนี้ คนธรรมดาที่เป็นเจ้าของอำนาจอธิปไตยของ "ดาต้าออยล์" ก็ยังไม่สามารถได้รับประโยชน์จากทรัพยากรอันมีค่านี้

ในทางตรงกันข้าม ข้อมูลเหล่านี้ยังนำปัญหาการรั่วไหลของข้อมูลส่วนบุคคลมาสู่เจ้าของข้อมูลเหล่านั้นด้วย

เหตุใดจึงมีช่องว่างขนาดใหญ่ระหว่างการมองเห็นที่สวยงามและความเป็นจริง ความเป็นเจ้าของข้อมูลและมูลค่าของข้อมูลจะเกิดขึ้นได้อย่างไร? บทความนี้พยายามอภิปรายจากแนวปฏิบัติที่มีอยู่ โดยหวังว่าจะชี้แจงเงื่อนงำบางอย่างและนำไปสู่การสร้างกรอบความคิดเกี่ยวกับประเด็นนี้

เราไม่สามารถขายข้อมูลได้

ผมเชื่อว่าเราแต่ละคนมีประสบการณ์ในการรับสายการขาย ข้อมูลส่วนบุคคลของผู้คนส่วนใหญ่ถูกซื้อและขาย ข้อมูลที่ง่ายที่สุด เช่น หมายเลขโทรศัพท์และข้อมูลผู้บริโภคบางส่วน ข้อมูลเหล่านี้อาจกำลังรอการขายอีกครั้ง ณ ที่ใดที่หนึ่งในขณะนี้

ข้อมูลขายได้เงิน และเงินจะถูกส่งไปยังสถาบันที่สามารถเข้าถึงข้อมูลของเราได้

ปรากฏการณ์นี้มักจะนำไปสู่ความเข้าใจผิด กล่าวคือ เราคิดว่าเราสามารถรู้คุณค่าของข้อมูลได้โดยการขายข้อมูล กล่าวคือ หลังจากที่เรามีอธิปไตยของข้อมูลด้วยความช่วยเหลือจากบทบัญญัติทางกฎหมายและวิธีการทางเทคนิคแล้ว เราก็สามารถขายข้อมูลเหล่านี้ให้กับ ผู้ที่ต้องการเพื่อให้ได้มูลค่าข้อมูลและขาย "น้ำมัน" เป็นเงิน

แต่นี่เป็นสิ่งที่ผิด เราไม่สามารถซื้อหรือขายข้อมูลได้ ก่อนที่จะลงรายละเอียดในประเด็นนี้ เราจำเป็นต้องแยกความแตกต่างระหว่างความเป็นเจ้าของข้อมูลและสิทธิ์การใช้ข้อมูล

สำหรับสินทรัพย์ส่วนใหญ่ในโลก การซื้อและขายหมายถึงการโอนการเป็นเจ้าของสินทรัพย์ ฝ่ายหนึ่งได้กรรมสิทธิ์ และอีกฝ่ายสูญเสียความเป็นเจ้าของ แต่การซื้อและขายข้อมูลจะไม่โอนความเป็นเจ้าของข้อมูล คุณขายข้อมูล แต่ความเป็นเจ้าของข้อมูลยังคงเป็นของคุณ

ดังนั้น ธุรกรรมรอบข้อมูลจริง ๆ แล้วคือธุรกรรมรอบสิทธิ์การใช้ข้อมูล ไม่ใช่ความเป็นเจ้าของข้อมูล แต่เนื่องจากข้อมูลสามารถคัดลอกได้อย่างไม่สิ้นสุด หากเราขายข้อมูล จึงไม่รับประกันว่าผู้ซื้อจะใช้ข้อมูลนั้นอย่างไร และข้อมูลจะถูกขายอีกหรือไม่ ที่แน่นอนกว่านั้น เราได้ "สูญเสีย" ข้อมูลไปบ้าง แม้ว่าเราจะ เป็นเจ้าของข้อมูล

ธุรกรรมข้อมูลที่ผิดกฎหมายจะซื้อและขายข้อมูลโดยตรงเพราะไม่ใส่ใจในสิทธิ์และผลประโยชน์ของเจ้าของข้อมูล แต่เมื่อเราเป็นเจ้าของข้อมูลจริง ๆ เพื่อที่จะตระหนักถึงคุณค่าของข้อมูล เราไม่สามารถซื้อหรือขายข้อมูลได้

ดังนั้นคุณจะแลกเปลี่ยนการเข้าถึงข้อมูลโดยไม่สูญเสียข้อมูลได้อย่างไร คำตอบคือไม่ใช่การซื้อขายข้อมูล แต่เป็นเพียงผลการคำนวณของข้อมูลการค้าเท่านั้น กล่าวคือ ผู้ซื้อสามารถใช้ข้อมูลเหล่านี้เพื่อทำการคำนวณและรับผลลัพธ์ที่ต้องการ แต่ผู้ซื้อไม่สามารถรับข้อมูลต้นฉบับได้

นี่เป็นสิ่งแรกและอาจสำคัญที่สุดที่ต้องทำความเข้าใจเมื่อเราพูดถึงความเป็นเจ้าของข้อมูลและมูลค่าของข้อมูล เราไม่สามารถรับรู้มูลค่าของข้อมูลด้วยการขายข้อมูล โดยการขายผลลัพธ์ของข้อมูลเท่านั้น

กล่าวอีกนัยหนึ่ง เราจำเป็นต้องแยกความเป็นเจ้าของข้อมูลออกจากสิทธิ์ในการใช้ และแลกเปลี่ยนเฉพาะสิทธิ์ในการใช้ข้อมูลเท่านั้น

การประมวลผลความเป็นส่วนตัวไม่ได้มีไว้สำหรับปัญหาความเป็นส่วนตัวของผู้ใช้เท่านั้น

จะรับรู้ผลลัพธ์จากการขายข้อมูลเพียงอย่างเดียวได้อย่างไร? คำตอบคือ: ผ่านคอมพิวเตอร์ส่วนบุคคล

การคำนวณความเป็นส่วนตัวคือการคำนวณข้อมูลโดยไม่เปิดเผยข้อมูลต้นฉบับ และสามารถตรวจสอบผลการคำนวณได้ ประกอบด้วยแนวทางการวิจัยที่หลากหลาย เช่น การเข้ารหัสแบบโฮโมมอร์ฟิคอย่างสมบูรณ์และการประมวลผลแบบหลายฝ่ายที่ปลอดภัย มีบทความทางเทคนิคระดับมืออาชีพมากมายที่แนะนำหลักการทำงาน หากคุณต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับสิ่งเหล่านี้ คุณสามารถตรวจสอบได้

ในที่นี้ เรามีความคลุมเครือประการที่สองที่ต้องชี้แจง กล่าวคือ การประมวลผลเพื่อความเป็นส่วนตัวไม่เพียงแต่ปกป้องความเป็นส่วนตัวของผู้ใช้ แต่ยังเป็นพื้นฐานสำหรับการทำธุรกรรมสิทธิ์การใช้ข้อมูล นั่นคือ พื้นฐานสำหรับการตระหนักถึงคุณค่าของข้อมูล

เหตุผลที่จำเป็นต้องชี้แจงนี้เป็นเพราะ "การประมวลผลความเป็นส่วนตัว" เข้าใจได้ง่ายว่าเป็นเทคโนโลยีการปกป้องความเป็นส่วนตัวอื่น และเน้นที่ "ความเป็นส่วนตัว" แต่ในความเป็นจริง จุดสนใจของ "การประมวลผลความเป็นส่วนตัว" อยู่ที่ "การคำนวณ"

ในอุตสาหกรรมบล็อกเชน เนื่องจากการประมวลผลความเป็นส่วนตัวมักใช้ในธุรกรรมสกุลเงินดิจิทัลและบนบล็อกเชนเป็นวิธีการเพิ่มความเป็นส่วนตัวของผู้ใช้ ดังนั้น ผู้คนจึงเข้าใจการประมวลผลความเป็นส่วนตัวได้ง่ายขึ้นว่าให้บริการความเป็นส่วนตัวของผู้ใช้จริง ความเข้าใจนี้ไม่ผิด แต่ มันจำกัดการประมวลผลความเป็นส่วนตัวให้อยู่ในช่องเล็กๆ

บางทีการมองจากมุมอื่นอาจชัดเจนขึ้น เราแบ่งปัญหาข้อมูลออกเป็นประเด็นความเป็นส่วนตัวของผู้ใช้และปัญหามูลค่าข้อมูล ปัญหาความเป็นส่วนตัวของผู้ใช้คือการแก้ปัญหาที่ข้อมูลเดิมที่เกี่ยวข้องกับผู้ใช้จะไม่ถูกเปิดเผยและความเป็นส่วนตัวของผู้ใช้จะไม่ถูกเปิดเผยเราอาจถือว่าปัญหานี้เป็นการคุ้มครองความเป็นส่วนตัวของข้อมูลภายในขอบเขตที่กำหนด .

ในขั้นตอนนี้ บทบาทของคอมพิวเตอร์ส่วนบุคคลเป็นอีกแนวทางหนึ่งในการปกป้องความเป็นส่วนตัว

หลังจากที่ผู้ใช้ได้รับความเป็นส่วนตัวของข้อมูล ถ้าเขา/องค์กรเลือกที่จะใส่ข้อมูลไว้ที่นั่นและไม่ทำอะไรเลย เรื่องราวก็จบลง แต่ถ้าผู้ใช้/องค์กรต้องการดำเนินการต่อไปและได้รับคุณค่าของข้อมูล พวกเขาจะต้องนำข้อมูลออกไป และใช้งานมัน สิ่งต่าง ๆ ได้เข้าสู่ขั้นตอนต่อไปแล้ว ในเวลานี้ จำเป็นต้องใช้วิธีการต่าง ๆ เพื่อให้แน่ใจว่าข้อมูลจะไม่รั่วไหลตลอดวงจรชีวิตของการใช้งาน เราถือว่า นี่คือความเป็นส่วนตัวของข้อมูลอย่างเต็มรูปแบบ การป้องกัน

ในขั้นตอนนี้ บทบาทของการประมวลผลความเป็นส่วนตัวไม่ใช่วิธีการทางเลือกอีกต่อไปแต่เป็นเส้นทางที่จำเป็นเพราะวิธีในการตระหนักถึงคุณค่าของข้อมูลคือการขายผลลัพธ์ข้อมูลโดยไม่เปิดเผยข้อมูลต้นฉบับและดำเนินการใช้ข้อมูล ความเป็นส่วนตัว เท่านั้น คอมพิวเตอร์สามารถบรรลุเป้าหมายนี้ได้

หากเปรียบเทียบข้อมูลกับน้ำมัน แล้ว Privacy Computing คือกระบวนการแรกของการกลั่นน้ำมัน เป็นพื้นฐาน ที่เราจะแปลง "น้ำมันดิบ" เป็นผลิตภัณฑ์ต่างๆ

ไม่ใช่ข้อมูลทั้งหมดที่มีค่าใกล้เคียงกัน

ไม่ใช่ข้อมูลทั้งหมดที่มีค่าใกล้เคียงกัน และไม่ใช่ข้อมูลทั้งหมดที่สามารถบรรลุมูลค่าข้อมูลได้ นี่อาจเป็นอีกจุดหนึ่งที่เราต้องชัดเจนเมื่อพูดถึงคุณค่าของข้อมูล

ก็ต่อเมื่อเราเข้าใจความซับซ้อนและความหลากหลายของข้อมูลเท่านั้น จึงจะสามารถใช้ข้อกำหนดและวิธีการต่างๆ ได้อย่างถูกต้องตามกฎหมายและทางเทคนิคสำหรับสถานการณ์ต่างๆ เพื่อแก้ปัญหาอย่างแท้จริง

บทความนี้จะพยายามแบ่งหมวดหมู่ข้อมูลอย่างง่ายจากมุมมองของแอปพลิเคชัน จากนั้นแนะนำค่าข้อมูลของข้อมูลประเภทนี้ วิธีการจัดประเภทข้อมูลที่เสนอนี้ไม่จำเป็นต้องครอบคลุมและถูกต้อง แต่ทำหน้าที่สร้างกรอบพื้นฐานสำหรับการอภิปราย

เราสามารถแบ่งข้อมูลออกเป็นสามประเภท:

  • ประเภทแรกคือข้อมูลประจำตัว

  • ประเภทที่สองคือข้อมูลพฤติกรรม

  • ประเภทที่สามคือข้อมูลมูลค่าผลผลิต

ข้อมูลประจำตัวประเภทแรกใช้สำหรับการลงทะเบียนและระบุตัวตนบนอินเทอร์เน็ตและในโลกแห่งความเป็นจริง เช่น หมายเลขประจำตัวประชาชน หมายเลขโทรศัพท์ ข้อมูลบัญชี เป็นต้น ข้อมูลประเภทนี้มีค่ามากที่สุดสำหรับอุตสาหกรรมผิดกฎหมาย และครั้งหนึ่ง รั่วไหลออกมายังจะก่อให้เกิดอันตรายร้ายแรงต่อผู้ใช้อีกด้วย อันตราย ด้านความปลอดภัยครั้งใหญ่ แต่สำหรับอุตสาหกรรมข้อมูลอย่างเป็นทางการ ข้อมูลประเภทนี้ไม่มีค่าทางการคำนวณ และไม่สามารถคำนวณผลลัพธ์ที่มีความหมายได้

ดังนั้น ข้อมูลประเภทนี้เองจึงไม่จำเป็นต้องคำนึงถึงวิธีการรับรู้คุณค่าของข้อมูลผ่านการประมวลผลความเป็นส่วนตัว

ประเภทที่สองคือข้อมูลพฤติกรรม ซึ่งรวมถึงร่องรอยการเรียกดูของผู้ใช้บนอินเทอร์เน็ต ข้อมูลการบริโภค และข้อมูลพฤติกรรมการใช้ผลิตภัณฑ์ของผู้ใช้ ข้อมูลเหล่านี้สามารถคำนวณเพื่อสร้างภาพส่วนตัวของผู้ใช้ จากนั้นจึงส่งโฆษณา ผลักดันเนื้อหา ให้บริการ และแม้แต่ขายความคิดเห็นให้กับผู้ใช้ตามภาพดังกล่าว

ข้อมูลพฤติกรรมมีคุณค่าสองประเภท หนึ่งคือ คุณค่าของการโฆษณา เราทุกคนรู้ว่าการโฆษณาเกือบทั้งหมดสนับสนุนอุตสาหกรรมอินเทอร์เน็ตทั้งหมด อีกประการหนึ่งคือสามารถช่วยให้ผลิตภัณฑ์เข้าใจผู้ใช้และให้บริการส่วนบุคคลที่ดีขึ้นแก่ผู้ใช้

ปัญหาความเป็นเจ้าของข้อมูลในปัจจุบันที่มีความกังวลและพูดถึงกันอย่างกว้างขวางทั่วโลกนั้นมุ่งเน้นไปที่ข้อมูลประเภทนี้เป็นหลัก เป็นเวลานานแล้วที่การอนุญาตต่างๆ ของข้อมูลประเภทนี้ยังไม่ชัดเจน และผู้คนไม่ได้ให้ความสนใจกับมัน เราไม่ได้ตระหนักถึงความร้ายแรงของปัญหาจนกระทั่งผลการคำนวณของข้อมูลเหล่านี้ถูกใช้มากขึ้นเรื่อยๆ เพื่อมีอิทธิพลต่อ หรือควบคุมเรา

เหตุการณ์สำคัญคือเหตุการณ์ประตูข้อมูลของ Facebook ในปี 2561 ในเหตุการณ์นี้บริษัทที่ดำเนินการด้านข้อมูลชื่อ Cambridge Analytica ได้รับข้อมูลของผู้ใช้ Facebook มากกว่า 50 ล้านคน ผ่านการคำนวณข้อมูล พวกเขาคัดกรองผู้ที่มีตำแหน่งทางการเมืองและวางโฆษณาโฆษณาชวนเชื่อทางการเมืองที่ตรงกันซึ่งส่งผลต่อการเลือกตั้งของสหรัฐฯ และการลงประชามติ Brexit ของสหราชอาณาจักร

ข่าวดีก็คือดูเหมือนว่าเราจะคืนความเป็นเจ้าของข้อมูลประเภทนี้ กฎระเบียบให้ความคุ้มครองข้อมูลส่วนบุคคลของผู้บริโภค (GDPR) ที่ประกาศใช้โดยสหภาพยุโรปกำหนดว่าบุคคลที่สร้างข้อมูลเป็นเจ้าของข้อมูล และเขามีสิทธิ์ที่จะขอให้ลบข้อมูลส่วนบุคคลของเขา ตลอดจนสิทธิ์ในการคัดค้านและขอให้ลบ หยุดการประมวลผลข้อมูลส่วนบุคคลของเขา

ข่าวร้ายคือเราไม่ได้รับสิทธิ์ในการใช้ข้อมูลคืนดังที่กล่าวไว้ก่อนหน้านี้มูลค่าของข้อมูลขึ้นอยู่กับการทำธุรกรรมของสิทธิ์ในการใช้ข้อมูลดังนั้นเรายังห่างไกลจากการใช้ข้อมูลประเภทนี้เพื่อ ตระหนักถึงคุณค่าของข้อมูลที่เป็นของผู้ใช้ . ความยากอยู่ที่:

ในแง่หนึ่ง แม้จะได้ชื่อว่าเป็นกฎระเบียบด้านการปกป้องข้อมูลที่เข้มงวดที่สุดในประวัติศาสตร์ แต่ GDPR กำหนดให้บริษัทต่างๆ แจ้งผู้ใช้ว่าข้อมูลใดกำลังถูกใช้และต้องทำอย่างไรกับข้อมูลก่อนที่จะใช้ข้อมูล กล่าวคือ จำกัดเฉพาะบริษัทจากการใช้ข้อมูลในทางที่ผิด แต่ไม่จำกัดการใช้ข้อมูลโดยองค์กร

ในทางกลับกัน เนื่องจากข้อมูลประเภทนี้สามารถใช้เพื่อช่วยให้ผลิตภัณฑ์เข้าใจผู้ใช้ จึงดูเหมือนเป็นการยากที่จะปฏิเสธบริษัทที่ใช้ข้อมูลเพื่อปรับปรุงประสบการณ์ของผู้ใช้ ซึ่งกำลังดำเนินการอยู่ในขณะนี้ ดูเหมือนว่าผู้ใช้จะยอมเสียสละประสบการณ์ของผู้ใช้เพื่อเรียกร้องให้บริษัทต่างๆ ไม่มีสิทธิ์ใช้ข้อมูลพฤติกรรมใดๆ และดูเหมือนยากยิ่งกว่าที่จะขอให้บริษัทต่างๆ แยกการใช้ข้อมูลดังกล่าวออกเป็นสองส่วนอย่างจริงจัง และโอนส่วนหนึ่งของมูลค่าการโฆษณา

นี่หมายความว่าธุรกิจต่างๆ ยังสามารถดำเนินการกับข้อมูลได้ตามปกติหรือไม่ ไม่เชิง. เราจะพบว่าการแยกความเป็นเจ้าของข้อมูลและสิทธิ์การใช้งานดังกล่าวข้างต้นเป็นเพียงตัวอักษร แม้ว่า บริษัท จะมีสิทธิ์ในการใช้ข้อมูลเท่านั้น แต่พวกเขา "ได้รับ" และใช้ข้อมูลต้นฉบับเองซึ่งทำให้ข้อมูลยังคงอยู่เพื่อการละเมิดและความปลอดภัย . ด้านของปัญหา.

และเนื่องจากการตื่นตัวของการรับรู้ความเป็นส่วนตัวของสาธารณะและการประกาศใช้กฎหมายคุ้มครองข้อมูลในประเทศต่างๆ (ทำให้ความรับผิดชอบด้านความปลอดภัยเป็นของบริษัทที่ใช้ข้อมูล) เมื่อเกิดปัญหาขึ้น บริษัทต่างๆ อาจเผชิญกับการต่อต้านจากผู้ใช้และค่าปรับจำนวนมหาศาล ดังนั้น เราจะเห็นได้ว่า Google บริษัทต่างๆ เช่น Apple กำลังทำการวิจัยจำนวนมากในด้านคอมพิวเตอร์ส่วนบุคคลในปัจจุบัน

ใช้ Google เป็นตัวอย่าง "การเรียนรู้แบบสมาพันธ์" รวมโมเดลการเรียนรู้ของเครื่องเข้ากับอุปกรณ์แต่ละเครื่อง และตระหนักถึงการประมวลผลความเป็นส่วนตัวผ่านอัลกอริทึมรวมที่รักษาความเป็นส่วนตัวและวิศวกรรมระบบเมื่อสรุปพารามิเตอร์ผู้ใช้และส่งไปยังคลาวด์

แต่จำเป็นต้องชี้ให้เห็นอีกครั้งว่าการแบ่งแยกความเป็นเจ้าของข้อมูลและสิทธิ์การใช้งานโดยองค์กรผ่านการประมวลผลความเป็นส่วนตัวนั้นไม่ใช่เพื่อให้ผู้ใช้แลกเปลี่ยนสิทธิ์การใช้ข้อมูล ทั้งนี้ พวกเขาหวังว่าจะลดความเสี่ยงของการใช้ข้อมูลและหลีกเลี่ยงการกล่าวหาว่าความเป็นส่วนตัวรั่วไหล ใช้ข้อมูลผู้ใช้ต่อไปได้ฟรี

ดังนั้นจึงเป็นหนทางที่ยาวไกลสำหรับผู้ใช้ในการรับค่าข้อมูลของข้อมูลประเภทนี้ ปัญหาใหญ่ที่สุดอยู่ที่การรับรู้ เมื่อเรามีความตระหนักรู้อย่างมากเกี่ยวกับความเป็นเจ้าของข้อมูลและสิทธิ์การใช้งาน เราจึงจะสามารถผลักดันให้รัฐบาลแนะนำการปกป้องข้อมูลที่เข้มงวดยิ่งขึ้น กฎระเบียบหรือส่งเสริมสถาปัตยกรรมอินเทอร์เน็ตใหม่เพื่อล้มล้างรูปแบบเซิร์ฟเวอร์แบบรวมศูนย์ในปัจจุบัน

“ข้อมูลมูลค่าผลผลิต” มีค่ามากที่สุด

หลังจากทำความเข้าใจ "ข้อมูลประจำตัว" และ "ข้อมูลพฤติกรรม" แล้ว เราจะแนะนำข้อมูลประเภทที่สาม ซึ่งเราเรียกว่า "ข้อมูลมูลค่าผลผลิต" ในบทความนี้

การใช้งานหลักของข้อมูลประเภทนี้คือการเรียนรู้ของเครื่องและฝึก AI ส่วนการใช้งานหลักอีกประการหนึ่งคือการวิเคราะห์ข้อมูลเพื่อช่วยในการวิจัยทางวิทยาศาสตร์ การออกแบบผลิตภัณฑ์ การตัดสินใจ ฯลฯ หากใช้ข้อมูลประเภทนี้อย่างเหมาะสมจะสามารถขับเคลื่อนสังคมให้พัฒนาไปในทิศทางที่มีประสิทธิภาพและเป็นมิตรมากขึ้น เป็น Productivity ชนิดหนึ่ง

ข้อมูลประเภทที่สามมีช่วงการรวบรวมที่กว้างที่สุดและมีจำนวนข้อมูลมากที่สุด อาจมาจากมนุษย์ เช่น ข้อมูลทางการแพทย์ส่วนบุคคลและข้อมูลทางการเงิน ข้อมูลนิสัยการใช้ผลิตภัณฑ์ส่วนบุคคล ฯลฯ นอกจากนี้ยังสามารถมาจากอุปกรณ์ IoT เช่น ข้อมูลสภาพบรรยากาศที่รวบรวมโดยเซ็นเซอร์ ข้อมูลการขับขี่อัตโนมัติ และอื่นๆ

แหล่งข้อมูลบางส่วนจะเหมือนกับข้อมูลประเภทที่สองซึ่งเป็นผู้ใช้ผลิตภัณฑ์อินเทอร์เน็ต แต่วิธีการประมวลผลและวัตถุประสงค์ของข้อมูลที่รวบรวมนั้นแตกต่างกัน: ข้อมูลประเภทที่สองได้รับจากผู้ใช้และใช้สำหรับผู้ใช้ ในขณะที่ ข้อมูลประเภทที่สองได้รับจากผู้ใช้และใช้สำหรับผู้ใช้ ข้อมูล 3 ประเภทถูกรวมและใช้ข้ามหัวเรื่องข้อมูล จากมุมมองของข้อมูล เราสามารถพิจารณาข้อมูลบางอย่างเป็นทั้งข้อมูลประเภทที่สองและข้อมูลประเภทที่สาม

ข้อมูลประเภทที่สามมีมูลค่าข้อมูลมากที่สุด และอาจเป็นกลุ่มแรกที่เข้าสู่ตลาดซื้อขายสิทธิ์การใช้ข้อมูลเพื่อให้ได้มูลค่าข้อมูล

แตกต่างจากข้อมูลประเภทที่สอง บริษัทอินเทอร์เน็ตมีสิทธิ์ใช้ข้อมูลและใช้ข้อมูลเอง และไม่จำเป็นต้องทำธุรกรรมข้อมูล ในสถานการณ์แอปพลิเคชันของข้อมูลมูลค่าการผลิต มีบทบาทที่ไม่ได้เป็นเจ้าของสิทธิ์ เพื่อใช้ข้อมูลแต่ต้องการใช้ข้อมูล จากมุมมองนี้ เราอาจคิดว่าข้อมูลประเภทที่สามหมายถึงการรวบรวมข้อมูลทั้งหมดที่สามารถแปลงเป็นตัวพิมพ์ใหญ่ได้

เราสามารถใช้ข้อมูลทางการแพทย์เป็นตัวอย่างเพื่อให้เข้าใจวิธีใช้ข้อมูลประเภทที่สามได้ดียิ่งขึ้น หากสถาบันวิจัยทางวิทยาศาสตร์หรือโรงงานผลิตยาได้รับการสนับสนุนจากข้อมูลทางการแพทย์จำนวนมากก็สามารถวิจัยโรคและพัฒนายาใหม่ได้ดีขึ้นและเร็วขึ้น อย่างไรก็ตาม สถาบันทางการแพทย์ที่มีแหล่งข้อมูลจะไม่แบ่งปันข้อมูลเหล่านี้เนื่องจากปัญหาความเป็นส่วนตัวของผู้ใช้และผลประโยชน์ของตนเอง . มีให้สำหรับสถาบันอื่น ๆ

หากเราแยกความเป็นเจ้าของและสิทธิ์การใช้ข้อมูลผ่านการคำนวณความเป็นส่วนตัว เราจะสามารถสร้างตลาดซื้อขายสำหรับสิทธิ์การใช้ข้อมูลได้ และข้อมูลของสถาบันทางการแพทย์ สถาบันวิจัยทางวิทยาศาสตร์ และโรงงานผลิตยาต่างๆ สามารถเชื่อมต่อกันบนแพลตฟอร์มนี้ ซึ่งเป็นคำกล่าวยอดนิยม กำลังทลายไซโลข้อมูล—สถาบันเหล่านี้สามารถแลกเปลี่ยนข้อมูลหรือแบ่งปันข้อมูลสำหรับการวิจัยโรคร่วม

หากเราต้องการฝึกฝน AI ให้สามารถวินิจฉัยโรคได้ เราก็จำเป็นต้องทำลายเกาะของข้อมูลด้วยวิธีการข้างต้น เพื่อให้ AI มีข้อมูลที่ครอบคลุมมากขึ้น

สิ่งที่ต้องย้ำอีกครั้งคือในขั้นตอนนี้ แม้ว่าธุรกรรมและมูลค่าของข้อมูลจะเกิดขึ้นจริงแล้วก็ตาม เนื่องจากขอบเขตทางกฎหมายและการใช้งานของสิทธิ์การใช้ข้อมูลยังไม่ชัดเจน ก็ยังเป็นเรื่องยากสำหรับเราในฐานะปัจเจกบุคคลที่จะได้รับคุณค่าทั้งหมดกลับคืนมา ของข้อมูล

ความเป็นเจ้าของและการเข้าถึงข้อมูลเป็นหนึ่งในปัญหาที่สำคัญที่สุดในยุคของเรา ตามที่นักประวัติศาสตร์ Yuval Noah Harari ผู้เขียน "A Brief History of Humanity" กล่าวว่า "หากเราต้องการหลีกเลี่ยงการรวมศูนย์อำนาจไว้ในมือของชนชั้นสูงกลุ่มเล็กๆ เกี่ยวกับการควบคุมการอนุญาตข้อมูล”

เนื่องจากความซับซ้อนและความหลากหลายของข้อมูลเอง การนิยามและแก้ปัญหาจากจุดเล็กๆ อาจรวดเร็วและมีประสิทธิภาพโดยมีขอบเขตที่ชัดเจนและคำอธิบายที่ถูกต้อง แทนที่จะหวังว่าความเห็นสาธารณะ กฎหมาย และเทคโนโลยีจะสามารถแก้ปัญหาโดยรวมได้ วิธี. เราสามารถจัดประเภทและวิเคราะห์ประเภทข้อมูลที่แตกต่างกันอย่างเฉพาะเจาะจงมากขึ้น หรือใช้มาตรฐานการจัดประเภทที่แตกต่างกันเพื่อหารือเกี่ยวกับการจำแนกประเภทข้อมูล จากนั้นจึงหารือเกี่ยวกับความเป็นส่วนตัวของข้อมูล ความเป็นเจ้าของข้อมูล และปัญหาการรับรู้มูลค่าข้อมูลตามข้อมูลนี้

ทำความเข้าใจใหม่ "ข้อมูลคือน้ำมัน"

ข้อมูลมักจะถูกเปรียบเทียบกับน้ำมัน

แม้ว่าจะมีบันทึกของมนุษย์ที่รวบรวมน้ำมันธรรมชาติตามชายฝั่งทะเลเดดซีในรูปแบบอักษรคูนิฟอร์ม แต่จนกระทั่งปี 1846 Abraham Kisner ได้คิดค้นวิธีการสกัดน้ำมันก๊าดจากถ่านหิน และในปี 1853 Ignacy Vukasiewicz และ Jan ได้กล่าวถึงประวัติศาสตร์ของปิโตรเลียมยุคใหม่ อุตสาหกรรมเริ่มต้นจริง ๆ เมื่อน้ำมันก๊าดกลั่นถูกแยกส่วนออกจากน้ำมันดิบ

แต่นี่เป็นเพียงจุดเริ่มต้นเท่านั้น ปิโตรเลียม เป็นเชื้อเพลิงสำหรับตะเกียงน้ำมันก๊าดไม่ได้มีความพิเศษเฉพาะเมื่อนำไปใช้ในเครื่องยนต์สันดาปภายในเท่านั้นที่จะระเบิดด้วยศักยภาพสูงและกลายเป็นทรัพยากรที่สำคัญที่สุดในโลก

ความคล้ายคลึงกันระหว่างข้อมูลและน้ำมันคือข้อมูลเพียงอย่างเดียวไม่เพียงพอ การตระหนักถึง "เทคนิคการกลั่นกรองข้อมูล" เท่านั้นจึงจะสามารถเปิดยุคของอุตสาหกรรมข้อมูลได้

ข้อแตกต่างระหว่างข้อมูลและน้ำมันคือน้ำมันมีโรงกลั่นก่อน จากนั้นจึงมีความต้องการเครื่องยนต์สันดาปภายใน ในขณะที่ข้อมูลมีความต้องการใช้อย่างมาก แต่ไม่มีเทคโนโลยีและโครงสร้างพื้นฐานที่สมบูรณ์เพื่อรองรับความต้องการนี้

อ้างอิง:

อ้างอิง:
1.《Federated Learning: Collaborative Machine Learning without Centralized Training Data》
2.《Helping organizations do more without collecting more data》

บริษัทใหญ่
ความปลอดภัย
คอมพิวเตอร์ความเป็นส่วนตัว
ยินดีต้อนรับเข้าร่วมชุมชนทางการของ Odaily
กลุ่มสมาชิก
https://t.me/Odaily_News
กลุ่มสนทนา
https://t.me/Odaily_CryptoPunk
บัญชีทางการ
https://twitter.com/OdailyChina
กลุ่มสนทนา
https://t.me/Odaily_CryptoPunk
ค้นหา
สารบัญบทความ
คลังบทความของผู้เขียน
Winkrypto
อันดับบทความร้อน
Daily
Weekly
ดาวน์โหลดแอพ Odaily พลาเน็ตเดลี่
ให้คนบางกลุ่มเข้าใจ Web3.0 ก่อน
IOS
Android