ACM SIGKDD2020 (Knowledge Discovery and Data Mining Conference) เป็นงานด้านวิทยาศาสตร์ข้อมูลชั้นนำ ระดับสูงสุด และมีอิทธิพลมากที่สุดในโลกทุกปี งานสัมมนา SDBD ระดับนานาชาตินี้มุ่งเน้นไปที่เทคโนโลยีที่เกิดขึ้นใหม่ เช่น ข้อมูลอัจฉริยะและบล็อกเชนในการประชุม KDD การประชุมเชิงปฏิบัติการพิเศษคือ - จัดโดย Singapore Management University และ Hashpower Think Tank
หยาน หลี่ ผู้ก่อตั้ง Hashpower Think Tank กล่าวว่า "ปีนี้ ประเทศยกระดับข้อมูลสู่ระดับของปัจจัยการผลิต นับเป็นการมาถึงของอุตสาหกรรมนี้ Hashpower Think Tank ได้ติดตามข้อมูลอัจฉริยะ การประมวลผลส่วนตัว และบริษัทที่ดีใน ติดตาม blockchain แอปพลิเคชันโดยหวังว่าจะส่งเสริมการพัฒนาอุตสาหกรรมและระบบนิเวศผ่านรายงานเชิงลึกและรายงานการวิจัยที่เป็นต้นฉบับโดยตรง”
ชื่อเรื่องรอง
การกำกับดูแลข้อมูลเป็นรากฐานของเศรษฐกิจดิจิทัล
เทคโนโลยี เช่น ปัญญาประดิษฐ์และบล็อกเชนทำให้ข้อมูลเป็นข้อมูลอัจฉริยะ แต่สิ่งที่เรียกว่าเศรษฐกิจข้อมูลเป็นมากกว่าข้อมูลอัจฉริยะ Zhu Feida ศาสตราจารย์แห่งมหาวิทยาลัยการจัดการแห่งสิงคโปร์ เชื่อว่าก่อนที่จะพูดถึงวิธีที่เทคโนโลยีสามารถทำให้ข้อมูล "คำนวณได้" เราต้องตระหนักว่าข้อมูลเป็นสินทรัพย์ และข้อมูลจำเป็นต้องได้รับการควบคุม
อย่างไรก็ตาม แม้แต่หลักฐานสำคัญดังกล่าวก็ใช้เวลานานกว่าที่มนุษย์จะเข้าใจได้ ศาสตราจารย์ Zhu Feida กล่าวว่าเศรษฐกิจข้อมูลได้ผ่านสามขั้นตอนแล้ว ในขั้นแรก ข้อมูลเป็นเพียงผลพลอยได้จากกิจกรรมเชิงพาณิชย์ และผู้คนใช้ข้อมูลมากขึ้นเพื่อทำความเข้าใจในอดีต ขั้นที่สองคือการเพิ่มขึ้นของข้อมูลขนาดใหญ่และเศรษฐกิจข้อมูล ในขั้นตอนนี้ ข้อมูลถูกผูกขาดโดยบริษัทจำนวนน้อยที่จะได้รับประโยชน์ ขั้นตอนที่สามคือเศรษฐกิจที่ขับเคลื่อนด้วยข้อมูล ซึ่งข้อมูลกลายเป็นทรัพย์สินที่ใช้ร่วมกันซึ่งขับเคลื่อนองค์กรทั้งหมด
Luo Zhen ซีอีโอของ BaseBit.ai เชื่อว่าตั้งแต่ยุคข้อมูลข่าวสารไปจนถึงยุคอัจฉริยะ เครื่องจักรและโปรแกรมคอมพิวเตอร์ใช้ข้อมูลมากขึ้น ทำให้เครื่องจักรฉลาดมากขึ้น ข้อมูลมีลักษณะทางเศรษฐกิจที่เป็นเอกลักษณ์ เช่น การนำกลับมาใช้ใหม่เสมือน ต้นทุนคงที่สูง และต้นทุนผันแปรต่ำ และยังแสดงในมิติที่ไม่ใช่ทางเศรษฐกิจ เช่น ความเป็นส่วนตัว การปฏิบัติตามข้อกำหนด การรักษาความลับ และความปลอดภัย คุณลักษณะที่โดดเด่น .
ในความเป็นจริง ผู้คนต้องจ่ายราคาในกระบวนการทำความเข้าใจลักษณะข้อมูลเหล่านี้ และกรณีการละเมิดข้อมูลโดยไม่มีธรรมาภิบาลทำให้เกิดความสูญเสียครั้งใหญ่
He Bingsheng รองศาสตราจารย์แห่ง National University of Singapore กล่าวว่าการรั่วไหลของข้อมูลไม่ใช่เหตุการณ์เฉพาะหน้าอีกต่อไป และยังมีเหตุการณ์ที่เกี่ยวข้องในอุตสาหกรรมต่างๆ ในสาขาต่างๆ เช่น การศึกษา การแพทย์ พลังงาน และสุขภาพ การสูญเสียโดยเฉลี่ยที่เกิดจากการละเมิดข้อมูลแต่ละครั้งคืออย่างน้อย 5 ล้านดอลลาร์
กรณีเชิงลบเหล่านี้ไม่เพียงแต่นำมาซึ่งความสูญเสียทางเศรษฐกิจครั้งใหญ่เท่านั้น แต่ยังทำลายความตั้งใจและความมั่นใจของสังคมทั้งหมดในการแบ่งปันข้อมูล ทำให้การแบ่งปันข้อมูลที่อ่อนแอโดยพื้นฐานอยู่แล้วยากขึ้นไปอีก
Luo Zhen ชี้ให้เห็นว่าข้อมูลไม่สามารถแบ่งปันได้อย่างปลอดภัยโดยธรรมชาติ แต่ควรรับรู้ถึงคุณค่าของข้อมูลร่วมกันโดยไม่ต้องแบ่งปันข้อมูลเอง
แน่นอนว่าสิ่งนี้ยากยิ่งกว่าสิ่งกีดขวางที่โด่งดังที่สุดคือเกาะข้อมูล ศาสตราจารย์ He Bingsheng ยกตัวอย่างข้อมูลโรงพยาบาลและกล่าวว่าโรงพยาบาลต่าง ๆ มีผู้ป่วยที่แตกต่างกัน แต่ในความเป็นจริงแล้วกรณีต่าง ๆ มีความคล้ายคลึงกันมาก โรงพยาบาล ธนาคาร และบริษัทอีคอมเมิร์ซ ข้อมูลที่เกี่ยวข้องนั้นเข้าใจแง่มุมต่างๆ ของประชากรกลุ่มเดียวกันอย่างแท้จริง
การวิจัยของศาสตราจารย์ Zhu Feida พบว่ามีคอขวดอยู่ 2 จุดในระบบนิเวศข้อมูล ปัญหาคอขวดที่สำคัญประการแรกมีอยู่ท่ามกลางบทบาทต่างๆ เช่น บุคคล องค์กร และรัฐบาล คอขวดที่ใหญ่เป็นอันดับสองอยู่ระหว่างข้อมูล แบบจำลอง และแอปพลิเคชัน
ระหว่างบุคคลและองค์กร ผู้ใช้ในฐานะผู้ให้ข้อมูลไม่เพียงแต่ถูกแยกออกจากการกระจายคุณค่าเท่านั้น แต่ยังมีความตระหนักและการควบคุมข้อมูลของตนเองอย่างจำกัด และมีความเสี่ยงที่ความเป็นส่วนตัวจะรั่วไหล มีข้อกังวลด้านความเป็นส่วนตัวและการรั่วไหลของข้อมูลระหว่างบุคคลและรัฐบาล มี "กำแพงสูงด้านข้อมูล" ในหน่วยงานของรัฐเนื่องจากเหตุผลทางสถาบัน เกาะแห่งข้อมูลเป็นเรื่องปกติในองค์กรต่างๆ และไม่มีแรงจูงใจในการแบ่งปันข้อมูลระหว่างองค์กรและรัฐบาล
นอกจากนี้ ในด้านข้อมูล ไม่ทราบแหล่งที่มาของข้อมูลและคุณภาพไม่ดี ในด้านแบบจำลอง เป็นการยากที่จะรับข้อมูลผู้ใช้จริงสำหรับการออกแบบและการฝึกอบรมแบบจำลอง ในด้านแอปพลิเคชัน การขาดแบบจำลองขั้นสูงส่งผลให้ ในข่าวกรองข้อมูลระดับต่ำ
ชื่อเรื่องรอง
การแบ่งปันข้อมูล: เทคโนโลยีและระบบเดินสองขา
ฉันทามติทั่วไปที่ผู้เชี่ยวชาญจากทุกสาขาอาชีพเข้าถึงได้คือการไหลเวียนและการแบ่งปันข้อมูลที่ปลอดภัยจำเป็นต้องดำเนินการควบคู่กันไปในสองระดับของเทคโนโลยีและระบบ
ในระดับเทคโนโลยี จะเห็นได้ว่าเทคโนโลยีล้ำสมัยทุกประเภทกำลังเบ่งบาน และการประมวลผลความเป็นส่วนตัวและความปลอดภัยเป็นโซลูชันโดยรวมที่เปิดใช้งานการแบ่งปันความปลอดภัยของข้อมูล
Luo Zhen แบ่งเทคโนโลยีการประมวลผลความเป็นส่วนตัวและความปลอดภัยที่ได้รับความนิยมในปัจจุบันออกเป็น 3 เส้นทางหลัก ได้แก่ การเข้ารหัส MPC/homomorphic การประมวลผลแบบหลายฝ่ายที่ปลอดภัย การเรียนรู้แบบรวมศูนย์ และการประมวลผลแซนด์บ็อกซ์ที่ปลอดภัย/TEE เขาสรุปเพิ่มเติมถึงความแตกต่างระหว่างเส้นทางทั้งสามนี้ - เมื่อสมมติฐานความไว้วางใจเพิ่มขึ้นในทางกลับกัน ความซับซ้อนในการคำนวณก็ลดลง นอกจากนี้ เทคโนโลยีการประมวลผลความเป็นส่วนตัวและความปลอดภัยยังเกี่ยวข้องกับเทคโนโลยีต่างๆ เช่น ความเป็นส่วนตัวที่แตกต่างกัน การประมวลผลแบบคลาวด์ บล็อกเชน และเครือข่ายต่อต้านประสาท
Yang Qiang หัวหน้าเจ้าหน้าที่ปัญญาประดิษฐ์ของ WeBank และหัวหน้าศาสตราจารย์ภาควิชาคอมพิวเตอร์และวิศวกรรมแห่งมหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีฮ่องกง อธิบายการเรียนรู้แบบรวมศูนย์โดยยกตัวอย่างการเลี้ยงแกะ วิธีการดั้งเดิมคือการเก็บหญ้าจากที่ต่างๆ มาเลี้ยงแกะ แต่ไม่เป็นไปตามข้อกำหนด และข้อกำหนดสำหรับการปกป้องความเป็นส่วนตัวและความปลอดภัยของข้อมูลทำให้การได้รับข้อมูลเป็นอุปสรรค และการเรียนรู้แบบสมาพันธรัฐให้แนวคิดใหม่: ปล่อยให้ฝูงสัตว์เดินไปมา แต่หญ้าไม่ออกมาจากท้องที่ และเจ้าของไม่สามารถรู้ได้เลยว่ามันกินหญ้าอะไรเข้าไป
Li Xiaolin หุ้นส่วนของ Tongdun Technology และประธานสถาบันวิจัยปัญญาประดิษฐ์ แนะนำสมาพันธ์ความรู้ของ Tongdun Technology ซึ่งใช้ระบบเฟรมเวิร์กแบบลำดับขั้นเพื่อรองรับแอปพลิเคชันหลายฝ่ายที่ปลอดภัย และใช้ผู้เข้าร่วมหลายคนอย่างมีประสิทธิภาพผ่านโปรโตคอลการแลกเปลี่ยนความปลอดภัยของข้อมูล ข้อมูล ความรู้ร่วมสร้าง แบ่งปัน และเหตุผล ทำให้ข้อมูลพร้อมใช้งานและมองไม่เห็น
ผู้เชี่ยวชาญที่เข้าร่วมยังให้ความสำคัญกับคุณค่าของเทคโนโลยีบล็อกเชนในการแบ่งปันความปลอดภัยของข้อมูล
Zhang Shuai รองประธานของ Qulian Technology กล่าวว่าในฐานะเทคโนโลยีรับประกันการยืนยันสิทธิ์ข้อมูลและการโอนมูลค่า คุณค่าสูงสุดของบล็อกเชนอยู่ที่การบันทึกการลงทะเบียนข้อมูลและกระบวนการแลกเปลี่ยนเพื่อให้แน่ใจว่ามีการแบ่งปันข้อมูลอย่างปลอดภัย สิทธิ์การเข้าถึง ลอจิกการเข้าถึง และราคาที่ต้องจ่ายสามารถลงทะเบียนบนบล็อกเชนได้ ในขณะที่สัญญาอัจฉริยะทำให้กระบวนการทำงานอัตโนมัติเต็มรูปแบบ
เกี่ยวกับการรวมเข้ากับเทคโนโลยีอื่น ๆ Zhang Shuai เชื่อว่าแม้ว่า blockchain เองจะไม่สามารถแก้ปัญหาการแบ่งปันข้อมูลได้ แต่ก็สามารถกลายเป็นกาวของเทคโนโลยีต่างๆได้ เทคโนโลยีแนวตั้งอื่นๆ เช่น Internet of Things เกี่ยวข้องกับข้อมูล และ blockchain สามารถเชื่อมต่อกันในแนวนอน
Du Yu รองผู้จัดการทั่วไปของ Shanghai Wanxiang Blockchain Co., Ltd. และหัวหน้าของ Wanxiang Blockchain Laboratory ก็แสดงความเห็นเช่นเดียวกัน เขาเชื่อว่าในความเป็นจริง บริษัทและสถาบันการเงินจะไม่เปิดเผยบันทึกการทำธุรกรรมและความลับทางธุรกิจ แต่ทุกบริษัทมีข้อมูลจำนวนมาก และมีข้อมูลเกาะ ต้องเผชิญกับข้อกำหนดการทำงานร่วมกันมากมาย บล็อกเชนสามารถช่วยในการแบ่งปันข้อมูลในแนวนอนและเชื่อมต่อเกาะที่แยกจากกัน
Wu Ming ผู้ร่วมก่อตั้ง Treemap blockchain Conflux เชื่อว่า blockchain เองในฐานะบัญชีแยกประเภทแบบกระจายเป็นผู้ให้บริการข้อมูลที่เชื่อถือได้ที่สามารถพกพาข้อมูลที่มีค่ามากที่สุด เช่น ข้อมูลเครดิตทางการเงิน ดังนั้น blockchain และข้อมูลจึงแยกกันไม่ออก ข้อมูลที่บรรทุกยังสามารถได้รับการรับรอง
Tong Lin ซีอีโอของ Phala Network ชี้ให้เห็นว่าประเภทและปริมาณของข้อมูลในเชนปัจจุบันนั้นมีขนาดเล็กกว่าข้อมูลนอกเชนมาก ลักษณะของข้อมูลบนห่วงโซ่คือพร้อมใช้งานเมื่อมองเห็นได้ และไม่สามารถใช้ได้หากมองไม่เห็น (ข้อมูลที่เข้ารหัส) แต่การใช้การประมวลผลความเป็นส่วนตัวและความปลอดภัยสามารถทำให้ข้อมูลในห่วงโซ่พร้อมใช้งานและมองไม่เห็น .
ปัจจุบันเทคโนโลยีต่าง ๆ ประสบความสำเร็จในการลงจอดเบื้องต้น
ยกตัวอย่าง WeBank โดยจับมือกับ Tencent Tianyan Lab เพื่อก่อตั้ง Tencent Medical Health-WeBank Joint Laboratory "โมเดลทำนายความเสี่ยงโรคหลอดเลือดสมอง" ที่พัฒนาขึ้นจากการเรียนรู้แบบสมาพันธ์มีอัตราความแม่นยำมากกว่า 80% และดัชนีการทำนายของ รูปแบบโรงพยาบาลขนาดเล็กเพิ่มขึ้น 10-20%
Yifang Jianshu สร้างแอปพลิเคชันบิ๊กดาต้าและแพลตฟอร์มแบบเปิดที่ใช้เทคโนโลยีการประมวลผลความเป็นส่วนตัวและความปลอดภัยสำหรับเซียะเหมิน ซึ่งเป็นเมืองนำร่องกลุ่มแรกสำหรับบิ๊กดาต้าด้านสุขภาพและการแพทย์ของจีน และสร้างโมเดลสำหรับการกำกับดูแลบิ๊กดาต้าทางการแพทย์ การวินิจฉัยและการรักษาตามลำดับชั้น
ในระดับระบบ ผู้เชี่ยวชาญจากทุกสาขาอาชีพเน้นย้ำถึงความสำคัญของกฎหมาย ข้อบังคับ และมาตรฐานอย่างเป็นเอกฉันท์
Wang Shuang ผู้ก่อตั้ง Nuowei Technology กล่าวว่าการแบ่งปันข้อมูลจำเป็นต้องมีการส่งเสริมกฎหมายและมาตรฐานนอกเหนือจากเทคโนโลยี การกำหนดข้อมูลร่วมกันเพื่อส่งเสริมการไหลเวียนของปัจจัยการผลิตข้อมูล
Tan Chang กรรมการบริหารของ iFLYTEK Big Data Research Institute กล่าวอย่างตรงไปตรงมาว่าการแบ่งปันข้อมูลขนาดใหญ่ระหว่างองค์กรนั้นหายากในความเป็นจริง ส่วนหนึ่งเป็นเพราะกฎหมายและระเบียบข้อบังคับยังคงต้องปรับปรุง ปัญหาต่างๆ เช่น การกำหนดราคาของปัจจัยการผลิตข้อมูลยังไม่ ได้รับการแก้ไขแล้ว และขาดตลาดข้อมูล กลไกการทำธุรกรรม กล่าวคือ โครงสร้างพื้นฐานที่เกี่ยวข้องจำเป็นต้องได้รับการปรับปรุงอย่างเร่งด่วน
Ingo Rübe ผู้ก่อตั้ง KILT Protocol กล่าวถึงความปลอดภัยของข้อมูลของบล็อกเชนในมุมมองทางกฎหมายในการอภิปรายโต๊ะกลมเรื่อง "ปล่อยคุณค่าของข้อมูล บล็อกเชนมีประโยชน์อย่างไร" บล็อกเชนไม่ได้รับการพิจารณาเมื่อมีการประกาศใช้ GDPR ในปี 2012 แต่การเข้ารหัสข้อมูลบนบล็อกเชนนั้นเป็นปัญหาทางคณิตศาสตร์ที่สามารถแก้ไขได้ในที่สุด ดังนั้นประเด็นทางกฎหมายควรได้รับการโฟกัสเป็นอันดับแรก
