Web3協同智能：知識樹、知識森林和社區貢獻

DAOrayaki

特邀专栏作者

2022-03-01 11:07

本文約5505字，閱讀全文需要約8分鐘

構建知識結構數據庫和更好地可視化知識是推進計算機科學、人工智能和Web的重要任務。

AI總結

展開

構建知識結構數據庫和更好地可視化知識是推進計算機科學、人工智能和Web的重要任務。

原文作者: Eric Zhang

特別感謝Zeo、DAOctor、Zhengyu、Christina 的貢獻、審閱和反饋。

構建知識結構數據庫和更好地可視化知識是推進計算機科學、人工智能和Web的重要任務。在加密貨幣和去中心化應用世界出現之前，舊的Web 3.0 研究主要集中在構建知識庫和知識圖譜，以及基於這些結構的表示/推理（語義Web）。

建立知識庫有兩種通用方法。一種方法是從Web 以及其他數據源獲取數據，然後將它們組織到所需的知識數據庫中（主要是“三元組”或“圖”的巨大集合，然後執行“高階邏輯”或機器學習推理結構和其他智能任務的技術）。另一種方法是依靠人類智能來協作建立數據庫（例如，我們將在後面更詳細討論的Wikipedia、ConceptNet 或Citizen Science 項目）。

本文將首先回顧過去幾十年的一些相關創新，然後討論我們如何才能向前邁進，建立一個具有集體智慧和可持續激勵機制的高水平知識數據庫。
知識庫、知識圖譜和維基百科

很長一段時間以來，人們對創建知識圖譜很感興趣，主要有兩個原因：

連接人類創造的所有信息和知識的點，

並且在知識圖譜上執行推理和機器學習技術以產生更好的人工智能，並使用該系統改善Web2 產品的用戶體驗。

現在，很明顯有用的知識圖譜大多是作為Web2 中大型公司的基礎工具創建的。例如，Facebook 知識圖譜有助於更好的社交網絡搜索，谷歌知識圖譜有助於呈現相關信息。由於一切都是閉源的，我們不知道知識圖譜是如何構建的，但從UI 來看，這些知識圖譜肯定有助於改善用戶體驗。

維基百科社區的努力是驚人的。這是展示互聯網社區力量的首次嘗試之一。另一方面，開放數據庫可作為互聯網公共產品使用。一個例子是DBpedia，它是一個為想要利用Wikipedia 知識庫的應用程序提供API 的數據庫。另一個例子是ConceptNet，這是一個免費提供的語義網絡，可幫助AI 和NLP 程序獲取通用語義。

然而，這些互聯網公益組織能做多少，有一些根本性的限制。維基百科每年都依賴捐贈，它在一個501(c)3 組織內運作，很難在其上施加更先進的激勵機制並基於知識網絡構建更酷的基礎設施。 DBpedia 和ConceptNet 等也是如此。作為非營利組織，這些公益組織很難深入建立一個不斷構建基礎設施並最終形成生態系統的社區。我在大學時使用DBpedia 的API 構建了一個Wikipedia 圖形可視化和搜索工具。然而，當時加入一個充滿活力的社區要困難得多。現在在加密社區，情況大不相同了，有好主意的開發者可以參與更多的活動，組隊並得到多鏈生態系統的支持。

但是，我不建議建立另一個Wikipedia（又名DAO-ify Wikipedia，或“Web3 Wikipedia”），因為儘管當前的非營利組織模式存在局限性，但Wikipedia 網站的內容和結構都得到了很好的策劃和組織，人們已經在很大程度上受益於它的成果。總的來說，Wikipedia 擅長存儲知識的描述，並且通過Web1 和Web2 基礎設施，我們已經使知識可搜索。維基百科和現有的網絡基礎設施不擅長的是呈現“人類理解”的知識——人腦中的結構性知識。為了呈現這些信息，人的策展和人的協作是核心，這在Web1/Web2 基礎設施中並不能很好地支持，但是通過Web3 基礎設施和協調機制將可以實現

**值得注意的是，人們努力建立海量結構數據庫以增強機器對知識的理解。例如，像Cyc 這樣的公司幾十年來一直在嘗試建立一個常識知識庫來幫助機器模仿人類的大腦。這些公司最終將自己變成了商業軟件公司，因為強大的人工智能顯然需要的不僅僅是節點和關係的知識庫。與為機器建立結構性知識庫相比，人類對知識的理解和人類管理在這裡很重要——建立人類理解的知識庫以幫助更多的人理解。

另一方面，值得思考的是，如何將更高層次的語義添加到當前的Web of Knowledge 中，也就是我們在本文中描述的結構性知識。

公民科學和志願計算

我想提到的另一個探索分支是公民科學和志願計算。在2010 年代初期，科學界有許多令人興奮的項目，它們利用人群的智慧來加速研究和科學發現的進展。這種努力一般有兩種類型。第一種稱為志願計算，它將計算任務分配給一群個人計算設備（例如LHC@Home、SETI@Home）。第二種類型稱為公民科學，它創造了每個人都可以執行的重複性任務（這裡不是一個貶義詞！）。該項目從眾多貢獻者那裡收集數據（有時是分析結果），並將它們輸入到一些研究項目中以創建有意義的結果（例如，在Citizen Cyberlab、SciStarter 或機器學習社區中列出的項目，標記圖片以豐富訓練數據可以是眾包）。在不發明“DAO”這個詞的情況下將這些努力想像成“DAO”，去中心化社區的協調方面並不是什麼新鮮事！

許多項目取得了成功，但不幸的是，這些項目的可持續性再次受到限制。 SETI@Home 不再運營，許多公民科學項目本可以持續更長時間但沒有持續下去。激勵和生態系統對任何協作努力來說都是很重要的兩個方面。沒有生態系統，創新就會受到限制。沒有可持續的激勵機制，就沒有充滿活力的社區，也就永遠不會出現生態系統。

複雜概念和知識的結構

樹分解得越深，概念就越原始。在某一時刻，Web 上會有一些非常直接的資源可以直接引用（例如，維基百科頁面或一些文章/視頻）。

圖片描述

使用概念_2“建立”概念_1

圖片描述

使用概念_2“建立”概念_1

在“構建”的情況下，可以使用“Merkle 樹”樹作為節點來構建更複雜的知識樹，例如“Verkle 樹”或“Merkle 多重證明”。

值得注意的是，這裡的關鍵點是樹的結構。知識樹從根概念到葉子，指向所有對現有Web 資源的必要引用。節點之間的關係在這裡並不重要（與知識圖譜系統中的“三重”思想不同）。

2.通過“相關知識”理解

我們還通過添加更多“上下文”來獲得對知識的更深入理解。正如Weigenstain的名言，“但'五'這個詞是什麼意思？這裡沒有這樣的問題，只有“五”這個詞是如何使用的”。它背後的想法是，某事物的意義實際上取決於與之相關的其他概念，它們共同決定某事物的意義。通過添加更多上下文（也就是知識本身的相關知識），我們可以更“深入”地理解知識。
知識樹的特徵可以構造為某個向量空間中的向量。然後可以使用向量來關聯在概念上相關但不通過(1) 直接鏈接的知識樹。

圖片描述

測量知識樹之間的關係

關於理解的深度

一般來說，人們對同一個概念有不同程度的理解。對於一些人來說，Merkle樹的概念很簡單，不需要進一步分解（他們的大腦已經將這個概念封裝成一些常識），而另一些人沒有足夠的信息來理解“Merkle樹”的概念，可能需要一個進一步細分。
重疊可能會在樹之間產生冗餘。為了減少冗餘，我們可以引入以下操作：

跨樹參考鏈接

圖片描述

將兩棵樹合併為一棵
知識樹和元操作
單個知識樹由一個根、一組子節點和一組葉子組成，組織成一個樹結構。然後我們可以定義一組基本操作來創建和細化一棵樹。
創建根（樹）

添加子節點

向節點添加葉子
將參考鏈接添加到葉子

然後我們可以為實際用戶定義一系列高級操作來“種植”一棵樹並為一棵樹做出貢獻。

添加子樹- 為具有完整節點和葉子的知識樹引入必要的子節點

合併兩個相同概念的樹

知識森林

種下大量的知識樹，我們就有了知識森林！

知識森林是一大群一起種植的知識樹。關於知識森林的一個有趣事實是，樹木之間可能存在糾纏。理論上，不同節點和葉子之間的連接可以是任意的（例如，一棵樹的葉子和另一棵樹的根之間的鏈接）。實際上，如果我們添加虛線鏈接，知識森林“有點”就變成了知識圖譜。但是，重要的是個人知識樹。

例如，虛線表示MACI 樹和zk-Snark 樹之間的鏈接。
知識樹的葉子連接到網絡上現有的文章/視頻/資源。因此，這些葉子之上的層是結構信息或理解層。
我們可以用知識森林做的事情是完全開放的。我們應該考慮的最重要的事情可能是從一開始就協作知識庫的生態系統。我們可能想要對知識森林做很多事情，這裡舉三個例子：

可視化知識樹和知識森林

非營利組織可以讓事情發生，但DAO 可以讓事情變得更好。這裡的想法是將一組樹操作映射到一組激勵。元操作越標準化，DAO 協調其成員的可擴展性就越高。

圖片描述<->圖片描述

圖片描述

知識樹操作

DAO 貢獻

在知識樹的情況下，DAO 的貢獻者可以創建一個根（等於“創建/種植一棵樹”），添加一個知識路徑（“養植樹”），並為樹葉添加參考鏈接。激勵機制創建了一套規則來獎勵那些採取可驗證的行動來規劃和種植知識樹的社區貢獻者。

同時，審查委員會（或審查團體）對於規劃和質量控制也很重要。 DAO 的協調和激勵已經過廣泛的試驗（例如，DAOrayaki DAO），並且可以在這裡實現類似的結構。

知識森林與知識圖譜

此外，知識圖的表示在表示知識節點之間的模糊或模糊連接方面受到了限制（與常識知識表示相同的問題）。

結論

這個想法是在現有的Web 基礎設施（如維基百科等）之上建立一種新的知識庫，並使其可供所有人使用，從而最大限度地降低理解抽象知識的複雜性（通過像Web或維基百科這樣的知識圖進行路由可以復雜到O(nlog(n))，但是有n個節點的樹只有log(n)的深度，這使得導航更容易）。與DAO 中的貢獻者協調，並使用先進的加密原生激勵措施來確保組織的可持續性。本文中的想法並不完整，還有很多討論和改進的空間，如果某個團隊想要將其變為現實，還有很多工程和產品問題需要考慮。