Web3 협업 인텔리전스: 지식 트리, 지식 숲 및 커뮤니티 기여

DAOrayaki

特邀专栏作者

2022-03-01 11:07

이 기사는 약 5505자로, 전체를 읽는 데 약 8분이 소요됩니다

지식 구조 데이터베이스를 구축하고 지식을 더 잘 시각화하는 것은 컴퓨터 과학, 인공 지능 및 웹을 발전시키는 중요한 작업입니다.

AI 요약

펼치기

지식 구조 데이터베이스를 구축하고 지식을 더 잘 시각화하는 것은 컴퓨터 과학, 인공 지능 및 웹을 발전시키는 중요한 작업입니다.

원작자: 에릭 장

Zeo, DAOctor, Zhengyu, Christina의 공헌, 리뷰 및 피드백에 특별히 감사드립니다.

지식 구조 데이터베이스를 구축하고 지식을 더 잘 시각화하는 것은 컴퓨터 과학, 인공 지능 및 웹을 발전시키는 중요한 작업입니다. 암호화폐와 탈중앙화 애플리케이션의 세계가 등장하기 전, 오래된 웹 3.0 연구는 주로 지식 기반과 지식 그래프 구축, 그리고 이러한 구조를 기반으로 한 표현/추론(시맨틱 웹)에 중점을 두었습니다.

지식 기반 구축에는 두 가지 일반적인 접근 방식이 있습니다. 한 가지 접근 방식은 웹 및 기타 데이터 소스에서 데이터를 가져와서 원하는 지식 데이터베이스(주로 "트리플" 또는 "그래프"의 방대한 컬렉션)로 구성한 다음 "고차원 논리" 또는 기계 학습 기술을 수행하여 다음을 수행하는 것입니다. 구조 및 기타 지능형 작업에 대한 추론). 또 다른 접근 방식은 인간 지능에 의존하여 데이터베이스를 공동으로 구축하는 것입니다(예: Wikipedia, ConceptNet 또는 Citizen Science 프로젝트(나중에 자세히 설명)).

이 기사에서는 먼저 지난 수십 년간의 몇 가지 관련 혁신을 검토한 다음 집단 지능과 지속 가능한 인센티브 메커니즘을 통해 고급 지식 데이터베이스를 구축하기 위해 앞으로 나아갈 수 있는 방법에 대해 논의합니다.

기술 자료, 지식 그래프 및 Wikipedia

오랫동안 사람들은 두 가지 주요 이유로 지식 그래프를 만드는 데 관심을 가져왔습니다.
인간이 만든 모든 정보와 지식을 연결하는 점들,

그리고 지식 그래프에서 추론 및 기계 학습 기술을 수행하여 더 나은 인공 지능을 생성하고 이 시스템을 사용하여 Web2 제품의 사용자 경험을 향상시킵니다.

당장은 확실히 쓸모가 있는 지식그래프는 대부분 대기업의 기본 도구로 웹2에서 만들어지고 있다. 예를 들어 Facebook Knowledge Graph는 더 나은 소셜 네트워크 검색에 도움이 되고 Google Knowledge Graph는 관련 정보를 제공하는 데 도움이 됩니다. 모든 것이 폐쇄 소스이기 때문에 지식 그래프가 어떻게 구축되는지는 알 수 없지만 UI 관점에서 이러한 지식 그래프는 확실히 사용자 경험을 향상시키는 데 도움이 될 것입니다.

Wikipedia 커뮤니티의 노력은 놀랍습니다. 인터넷 커뮤니티의 힘을 보여주기 위한 최초의 시도 중 하나였습니다. 반면 공개 데이터베이스는 인터넷 공공재로 활용될 수 있다. Wikipedia 지식 기반을 활용하려는 애플리케이션에 API를 제공하는 데이터베이스인 DBpedia가 그 예입니다. 또 다른 예는 AI 및 NLP 프로그램이 공통 의미 체계를 획득하는 데 도움이 되는 자유롭게 사용 가능한 의미 체계 네트워크인 ConceptNet입니다.

그러나 이러한 인터넷 NGO가 할 수 있는 일에는 몇 가지 근본적인 한계가 있습니다. Wikipedia는 매년 기부금에 의존하고 501(c)3 조직 내에서 운영되며 더 발전된 인센티브를 제공하고 지식 네트워크를 기반으로 더 멋진 인프라를 구축하기 어렵습니다. DBpedia와 ConceptNet 등도 마찬가지입니다. 비영리단체로서 이러한 공익단체가 지속적으로 인프라를 구축하고 궁극적으로 생태계를 형성하는 커뮤니티를 깊숙이 구축하기는 어렵다. 대학에서 DBpedia의 API를 사용하여 Wikipedia 그래프 시각화 및 검색 도구를 구축했습니다. 그러나 그 당시에는 활기찬 커뮤니티에 참여하는 것이 훨씬 더 어려웠습니다. 이제 암호화폐 커뮤니티에서 상황은 매우 다릅니다. 좋은 아이디어를 가진 개발자는 더 많은 활동에 참여하고 팀을 구성하며 다중 체인 생태계의 지원을 받을 수 있습니다.

그러나 저는 현재 비영리 모델의 한계에도 불구하고 Wikipedia 사이트가 콘텐츠와 구조 및 조직 면에서 잘 정리되어 있기 때문에 다른 Wikipedia(일명 DAO-ify Wikipedia 또는 "Web3 Wikipedia")를 구축하는 것을 권장하지 않습니다. 결과는 상당합니다. 일반적으로 Wikipedia는 지식에 대한 설명을 저장하는 데 능숙하며 Web1 및 Web2 인프라를 통해 지식을 검색 가능하게 만들었습니다. Wikipedia와 기존 웹 인프라가 잘 못하는 것은 "인간 이해"를 위한 지식, 즉 인간의 두뇌에 구조화된 지식을 제시하는 것입니다. 이 정보를 제시하기 위해서는 인간의 큐레이션과 인간의 협업이 핵심인데, 이는 Web1/Web2 인프라에서 잘 지원되지 않지만 Web3 인프라와 조정 메커니즘을 통해 가능할 것입니다.

**사람들이 지식에 대한 기계의 이해를 향상시키기 위해 방대한 구조 데이터베이스를 구축하기 위해 노력한다는 점은 주목할 가치가 있습니다. 예를 들어 Cyc와 같은 회사는 기계가 인간의 두뇌를 모방할 수 있도록 상식적인 지식 기반을 구축하기 위해 수십 년 동안 노력해 왔습니다. 강력한 AI에는 노드 및 관계에 대한 지식 기반 이상의 것이 분명히 필요했기 때문에 이러한 회사는 결국 비즈니스 소프트웨어 회사로 전환했습니다. 기계를 위한 구조화된 지식 기반을 구축하는 것과 비교할 때, 지식에 대한 인간의 이해와 인간의 관리가 중요합니다. 즉, 더 많은 사람들이 이해할 수 있도록 인간 이해의 지식 기반을 구축하는 것입니다.

한편, 이 백서에서 설명하는 구조화된 지식인 현재 Web of Knowledge에 더 높은 수준의 시맨틱을 추가하는 방법에 대해 생각해 볼 가치가 있습니다.

시민 과학 및 자원 봉사 컴퓨팅

제가 언급하고 싶은 또 다른 탐색 분야는 시민 과학 및 자원 봉사 컴퓨팅입니다. 2010년대 초, 과학계는 연구 및 과학적 발견의 진행을 가속화하기 위해 군중의 지혜를 활용하는 흥미로운 프로젝트를 많이 진행했습니다. 그러한 노력에는 일반적으로 두 가지 유형이 있습니다. 첫 번째는 컴퓨팅 작업을 개별 컴퓨팅 장치 그룹(예: LHC@Home, SETI@Home)에 분배하는 자발적 컴퓨팅이라고 합니다. 두 번째 유형은 모두가 수행할 수 있는 반복적인 작업(여기서는 경멸적인 용어가 아님!)을 생성하는 시민 과학이라고 합니다. 이 프로젝트는 수많은 기여자로부터 데이터(때로는 분석 결과)를 수집하고 이를 여러 연구 프로젝트에 공급하여 의미 있는 결과를 생성합니다(예: Citizen Cyberlab, SciStarter 또는 기계 학습 커뮤니티에 나열된 프로젝트, 교육 데이터를 풍부하게 하기 위해 태그가 지정된 이미지는 크라우드 소싱). 이러한 노력을 단어를 발명하지 않고 "DAO"로 생각하십시오. 탈중앙화 커뮤니티의 조정 측면은 새로운 것이 아닙니다!

많은 프로젝트가 성공했지만 다시 한 번 불행하게도 이러한 프로젝트의 지속 가능성은 제한적이었습니다. SETI@Home은 더 이상 운영되지 않으며 더 오래 지속될 수 있었던 많은 시민 과학 프로젝트는 그렇지 않았습니다. 인센티브와 생태계는 모든 협력 노력의 두 가지 중요한 측면입니다. 생태계가 없으면 혁신이 제한됩니다. 지속 가능한 인센티브가 없으면 활기찬 커뮤니티도 없고 생태계도 나타나지 않습니다.

복잡한 개념과 지식의 구조

이제 높은 수준의 개념과 지식이 어떤 것인지 생각해 봅시다. 직관적으로 우리가 개념을 "이해"할 때 실제로 개념을 상당히 자세하게 이해합니다. 우리는 "이해"의 과정을 두 가지 방식으로 생각할 수 있습니다.

1. 트리 구조를 통한 이해

트리가 더 깊게 분해될수록 개념이 더 원시적입니다. 언젠가는 직접 참조할 수 있는 매우 직접적인 웹 리소스가 있을 것입니다(예: Wikipedia 페이지 또는 일부 기사/비디오).

이미지 설명

개념을 트리 구조로 "분할"

오래된 AI에서 비슷한 아이디어를 찾을 수 있습니다. K-라인 이론은 우리의 기억과 지식이 트리 구조(P-노드 및 K-노드)에 저장된다는 것을 보여줍니다. 그러한 구조가 실제로 우리 뇌에 존재한다는 실제 증거는 부족하지만 모델은 인간의 기억과 인간의 뇌가 어떻게 작동하는지 설명할 수 있는 힘을 가지고 있으며 트리 구조는 실제로 구조적 지식을 저장하는 가장 압축된 형태입니다.

세부 정보를 검색하려면 지식 트리를 분해합니다. 반면에 지식의 나무가 있다면 이 나무를 사용하여 더 큰 나무(일명 지식과 이해의 더 높은 추상화)를 구축할 수 있습니다.

이미지 설명

Concept_2 사용하기 Concept_1 "빌딩"

"구성"의 경우 "머클 트리" 트리를 노드로 사용하여 "버클 트리" 또는 "머클 다중 증명"과 같은 보다 복잡한 지식 트리를 구축할 수 있습니다.

여기서 핵심 포인트는 트리의 구조라는 점에 주목할 가치가 있습니다. 지식 트리는 루트 개념에서 리프까지 기존 웹 리소스에 대한 모든 필수 참조를 가리킵니다. 여기서 노드 간의 관계는 중요하지 않습니다(지식 그래프 시스템의 "트리플" 사고와 달리).

2. "관련 지식"을 통한 이해

또한 더 많은 "컨텍스트"를 추가하여 지식에 대한 더 깊은 이해를 얻습니다. Weigenstain이 유명하게 말했듯이 "하지만 'five'라는 단어는 무엇을 의미합니까? 여기에는 그러한 질문이 없으며 'five'라는 단어가 어떻게 사용되었는지만 있습니다." 그것의 배후에 있는 아이디어는 어떤 것의 의미가 실제로 그것과 관련된 다른 개념에 달려 있으며, 함께 무언가의 의미를 결정한다는 것입니다. 더 많은 컨텍스트(즉, 지식 자체에 대한 관련 지식)를 추가함으로써 우리는 지식을 더 "깊이" 이해할 수 있습니다.

일반적으로 사람들은 그래프보다 나무를 이해하기가 더 쉽습니다. 지식 지도를 구축하는 대신 "관련 지식"을 보다 실용적인 방법으로 생각하는 것이 좋습니다. 즉, 기본적으로 지식 숲을 형성하는 루트 노드로 연결된 일련의 지식 트리입니다.

지식숲은 다수의 지식나무를 데이터베이스화(병렬식재)하여 구축할 수 있다. 데이터베이스에서 수행할 수 있는 두 가지 기본 작업이 있습니다.
지식 트리의 특징은 특정 벡터 공간에서 벡터로 구성될 수 있습니다. 그런 다음 벡터는 개념적으로 관련되어 있지만 (1)에 의해 직접 연결되지 않은 지식 트리를 연결하는 데 사용할 수 있습니다.

이미지 설명

지식 트리 간의 관계 측정

이해의 깊이에 대해

일반적으로 사람들은 동일한 개념에 대해 서로 다른 수준의 이해를 가지고 있습니다. 어떤 사람들에게는 머클 트리의 개념이 간단하고 더 이상 분해할 필요가 없지만(그들의 두뇌는 이 개념을 상식으로 캡슐화했습니다), 다른 사람들에게는 "머클 트리"의 개념을 이해하기에 충분한 정보가 없습니다. " 추가 분석이 필요할 수 있습니다.

따라서 지식 트리는 상호 배타적일 필요가 없습니다. 즉, 서로 다른 트리 간에 겹칠 수 있습니다. 기본 개념을 설명하는 트리가 있을 수도 있고 고급 개념을 설명하는 트리가 있을 수도 있습니다.

중첩은 트리 사이에 중복성을 생성할 수 있습니다. 중복성을 줄이기 위해 다음 작업을 도입할 수 있습니다.
병합 - 두 트리의 노드 아래에 이미 하위 트리가 있을 수 있으며 일부 중요한 노드, 리프 및 참조가 기본 트리에 아직 포함되지 않은 경우 상위 수준 트리의 정보를 더 많은 기본 트리로 병합할 가치가 있을 수 있습니다.

크로스 트리 참조 링크

이미지 설명

두 나무를 하나로 병합

지식 트리 및 메타 작업

단일 지식 트리는 루트, 하위 노드 세트 및 리프 세트로 구성되며 트리 구조로 구성됩니다. 그런 다음 일련의 기본 작업을 정의하여 트리를 만들고 구체화할 수 있습니다.
루트(트리) 생성
자식 노드 추가
노드에 리프 추가

리프에 참조 링크 추가

그런 다음 실제 사용자가 나무를 "심고" 기여할 일련의 높은 수준의 작업을 정의할 수 있습니다.
하위 트리 추가 - 전체 노드 및 리프가 있는 지식 트리에 필요한 하위 노드를 도입합니다.

동일한 개념의 두 트리 병합

지식의 숲

지식의 나무를 많이 심으면 지식의 숲이 된다!

지식의 숲은 함께 심어진 지식의 큰 그룹입니다. 지식의 숲에 대한 흥미로운 사실은 나무 사이에 얽힘이 있을 수 있다는 것입니다. 이론적으로 서로 다른 노드와 리프 간의 연결은 임의적일 수 있습니다(예: 한 트리의 리프와 다른 트리의 루트 간의 링크). 실제로 점선 링크를 추가하면 Knowledge Forest "일종"이 Knowledge Graph가 됩니다. 그러나 중요한 것은 개인 지식 트리입니다.

예를 들어 파선은 MACI 트리와 zk-Snark 트리 사이의 링크를 나타냅니다.

지식 트리의 리프는 웹의 기존 기사/비디오/리소스에 연결됩니다. 따라서 이러한 잎 위의 레이어는 구조 정보 또는 이해 레이어입니다.

지식의 숲으로 할 수 있는 일은 완전히 열려 있습니다. 아마도 우리가 고려해야 할 가장 중요한 것은 처음부터 협업 지식 기반의 생태계일 것입니다. Knowledge Forest로 많은 일을 하고 싶을 수 있습니다. 다음은 세 가지 예입니다.
지식 트리 및 지식 포레스트 시각화
점선 링크를 통해 Knowledge Forest 탐색

지식 트리 클러스터 찾기

비영리 단체는 일을 할 수 있지만 DAO는 일을 더 좋게 만들 수 있습니다. 여기서 아이디어는 트리 작업 집합을 자극 집합에 매핑하는 것입니다. 메타 작업이 표준화될수록 DAO가 구성원을 조정하기 위한 확장성이 커집니다.

이미지 설명<->지식 트리 운영

DAO 기여

지식 나무의 경우 DAO 기여자는 뿌리("나무 만들기/심기"에 해당)를 만들고 지식 경로("나무 심기")를 추가하고 잎에 참조 링크를 추가할 수 있습니다. 인센티브 메커니즘은 지식 트리를 계획하고 성장시키기 위해 검증 가능한 조치를 취하는 커뮤니티 기여자에게 보상하는 일련의 규칙을 만듭니다.

또한 검토 위원회(또는 검토 그룹)는 계획 및 품질 관리에 중요합니다. DAO에 대한 조정 및 인센티브는 광범위하게 실험되었으며(예: DAOrayaki DAO) 유사한 구조가 여기에서 구현될 수 있습니다.

지식숲과 지식그래프

나무는 새로운 개념을 배우고 지식을 얻을 때 이해하기 쉽습니다. 어떤 특정 주제에 대해 트리에는 루프가 없기 때문에 인간이 트리의 지식 구조를 이해하기 쉽고, 트리의 깊이가 일정 수준으로 제한되면 인간의 두뇌가 훨씬 쉽게 이해할 수 있습니다. 처리하고 기억하십시오.

또한 지식 그래프 표현은 지식 노드 간의 모호하거나 모호한 연결을 표현하는 데 제한이 있습니다(상식 지식 표현과 동일한 문제).

Knowledge Trees 및 Knowledge Forests의 실제 구현 작업을 수행하는 BUIDLers 팀은 데이터 구조, 제품 디자인, 기여 및 인센티브 세부 정보, UI 등 많은 세부 정보를 가지고 있습니다. 그럼에도 불구하고 지식의 숲을 조성하려면 일반적으로 공공재로 조직되어 전 세계 모든 사람이 이용할 수 있어야 한다고 생각합니다. 그러나 Dora 커뮤니티가 무엇을 생각해 내는지 봅시다!

결론적으로

아이디어는 기존 웹 인프라(예: Wikipedia 등) 위에 새로운 종류의 지식 기반을 구축하고 모든 사람이 사용할 수 있도록 함으로써 추상 지식 이해의 복잡성을 최소화하는 것입니다(예: 지식 그래프의 웹 라우팅을 통해). Wikipedia 또는 Wikipedia는 O(nlog(n))만큼 복잡할 수 있지만 n개의 노드가 있는 트리는 log(n) 깊이에 불과하므로 탐색이 더 쉬워집니다. DAO의 기여자와 협력하고 고급 암호화 네이티브 인센티브를 사용하여 조직의 지속 가능성을 보장합니다. 이 문서의 아이디어는 완전하지 않으며 토론 및 개선의 여지가 많으며 팀이 이를 현실화하려는 경우 고려해야 할 엔지니어링 및 제품 문제가 많이 있습니다.