Mirror Tang | Salus
Yixin Ren | Hongshan capital
Lingzhi Shi | Salus
Jiangyue Wang | Salus
지난 1년 동안 생성 AI가 대중의 기대를 계속 뛰어넘으면서 AI 생산성 혁명의 물결이 암호화폐 업계를 휩쓸었습니다. 우리는 많은 AI 컨셉 프로젝트가 2차 시장에서 부 창출 신화의 물결을 가져왔고 동시에 점점 더 많은 개발자가 자체 AI+Crypto 프로젝트를 개발하기 시작했다는 것을 확인했습니다.
그러나 자세히 살펴보면 이러한 프로젝트의 동질성이 매우 심각하다는 것을 알 수 있으며, 대부분의 프로젝트는 분산형 네트워크를 통해 컴퓨팅 파워를 조직하거나 분산형 허깅 페이스를 만드는 등 생산 관계 개선에만 중점을 두고 있습니다. 기본 기술로부터 진정한 통합과 혁신을 시도하는 프로젝트는 거의 없습니다. 이런 현상이 일어나는 이유는 AI와 블록체인 분야 사이에 도메인 편향이 있기 때문이라고 생각합니다. 광범위한 교차점에도 불구하고 두 분야를 깊이 이해하는 사람은 거의 없습니다. 예를 들어, AI 개발자가 이더리움의 기술적 구현과 역사적 인프라 상태를 이해하기 어렵고, 심층적인 최적화 솔루션을 제안하는 것은 더욱 어렵습니다.
AI의 가장 기본적인 분야인 머신러닝(ML)을 예로 들면, 명시적인 프로그래밍 지시 없이도 기계가 데이터를 기반으로 의사결정을 내릴 수 있도록 하는 기술이다. 기계 학습은 데이터 분석 및 패턴 인식에서 큰 잠재력을 보여주었으며 web2에서는 보편화되었습니다. 그러나 처음 탄생한 시대의 한계로 인해 이더리움과 같은 블록체인 기술 혁신의 최전선에서도 그 아키텍처, 네트워크 및 거버넌스 메커니즘은 아직 기계 학습을 복잡한 문제를 해결하기 위한 효과적인 도구로 사용하지 못했습니다.
훌륭한 혁신은 종종 다양한 분야에서 탄생합니다. 이 기사를 작성하는 우리의 원래 의도는 AI 개발자가 블록체인 세계를 더 잘 이해할 수 있도록 하고 이더리움 커뮤니티의 개발자에게 새로운 아이디어를 제공하는 것입니다. 기사에서는 먼저 이더리움의 기술적 구현을 소개한 후, 기본 AI 알고리즘인 머신러닝을 이더리움 네트워크에 적용하여 보안성, 효율성, 확장성을 향상시키는 솔루션을 제안합니다. 우리는 이번 사례를 출발점으로 삼아 시장의 관점과는 다른 몇 가지 관점을 제시하고, 개발자 생태계에서 AI+블록체인의 보다 혁신적인 교차 결합을 장려하기를 바랍니다.
이더리움의 기술적 구현
- 기본 데이터 구조 
블록체인의 본질은 블록을 연결하는 체인이며, 체인을 구별하는 열쇠는 블록체인 생성에 있어서도 빼놓을 수 없는 부분인 체인 구성이다. 이더리움의 경우 체인 구성은 이더리움의 다양한 체인을 구별하고 몇 가지 중요한 업그레이드 프로토콜과 플래그 이벤트를 식별하는 데 사용됩니다. 예를 들어, DAOForkBlock은 이더리움이 DAO 공격을 겪었을 때 하드포크의 높이를 표시하고, ConstantinopleBlock은 콘스탄티노플 업그레이드의 블록 높이를 표시합니다. 많은 개선 제안을 포함하는 대규모 업그레이드의 경우 해당 블록 높이를 식별하기 위한 특수 필드가 설정됩니다.또한 이더리움에는 다양한 테스트 네트워크와 메인 네트워크가 포함되어 있으며 해당 네트워크 생태계는 ChainID를 통해 고유하게 식별됩니다.
제네시스 블록은 전체 블록체인의 0번째 블록이며, 다른 블록들은 제네시스 블록을 직간접적으로 참조합니다. 따라서 노드 시작 시 올바른 제네시스 블록 정보를 로드해야 하며, 임의로 수정해서는 안 됩니다. 제네시스 블록의 구성 정보에는 앞서 언급한 체인 구성이 포함되며, 관련 채굴 보상, 타임스탬프, 난이도, 가스 한도 등의 필드도 추가됩니다. 이더리움의 합의 메커니즘은 작업 증명 채굴에서 진화했다는 점에 유의해야 합니다. . 메커니즘은 지분 증명으로 변환됩니다.
이더리움 계정은 외부 계정과 컨트랙트 계정으로 구분되는데, 외부 계정은 프라이빗 키에 의해 고유하게 제어되는 반면 컨트랙트 계정은 프라이빗 키 제어가 없으며 외부 계정에서 컨트랙트를 호출하여 컨트랙트 코드를 실행해야만 운영할 수 있습니다. 그들은 모두 고유한 주소를 포함하고 있습니다. 이더리움 월드 스테이트는 이더리움 계정 트리이며, 각 계정은 계정의 상태(다양한 계정 정보 및 코드 정보)를 저장하는 리프 노드에 해당합니다.
트랜잭션: 분산형 플랫폼인 이더리움의 본질은 트랜잭션과 계약입니다. 이더리움의 블록은 패키지된 트랜잭션과 추가 관련 정보입니다. 특정 블록은 블록 헤더와 영역이라는 두 부분으로 나뉩니다. 블록 헤더 데이터에는 모든 블록을 체인으로 연결하는 증거가 포함되어 있으며, 이는 이전 블록 해시뿐만 아니라 상태 루트, 트랜잭션 루트, 수신 루트 및 전체 이더리움 세계의 상태 증명으로 이해할 수 있습니다. 식별 난이도 및 nonce 계산과 같은 데이터. 블록 본문은 거래 목록과 삼촌 블록 헤더 목록을 저장합니다(이더리움이 지분 증명으로 전환되었으므로 삼촌 블록 참조는 더 이상 존재하지 않습니다).
거래 영수증은 단순히 거래 자체만으로는 알 수 없는 거래 실행 이후의 결과와 추가 정보를 제공합니다. 구체적으로 여기에 포함된 정보는 트랜잭션 처리 성공 여부에 대한 정보와 트랜잭션 로그, 가스 등 소비 정보를 포함하는 합의 내용, 트랜잭션 정보 및 블록 정보로 나눌 수 있습니다. 영수증의 정보를 분석하여 스마트 계약 코드를 디버그하고 가스 소비를 최적화합니다. 네트워크를 통해 거래가 처리되었음을 확인하는 형태를 제공하며, 거래의 결과와 영향을 확인할 수 있습니다.
이더리움에서 가스비는 단순히 처리수수료로 이해될 수 있는데, 토큰을 보내거나, 계약을 체결하거나, 이더리움을 전송하거나, 이 블록에서 다양한 작업을 수행할 때 이러한 트랜잭션의 작업에는 가스비가 필요합니다. 계산을 수행하고 네트워크 리소스를 소비해야 하므로 컴퓨터가 작동하도록 하려면 가스 요금을 지불해야 합니다. 최종 연료비는 채굴자에게 처리수수료로 지급되는데, 구체적인 수수료에 대한 계산식은 수수료=사용가스*가스가격으로 이해될 수 있는데, 이는 실제사용량에 소비단가를 곱한 값이다. 거래 개시자가 설정하며 그 금액이 결정되는 경우가 많으며 체인의 거래 속도를 결정합니다. 설정값이 너무 낮을 경우 트랜잭션이 실행되지 않을 수 있으며, 동시에 계약 오류로 인한 예측할 수 없는 가스 소비를 방지하기 위해 수수료에 대한 가스 한도 소비 상한을 설정해야 합니다.
- 트레이딩 풀 
이더리움에는 거래량이 많은데, 중앙집중형 시스템과 비교하면 분산형 시스템에서 처리하는 초당 거래 수는 현저히 적습니다. 노드에 들어오는 트랜잭션 수가 많기 때문에 노드는 이러한 트랜잭션을 적절하게 관리하기 위해 트랜잭션 풀을 유지해야 합니다. 트랜잭션의 브로드캐스트는 p2p를 통해 이루어지며, 구체적으로 노드는 실행 가능한 트랜잭션을 자신의 이웃 노드에 브로드캐스트하고, 이후 이웃 노드는 해당 노드의 이웃 노드에 트랜잭션을 브로드캐스트합니다. 6초 안에 전체 이더리움 네트워크를 파괴합니다.
트랜잭션 풀에 있는 트랜잭션은 실행 가능한 트랜잭션과 실행 불가능한 트랜잭션으로 구분되는데, 실행 가능한 트랜잭션은 우선순위가 더 높고 블록 내에서 실행되어 패키징되며, 방금 트랜잭션 풀에 들어간 트랜잭션은 모두 실행 불가능한 트랜잭션이 됩니다. 그런 다음 실행 가능해집니다. 실행 가능한 트랜잭션과 실행 불가능한 트랜잭션은 각각 보류 컨테이너와 큐 컨테이너에 기록됩니다.
또한 트랜잭션 풀은 로컬 트랜잭션 목록도 유지하며 로컬 트랜잭션에는 많은 장점이 있으며 우선 순위가 높고 트랜잭션 볼륨 제한의 영향을 받지 않으며 노드가 다시 시작될 때 트랜잭션 풀에 즉시 다시 로드될 수 있습니다. 로컬 트랜잭션의 로컬 영구 저장은 저널(노드 재시작 시 다시 로드)을 통해 구현되며, 완료되지 않은 로컬 트랜잭션을 잃지 않는 것이 목적이며 정기적으로 업데이트됩니다.
대기열에 들어가기 전에 DOS 공격 방지, 부정 방지 트랜잭션, 트랜잭션 가스 한도 등과 같은 다양한 유형의 검사를 포함하여 트랜잭션의 합법성을 검사합니다. 트랜잭션 풀의 간단한 구성은 대기열+보류(두 개가 모든 트랜잭션을 구성함)로 나눌 수 있으며 합법성 테스트가 완료된 후 트랜잭션 대기열이 상한에 도달했는지 확인하는 등 후속 검사가 수행됩니다. 원격 트랜잭션을 판단(원격 트랜잭션은 로컬이 아닌 트랜잭션임))이 거래 풀에서 가장 낮은 가격인 경우 거래 풀에서 가장 낮은 가격의 거래를 대체합니다. 실행 가능한 트랜잭션 교체의 경우 기본적으로 수수료가 10% 증가한 트랜잭션만 이미 실행 대기 중인 트랜잭션을 교체할 수 있으며 교체 후 실행 불가능한 트랜잭션으로 저장됩니다. 또한, 거래 풀 유지 관리 과정에서 유효하지 않거나 한도 초과 거래는 삭제되며, 조건을 충족하는 거래는 교체됩니다.
- 합의 메커니즘 
이더리움의 초기 합의 이론은 여전히 난이도 값 해시 계산 방식을 기반으로 했는데, 즉 블록이 합법적이기 전에 목표 난이도 값의 조건을 충족하도록 블록의 해시 값을 계산해야 합니다. 현재 이더리움의 합의 알고리즘은 POW에서 POS로 변경되었기 때문에 채굴과 관련된 이론은 자세히 다루지 않습니다. POS 알고리즘에 대한 간략한 설명은 다음과 같습니다. 이더리움은 2022년 9월 비콘체인 합병을 완료하고 POS 알고리즘을 구현했으며, 구체적으로 POS 기반 이더리움의 각 블록의 블록타임은 12초로 안정적이며, 사용자는 이더리움에서 자신의 이더리움을 약속할 수 있는 권리를 얻는다. 검증자는 서약에 참여한 사용자 중에서 무작위로 검증자 그룹을 선택하며, 각 라운드마다 32개 슬롯 각각에서 검증자를 선택하고 그 중 한 명을 선택합니다. , 제안자는 블록 생성을 실행하고, 슬롯에 해당하는 나머지 검증인은 제안자의 블록의 적법성을 검증하는 동시에 이전 주기의 블록의 적법성에 대한 판단을 내리는 위원회 역할을 합니다. POS 알고리즘은 블록 생성 속도를 크게 안정화하고 향상시키는 동시에 컴퓨팅 리소스 낭비를 크게 방지합니다.
- 서명 알고리즘 
이더리움은 비트코인의 서명 알고리즘 표준을 따르며 secp 256 k 1 곡선도 사용합니다. 특정 서명 알고리즘은 ECDSA를 사용하는데, 이는 계산된 서명이 원본 메시지의 해시를 기반으로 계산된다는 의미입니다. 전체 서명은 간단히 말하면, R+S+V입니다. 각 계산에는 그에 따라 난수가 도입되며, 여기서 R+S는 ECDSA의 원래 출력입니다. 마지막 필드 V를 복구 필드라고 하며, 이는 R 값을 기준으로 요구 사항을 충족하는 타원 곡선에 여러 좌표점이 있을 수 있으므로 콘텐츠와 서명에서 공개 키를 성공적으로 복구하는 데 필요한 검색 횟수를 나타냅니다.
전체 과정은 간단히 요약하면 RLP 인코딩 후 거래 데이터와 서명자 관련 정보를 해싱하고 ECDSA를 통해 개인키로 서명해 최종 서명을 얻으며, ECDSA에서 사용하는 곡선은 secp 256k 1이다. 타원 곡선. 마지막으로 서명 데이터와 거래 데이터를 결합하여 서명된 거래 데이터를 획득하고 이를 브로드캐스트할 수 있습니다.
이더리움의 데이터 구조는 전통적인 블록체인 기술에만 의존하는 것이 아니라 대용량 데이터의 효율적인 저장 및 검증을 위해 Merkle 압축 접두사 트리라고도 알려진 Merkle Patricia 트리를 도입합니다. MPT는 Merkle 트리의 암호화 해싱 기능과 Patricia 트리의 주요 경로 압축 속성을 결합하여 데이터 무결성을 보장하고 빠른 조회를 지원하는 솔루션을 제공합니다.
- MPT 
Ethereum에서 MPT는 모든 상태 및 트랜잭션 데이터를 저장하는 데 사용되어 모든 데이터 변경 사항이 트리의 루트 해시에 반영되도록 합니다. 즉, 루트 해시를 확인하면 전체 데이터베이스를 확인하지 않고도 데이터의 무결성과 정확성을 증명할 수 있습니다. MPT는 리프 노드, 확장 노드, 분기 노드 및 빈 노드의 네 가지 유형의 노드로 구성되며, 이들은 함께 동적 데이터 변경에 적응할 수 있는 트리를 형성합니다. 데이터가 업데이트될 때마다 MPT는 트리의 루트 해시를 업데이트하는 동시에 노드를 추가, 삭제 또는 수정하여 이러한 변경 사항을 반영합니다. 각 노드는 해시 함수로 암호화되므로 데이터에 대한 작은 변경이라도 루트 해시에 큰 변화를 가져오므로 데이터의 보안과 일관성이 보장됩니다. 또한 MPT는 라이트 클라이언트 검증을 지원하도록 설계되어 노드가 트리의 루트 해시와 필요한 경로 노드를 저장하는 것만으로 특정 정보의 존재 또는 상태를 검증할 수 있어 데이터 저장 및 처리의 필요성이 크게 줄어듭니다.
MPT를 통해 이더리움은 효율적인 관리와 데이터에 대한 신속한 액세스를 달성할 뿐만 아니라 네트워크의 보안 및 분산화를 보장하여 전체 이더리움 네트워크의 운영 및 개발을 지원합니다.
- 상태 머신 
이더리움의 핵심 아키텍처에는 상태 머신 개념이 포함되어 있습니다.EVM(Ethereum Virtual Machine)은 모든 스마트 계약 코드를 실행하는 런타임 환경이며, 이더리움 자체는 전 세계적으로 공유되는 상태 전환 시스템으로 간주될 수 있습니다. 각 블록의 실행은 전역적으로 공유되는 하나의 상태에서 다른 상태로 이동하는 상태 전환 프로세스로 볼 수 있습니다. 이 설계는 이더리움 네트워크의 일관성과 분산성을 보장할 뿐만 아니라 스마트 계약의 실행 결과를 예측 가능하고 변조할 수 없게 만듭니다.
이더리움에서 상태란 각 계정의 잔액, 저장 데이터, 스마트 계약 코드를 포함한 모든 계정의 현재 정보를 의미합니다. 트랜잭션이 발생할 때마다 EVM은 트랜잭션 내용을 기반으로 상태를 계산하고 변환하며 이 과정은 MPT를 통해 효율적이고 안전하게 기록됩니다. 각 상태 전환은 계정 데이터를 변경할 뿐만 아니라 MPT가 업데이트되어 트리의 루트 해시 변경에 반영됩니다.
MPT는 Ethereum의 상태 전환에 대한 데이터 무결성 보장을 제공하기 때문에 EVM과 MPT 간의 관계는 매우 중요합니다. EVM이 계정 상태를 변경하는 트랜잭션을 실행하면 관련 MPT 노드가 업데이트되어 이러한 변경 사항을 반영합니다. MPT의 각 노드는 해시로 연결되어 있으므로 상태를 수정하면 루트 해시가 변경되며, 이 새로운 루트 해시가 새 블록에 포함되어 전체 이더리움 상태의 안정성과 보안이 보장됩니다. 다음으로 EVM 가상 머신을 소개합니다.
- EVM 
EVM 가상 머신은 이더리움 전체가 스마트 계약을 구축하고 상태 전환을 실행하는 기반이며, 이더리움이 진정한 의미에서 월드 컴퓨터로 상상할 수 있는 것은 EVM 덕분입니다. EVM 가상 머신은 튜링 완전체(Turing Complete)입니다. 이는 이더리움의 스마트 계약이 복잡한 논리적 계산을 수행할 수 있으며, 가스 메커니즘의 도입으로 계약의 무한 루프를 성공적으로 방지하고 네트워크의 안정성과 보안을 보장한다는 의미입니다. 보다 기술적인 수준에서 EVM은 Ethereum 특정 바이트 코드를 사용하여 스마트 계약을 실행하는 스택 기반 가상 머신입니다. 개발자는 일반적으로 Solidity와 같은 고급 언어를 사용하여 스마트 계약을 작성한 다음 EVM의 실행 호출을 위해 EVM이 이해할 수 있는 바이트 코드로 컴파일합니다. EVM은 이더리움 블록체인 혁신 기능의 핵심으로, 스마트 계약 운영을 지원할 뿐만 아니라 분산형 애플리케이션 개발을 위한 견고한 기반을 제공합니다. EVM을 통해 이더리움은 분산되고 안전하며 개방적인 디지털 미래를 형성하고 있습니다.
요약 기록

그림 1 이더리움의 역사적 검토
이더리움이 직면한 과제
안전
스마트 계약은 이더리움 블록체인에서 실행되는 컴퓨터 프로그램입니다. 이를 통해 개발자는 대출 애플리케이션, 분산 교환, 보험, 2차 금융, 소셜 네트워크 및 NFT를 포함하되 이에 국한되지 않는 다양한 애플리케이션을 만들고 게시할 수 있습니다. 스마트 계약의 보안은 이러한 애플리케이션에 매우 중요합니다. 이러한 애플리케이션은 암호화폐 처리 및 제어를 직접적으로 담당하며, 스마트 계약의 허점이나 악의적인 공격으로 인해 자금 보안에 직접적인 위협이 되고 심지어 막대한 경제적 손실을 초래할 수도 있습니다. 예를 들어, 2024년 2월 26일 DeFi 대출 프로토콜인 블루베리 프로토콜은 스마트 계약의 논리 결함으로 인해 공격을 받아 약 US$1,400,000의 손실을 입었습니다.
스마트 계약의 취약점은 불합리한 비즈니스 로직(Business Logic), 부적절한 접근 제어, 불충분한 데이터 검증, 재진입 공격, DOS(Denial of Service) 공격 등 다각적입니다. 이러한 취약점은 계약 실행에 문제를 일으킬 수 있으며 스마트 계약의 효과적인 운영에 영향을 미칠 수 있습니다. DOS 공격을 예로 들면, 이 공격 방법은 공격자가 대량의 트랜잭션을 보내 네트워크 리소스를 소비하게 하며, 일반 사용자가 시작한 트랜잭션을 제때 처리할 수 없어 사용자 경험이 저하되는 결과를 낳습니다. 게다가 이로 인해 거래 가스 수수료도 증가하게 됩니다. 네트워크 리소스가 부족한 경우 사용자는 거래 우선순위를 지정하기 위해 더 높은 수수료를 지불해야 할 수 있기 때문입니다.
또한 이더리움 사용자 역시 투자 위험에 직면하게 되며 자금의 보안도 위협받게 됩니다. 예를 들어 스팸코인은 가치가 거의 없거나 장기적인 성장 가능성이 없는 것으로 간주되는 암호화폐를 설명하는 데 사용됩니다. 스팸 코인은 펌프 앤 덤프 전략에서 사기나 가격 조작을 위한 도구로 자주 사용됩니다. 정크코인에 대한 투자는 매우 위험하며 상당한 재정적 손실을 초래할 수 있습니다. 가격이 낮고 시가총액이 낮기 때문에 조작과 변동성에 매우 취약합니다. 이 코인은 가짜 프로젝트를 사용하여 투자자를 유인하고 자금을 훔치는 펌프 앤 덤프 계획과 허니팟 사기에 자주 사용됩니다. 또 다른 일반적인 스팸코인 위험은 제작자가 갑자기 프로젝트에서 모든 유동성을 제거하여 토큰의 가치가 급락하는 러그 풀(Rug Pull)입니다. 이러한 사기는 허위 파트너십과 보증을 통해 마케팅되는 경우가 많으며, 일단 토큰 가격이 오르면 사기꾼은 토큰을 판매하고 이익을 얻고 사라지며 투자자는 쓸모없는 토큰을 남깁니다. 동시에, 똥코인에 투자하면 실제 적용과 성장 잠재력이 있는 합법적인 암호화폐에 대한 관심과 자원이 흐트러집니다.
정크코인 외에도 에어코인, MLM코인 등도 빠른 수익을 낼 수 있는 방법이다. 전문 지식과 경험이 부족한 사용자에게는 합법적인 암호화폐와 구별하는 것이 특히 어렵습니다.
능률
이더리움의 효율성을 평가하는 매우 간단한 두 가지 지표는 거래 속도와 가스 요금입니다. 거래 속도는 이더리움 네트워크가 단위 시간당 처리할 수 있는 거래 수를 나타냅니다. 이 지표는 Ethereum 네트워크의 처리 능력을 직접적으로 반영하며, 속도가 빠를수록 효율성이 높아집니다. 이더리움의 모든 거래에는 거래 검증을 수행하는 채굴자에게 보상하기 위해 특정 가스 요금이 필요합니다. 가스 비용이 낮을수록 이더리움의 효율성은 높아집니다.
거래 속도가 감소하면 가스 요금이 높아집니다. 일반적으로 트랜잭션 처리 속도가 느려지면 제한된 블록 공간으로 인해 다음 블록에 진입하기 위해 경쟁하는 트랜잭션이 증가할 수 있습니다. 경쟁에서 눈에 띄기 위해 거래자들은 종종 가스 수수료를 인상합니다. 채굴자들은 거래를 검증할 때 더 높은 가스 수수료로 거래를 우선시하는 경향이 있기 때문입니다. 그러면 가스 요금이 높아지면 사용자 경험이 저하됩니다.
거래는 이더리움의 기본적인 활동일 뿐입니다. 이 생태계에서 사용자는 대출, 담보, 투자, 보험 등 다양한 활동도 수행할 수 있습니다. 이는 모두 특정 DApp을 통해 수행될 수 있습니다. 그러나 DApp의 종류가 다양하고 기존 산업과 유사한 맞춤형 추천 서비스가 부족하다는 점에서 사용자는 자신에게 적합한 앱과 제품을 선택할 때 혼란을 느낄 것입니다. 이러한 상황은 사용자 만족도 감소로 이어질 것이며, 이는 전체 이더리움 생태계의 효율성에 영향을 미칠 것입니다.
대출을 예로 들어보겠습니다. 자체 플랫폼의 보안과 안정성을 유지하기 위해 일부 DeFi 대출 플랫폼은 초과 담보 메커니즘을 사용합니다. 이는 차용자가 더 많은 자산을 담보로 제공해야 하며, 이러한 자산은 차입 기간 동안 차용자가 다른 활동에 사용할 수 없음을 의미합니다. 이는 차입자의 자본 활용도 감소로 이어져 시장 유동성도 감소하게 됩니다.
이더리움에서의 머신러닝 적용
RFM 모델, GAN(Generative Adversarial Network), 의사결정 트리 모델, KNN(K-Nearest Neighbor Algorithm), DBSCAN 클러스터링 알고리즘 등과 같은 기계 학습 모델은 이더리움에서 중요한 역할을 하고 있습니다. 이더리움에 이러한 기계 학습 모델을 적용하면 거래 처리 효율성을 최적화하고, 스마트 계약의 보안을 향상시키며, 사용자 계층화를 실현하여 보다 개인화된 서비스를 제공하고, 네트워크의 안정적인 운영을 유지하는 데 도움이 될 수 있습니다.
알고리즘 소개
기계 학습 알고리즘은 데이터를 구문 분석하고, 데이터의 패턴을 학습하고, 이러한 학습을 기반으로 예측 또는 결정을 내리기 위한 일련의 지침 또는 규칙입니다. 인간의 명시적인 프로그래밍 지침 없이도 제공된 데이터를 통해 자동으로 학습하고 개선됩니다. RFM 모델, GAN(Generative Adversarial Network), 의사결정 트리 모델, KNN(K-Nearest Neighbor Algorithm), DBSCAN 클러스터링 알고리즘 등과 같은 기계 학습 모델은 이더리움에서 중요한 역할을 하고 있습니다. 이더리움에 이러한 기계 학습 모델을 적용하면 거래 처리 효율성을 최적화하고, 스마트 계약의 보안을 향상시키며, 사용자 계층화를 실현하여 보다 개인화된 서비스를 제공하고, 네트워크의 안정적인 운영을 유지하는 데 도움이 될 수 있습니다.
- 베이지안 분류기 
베이지안 분류기는 다양한 통계 분류 방법 중 분류 오류의 확률을 최소화하거나 특정 비용 프레임워크 하에서 평균 위험을 최소화하는 것을 목표로 하는 효율적인 분류기입니다. 디자인 철학은 베이즈 정리에 깊이 뿌리를 두고 있는데, 이는 특정 특성을 고려하여 객체가 특정 클래스에 속할 확률을 고려하여 객체의 사후 확률을 계산하여 결정을 내릴 수 있도록 하는 것입니다. 구체적으로 베이지안 분류기는 객체의 사전 확률을 먼저 고려한 후 베이지안 공식을 적용하여 관찰 데이터를 종합적으로 고려하여 객체 분류에 대한 믿음을 업데이트합니다. 가능한 모든 분류 중에서 베이지안 분류자는 객체를 이 범주로 분류할 사후 확률이 가장 큰 분류를 선택합니다. 이 접근 방식의 핵심 장점은 불확실성과 불완전한 정보를 자연스럽게 처리하여 광범위한 애플리케이션 시나리오에 적합한 강력하고 유연한 도구가 된다는 것입니다.
그림 2에서 볼 수 있듯이 지도 머신러닝에서는 베이즈 정리에 기반한 데이터와 확률 모델을 사용하여 분류 결정을 내립니다. 베이지안 분류기는 카테고리와 특징의 우도와 사전 확률을 사용하여 데이터 포인트가 각 카테고리에 속할 사후 확률을 계산하고 데이터 포인트를 사후 확률이 가장 큰 카테고리에 할당합니다. 오른쪽 산점도에서 분류자는 서로 다른 색상의 점을 가장 잘 구분하는 곡선을 찾으려고 시도하여 분류 오류를 최소화합니다.

그림 2 베이지안 분류기
- 결정 트리 
결정 트리 알고리즘은 분류 및 회귀 작업에 자주 사용되며 계층적 판단 아이디어를 채택합니다. 알려진 데이터를 기반으로 정보 획득률이 큰 특징을 선택한 후 다음과 같이 분할하여 결정 트리를 학습합니다. 나무. 간단히 말하면, 전체 알고리즘은 데이터를 기반으로 의사결정 규칙을 스스로 학습하여 변수의 값을 판단할 수 있으며, 구현 측면에서는 복잡한 의사결정 과정을 여러 개의 간단한 하위 의사결정 과정으로 분해할 수 있습니다. 이러한 파생 방법을 통해 각각의 간단한 결정 판단은 상위 결정 기준에서 파생되어 트리 구조를 형성합니다.
그림 3에서 볼 수 있듯이 각 노드는 의사결정을 나타내고 특정 속성에 대한 판단 기준을 설정하며, 가지는 의사결정 결과를 나타냅니다. 각 리프 노드는 최종 예측 결과와 범주를 나타냅니다. 알고리즘 구성의 관점에서 볼 때 의사결정나무 모델은 비교적 직관적이고 이해하기 쉬우며 해석성이 뛰어납니다.

이미지 3의사결정 트리 모델
- DBSCAN 알고리즘 
DBSCAN(Density-Based Spatial Clustering of Application with Noise)은 노이즈가 있는 밀도 기반 공간 클러스터링 알고리즘으로, 연결되지 않은 데이터 세트에 특히 잘 작동하는 것으로 보입니다. 이 알고리즘은 클러스터 수를 미리 지정하지 않고도 임의 모양의 클러스터를 발견할 수 있으며 데이터 세트의 이상값에 대한 견고성이 뛰어납니다. 이 알고리즘은 그림 4와 같이 노이즈 또는 이상값이 저밀도 영역의 점으로 정의되는 노이즈 데이터 세트에서 이상값을 식별하는 데에도 효과적입니다.

- KNN 알고리즘 
KNN(K-Nearest Neighbors) 알고리즘은 분류와 회귀 모두에 사용될 수 있습니다. 분류 문제에서는 투표 메커니즘을 사용하여 분류할 항목의 범주를 결정하고, 회귀 문제에서는 가장 가까운 이웃 샘플 k개의 평균 또는 가중 평균을 계산하여 예측합니다.
그림 5에서 볼 수 있듯이 KNN 알고리즘은 새 데이터 포인트의 가장 가까운 K 이웃을 찾은 다음 이러한 이웃의 카테고리를 기반으로 새 데이터 포인트의 카테고리를 예측하는 방식으로 분류 작업을 수행합니다. K= 1이면 새 데이터 포인트는 가장 가까운 이웃 클래스에 할당됩니다. K>1이면 일반적으로 투표 방법을 사용하여 새 데이터 포인트의 클래스를 결정합니다. 즉, 새 데이터 포인트는 가장 많은 이웃이 속하는 클래스에 할당됩니다. 회귀 문제에 KNN 알고리즘을 사용하는 경우 기본 개념은 동일하며, 결과는 최근접 이웃의 K개 샘플 출력값의 평균이 됩니다.

그림 5 분류에 사용된 KNN 알고리즘
- 생성 인공 지능 
생성 인공지능(Generative Artificial Intelligence)은 수요 입력을 기반으로 새로운 콘텐츠(텍스트, 이미지, 음악 등)를 생성할 수 있는 AI 기술이다. 그 배경은 특히 자연어 처리 및 이미지 인식과 같은 분야의 응용 프로그램을 통한 기계 학습 및 딥 러닝의 발전을 기반으로 합니다. Generative AI는 대량의 데이터에서 패턴과 연관성을 학습한 다음, 학습된 정보를 기반으로 새로운 출력을 생성하는 방식으로 작동합니다. 생성적 인공지능의 핵심은 모델 훈련에 있는데, 이는 학습과 훈련을 위해 우수한 데이터가 필요하며, 이 과정에서 모델은 데이터 세트의 구조, 패턴, 관계를 분석하고 이해함으로써 새로운 콘텐츠를 생성하는 능력을 점차 향상시킵니다.
- Transformer 
생성 인공 지능의 초석인 Transformer는 정보 처리를 통해 핵심 사항에 집중하면서 개요를 확인할 수 있는 Attention 메커니즘의 도입을 개척했으며, 이러한 독특한 능력으로 Transformer는 텍스트 생성 분야에서 빛을 발하게 되었습니다. GPT(Generative Pre-trained Transformer) 등 최신 자연어 처리 언어 모델을 활용하면 자연어로 표현된 사용자의 애플리케이션 요구사항을 파악하고 자동으로 실행 가능한 코드로 변환할 수 있어 개발 난이도를 줄이고 효율성을 획기적으로 높일 수 있습니다.
그림 6과 같이 Multi-head Attention 메커니즘과 Self-Attention 메커니즘을 도입하고 Residual Connection과 Fully Connected Neural Network를 결합하고 기존의 Word Embedding 기술을 활용하여 자연어 관련 생성 모델의 성능을 향상시켰습니다. 가공이 크게 개선되어 지구가 상승합니다.

그림 6 변압기 모델
- RFM 모델 
RFM 모델은 사용자의 구매 행태를 기반으로 한 분석 모델로, 사용자의 거래 행태를 분석하여 서로 다른 가치를 지닌 사용자 그룹을 식별할 수 있습니다. 이 모델은 최근 소비 시간(R), 소비 빈도(F), 소비량(M)을 기준으로 사용자를 계층화합니다.
그림 7과 같습니다. 이 세 가지 지표가 함께 RFM 모델의 핵심을 형성합니다. 모델은 이 세 가지 차원을 기반으로 사용자의 점수를 매기고 점수에 따라 정렬하여 가장 가치 있는 사용자 그룹을 식별합니다. 또한, 이 모델은 고객을 다양한 그룹으로 효과적으로 나누어 사용자 계층화 기능을 실현할 수 있습니다.

그림 7 RFM 계층 모델
가능한 응용
이더리움의 보안 문제를 해결하기 위해 기계 학습 기술을 적용할 때 우리는 네 가지 주요 측면에 대한 연구를 수행했습니다.
- 베이지안 분류기를 기반으로 악성 거래 식별 및 필터링 
베이지안 분류기를 구축함으로써 DOS 공격으로 이어지는 크고 빈번한 소규모 거래를 포함하되 이에 국한되지 않는 스팸 가능성이 있는 거래를 식별하고 필터링합니다. 이 방법은 가스 가격, 거래 빈도 등 거래 특성을 분석하여 네트워크의 상태를 효과적으로 유지하고 이더리움 네트워크의 안정적인 운영을 보장합니다.
- 안전하고 특정 요구 사항을 충족하는 스마트 계약 코드 생성 
GAN(Generative Adversarial Networks)과 Transformer 기반 생성 네트워크를 모두 사용하여 특정 요구 사항을 충족하고 코드 보안을 최대한 보장하는 스마트 계약 코드를 생성할 수 있습니다. 그러나 모델을 훈련하기 위해 의존하는 데이터 유형에는 차이가 있습니다.전자의 훈련 프로세스는 주로 안전하지 않은 코드 샘플에 의존하는 반면 후자는 그 반대입니다.
GAN을 훈련함으로써 우리는 기존 보안 계약 패턴을 학습하고 잠재적으로 안전하지 않은 코드를 생성하는 자기 대결 모델을 구축한 다음 모델 학습을 통해 이러한 불안정성을 식별하는 방법을 학습하여 궁극적으로 고품질의 보다 안전한 스마트 계약 코드를 자동으로 생성하는 기능을 달성합니다. ... Transformer를 기반으로 한 생성 네트워크 모델을 활용하고 수많은 보안 계약 사례를 학습하여 특정 요구 사항을 충족하고 가스 소비를 최적화하는 계약 코드를 생성하면 스마트 계약 개발의 효율성과 보안이 더욱 향상될 것입니다.
- 의사결정트리 기반의 스마트 계약 위험 분석 
의사결정 트리를 사용하여 함수 호출 빈도, 거래 가치, 소스 코드 복잡성 등 스마트 계약의 특성을 분석하면 계약의 잠재적 위험 수준을 효과적으로 식별할 수 있습니다. 계약의 작동 모드와 코드 구조를 분석하여 가능한 취약점과 위험 지점을 예측할 수 있으며 이를 통해 개발자와 사용자에게 보안 평가를 제공할 수 있습니다. 이러한 접근 방식은 이더리움 생태계의 스마트 계약 보안을 획기적으로 향상시켜 취약점이나 악성 코드로 인한 손실을 줄일 수 있을 것으로 기대됩니다.
- 투자 위험을 줄이기 위한 암호화폐 평가 모델 구축 
머신러닝 알고리즘을 활용하여 암호화폐 거래 데이터, 소셜 미디어 활동, 시장 성과 등 다차원 정보를 분석하여 스팸 코인의 가능성을 예측할 수 있는 평가 모델을 구축합니다. 이 모델은 투자자에게 투자 위험을 방지하는 데 도움이 되는 귀중한 참고 자료를 제공하여 암호화폐 시장의 건전한 발전을 촉진할 수 있습니다.
또한, 머신러닝을 활용하면 이더리움의 효율성을 더욱 향상시킬 수 있는 잠재력도 있습니다. 다음 세 가지 주요 차원을 더 자세히 살펴볼 수 있습니다.
- 트랜잭션 풀 큐잉 모델을 최적화하기 위한 의사결정 트리 적용 
의사결정 트리를 기반으로 이더리움 트랜잭션 풀의 대기열 메커니즘을 효과적으로 최적화할 수 있습니다. 의사결정 트리는 가스 가격, 거래 규모 등 거래 특성을 분석하여 거래 선택 및 대기 순서를 최적화할 수 있습니다. 이 방법은 트랜잭션 처리 효율성을 크게 향상시키고 네트워크 혼잡을 효과적으로 줄이며 사용자의 트랜잭션 대기 시간을 줄일 수 있습니다.
- 사용자를 계층화하고 개인화된 서비스 제공 
RFM 모델(Recency, Monetary value, Frequency)은 고객 관계 관리에 널리 사용되는 분석 도구로, 사용자의 마지막 거래 시간(Recency), 거래 빈도(Frequency), 거래 금액(Monetary value)을 평가할 수 있습니다. 충화. 이더리움 플랫폼에 RFM 모델을 적용하면 고가치 사용자 그룹을 식별하고, 리소스 할당을 최적화하며, 보다 개인화된 서비스를 제공함으로써 사용자 만족도와 플랫폼의 전반적인 효율성을 향상시킬 수 있습니다.
DBSCAN 알고리즘은 또한 사용자의 거래 행동을 분석하고, 이더리움의 다양한 사용자 그룹을 식별하는 데 도움을 주며, 나아가 다양한 사용자에게 더욱 맞춤화된 금융 서비스를 제공할 수 있습니다. 이러한 사용자 계층화 전략은 마케팅 전략을 최적화하고 고객 만족도와 서비스 효율성을 향상시킬 수 있습니다.
- KNN을 기반으로 한 신용 점수 
K-최근접 이웃 알고리즘(KNN)은 대출 등 금융 활동에서 매우 중요한 역할을 하는 이더리움 사용자의 거래 내역과 행동 패턴을 분석하여 사용자의 신용도를 평가할 수 있습니다. 신용 점수는 금융 기관과 대출 플랫폼이 차용자의 상환 능력과 신용 위험을 평가하여 보다 정확한 대출 결정을 내리는 데 도움이 될 수 있습니다. 이는 과도한 차입을 방지하고 시장 유동성을 향상시킵니다.
미래의 방향
거시 자금 배분의 관점에서 볼 때, 세계 최대의 분산 컴퓨터인 이더리움은 인프라 계층에 너무 많은 투자를 할 수 없으며, 공동 구축에 참여하려면 더 많은 배경의 개발자를 유치해야 합니다. 이 글에서는 이더리움이 직면한 기술적 구현과 문제점을 정리하여 상대적으로 직관적으로 가능한 머신러닝의 일련의 적용을 상상했으며, 이러한 비전을 전달하고 실질적인 가치를 창출할 수 있는 커뮤니티의 AI 개발자를 매우 기대합니다. .착륙했습니다.
체인의 컴퓨팅 성능이 점차 증가함에 따라 이더리움 네트워크의 효율성과 보안을 향상시키기 위해 네트워크 관리, 트랜잭션 모니터링, 보안 감사 및 기타 측면을 위해 보다 복잡한 모델이 개발될 것으로 예상할 수 있습니다.
더 나아가 인공 지능/에이전트 중심 거버넌스 메커니즘도 이더리움 생태계의 주요 혁신 포인트가 될 수 있습니다. 이 메커니즘으로 인해 발생하는 보다 효율적이고 투명하며 자동화된 의사 결정 프로세스는 Ethereum 플랫폼에 보다 유연하고 안정적인 거버넌스 구조를 제공합니다. 이러한 미래 개발 방향은 이더리움 기술의 혁신을 촉진할 뿐만 아니라 사용자에게 더 나은 온체인 경험을 제공할 것입니다.
AI 또는 이더리움 기술 전문가이고 이 주제에 대해 추가 논의나 협력에 관심이 있는 경우 당사에 문의하십시오.


