Web3 기반 인프라? 어제 CloudFlare 서비스 중단 원인에 대한 간략한 분석
원본 출처: Alpha Rabbit Research Notes

원본 출처: Alpha Rabbit Research Notes
이 기사에서는 CloudFlare가 무엇인지, 어떤 회사인지, CloudFlare와 Web3의 기원에 대해 이야기하고 이러한 실패의 이유를 기술적으로 설명합니다.
첫 번째 레벨 제목
이 기사의 구조
1. 이벤트 배경
2022년 6월 말(이번주 화요일) 무슨 일이?
2. CDN(콘텐츠 전송 네트워크)이란?
CDN이란 무엇입니까?
라우팅이란 무엇입니까
CDN업체는 보통 보안업체?
3. Cloudflare는 어떤 회사인가요?
4. Cloudflare와 Web3의 기원
IPFS&이더리움
5. Cloudflare에서 서비스 중단이 발생하는 이유는 무엇입니까? (기술적 분석 섹션)
건축 변형 관련
첫 번째 레벨 제목
결론적으로
이벤트 배경
이벤트 배경
이 기사에서는 CloudFlare가 무엇인지, 어떤 회사인지, CloudFlare와 Web3의 기원에 대해 이야기하고 이러한 실패의 이유를 기술적으로 설명합니다.
첫 번째 레벨 제목
Cloudflare에 대해 이야기하기 전에 개념을 대중화합시다(CDN).
보조 제목
CDN이란 무엇입니까?CDN의 전체 이름은 Content Distribute Network(Content Distribution Network) 또는 Content Delivery Network입니다.
그렇다면 콘텐츠 전송 네트워크란 무엇입니까? 인터넷을 통해 서로 연결할 수 있는 컴퓨터 네트워크 시스템으로 각 사용자와 가장 가까운 서버를 이용하여 음악, 사진, 동영상, 응용 프로그램 및 기타 파일을 사용자에게 더 빠르고 안정적으로 전송하여 고성능, 확장성 및 사용자에게 제공되는 저비용 웹 콘텐츠.시각적으로 CDN은 JD 물류 모델과 다소 유사합니다.
, 전국에 물류 거점(캐시 서버)을 구축하여 누군가가 JD.com에서 상품을 구매할 때(사용자 자원 요청) JD.com은 사용자의 배송 주소(사용자 도메인 이름에 대한 CDN)에 따라 가장 가깝거나 가장 빠른 것을 찾을 수 있습니다. 해결) 마지막으로 배송을 위한 물류 지점(자원 이전을 위해 액세스 사용자를 가장 가까운 캐시 서버에 연결).
CDN 서비스는 정적 콘텐츠의 빠르고 안정적인 전달을 보장하는 데 사용할 수 있습니다. 이 콘텐츠는 캐시될 수 있고 네트워크 속도가 빠른 네트워크의 저장 및 배포에 가장 적합하므로 실시간으로 전달해야 하는 동적 콘텐츠를 위한 백본 네트워크 채널을 확보할 수 있습니다. 지연을 줄이기 위해 웹캐스팅과 같은 .예를 들어, 주요 고객이 영국에 있는 영국 회사가 있는데 이 회사의 웹 사이트가 구축되면 웹 사이트 서버는 일반적으로 영국에 배치됩니다. 그러나 사용자의 웹 사이트 액세스 경험에 영향을 미치는 지연이 있을 수 있지만 네트워크 정체로 인해 지연이 발생하는 경우 이 지연을 개선할 수 있습니다.
그것을 개선하는 방법?
여기서 광섬유의 수는 주로 해저광케이블, 철도, 고속도로 등의 인프라를 구축할 때 동시에 깔린다. 따라서 우리가 사용하는 대역폭은 해가 갈수록 증가하고 있는데, 네트워크론의 증가는 교통도로의 확장으로 이해할 수 있으며, 이는 도로를 깔기 위해 돈을 쓰는 문제입니다.
보조 제목
라우팅앞에서 네트워크 라우팅에 대해 언급했지만라우팅이란 무엇입니까? 실제로 라우팅이 해결하는 주요 문제는 두 지점 간의 통신과 어떤 경로를 택할 것인지입니다.
예를 들어 런던과 옥스퍼드 사이에 네트워크 정체가 발생하면 시스템은 다른 경로를 선택할 수 있습니다. 스마트 교통과 비슷하고 인터넷 라우팅 최적화도 비슷합니다. 따라서 수년에 걸쳐 트래픽 증가에도 불구하고 네트워크 성능이 향상되었습니다.
평신도의 용어로 웹 사이트를 가속화하는 것입니다.일부 웹 사이트는 CDN 가속화가 필요한 이유로 인해 매우 느리게 열립니다.
따라서 유럽 사용자가 미국 웹사이트의 콘텐츠에 액세스하려는 경우 CDN은 유럽에 서버를 설정하고 미국 콘텐츠를 이 서버로 번역합니다. 유럽 사용자가 도메인 이름에 접속할 때 CDN 운영자는 사용자의 접속이 유럽 시스템에서 온다는 것을 알고 있기 때문에 사용자에게 유럽 서버의 IP 주소를 제공하고 사용자는 자연스럽게 유럽 서버에 접속하게 됩니다.
보조 제목
CDN업체는 보통 보안업체?
참고: 이 부분의 CDN에 대한 설명은 부분적으로 Youtube 블로거 Lao Ke Tan Technology Stock에서 가져온 것입니다.
첫 번째 레벨 제목
Cloudflare는 어떤 회사인가요?2010년에 Cloudflare가 공식적으로 설립되었으며 미국 샌프란시스코에 본사가 있습니다. CDN 및 보안 서비스를 주력 사업으로 하는 회사이며, Cloudflare의 주요 사업은 고객에게 역방향 프록시 기반 콘텐츠 배포 네트워크 및 분산 도메인 이름 확인 서비스(Distributed Domain Name Server)를 제공하는 것입니다. 2009년부터 유니온스퀘어벤처스 등 벤처캐피털의 투자를 받아왔으며, 바이두도 클라우드플레어의 D라운드 자금조달에 참여했으며,
또한 Cloudflare는 2014년 StopTheHacker 및 CryptoSeal, 2016년 Eager Platform Co., 2017년 이후 Neumob, S2 Systems, Linc, Zaraz, Vectrix 및 Area 1 Security를 포함한 일련의 네트워크 서비스 및 보안 회사를 인수했습니다.
첫 번째 레벨 제목

Cloudflare와 Web3의 기원Cloudflare는 비교적 일찍 Web3 개발을 지원하기 시작한 CDN 회사입니다.공식 웹 사이트에는 다음과 같이 나와 있습니다.또한 공식 웹사이트에서는 Web 1.0이 전 세계에 정보를 신속하게 전파할 수 있는 능력을 제공했으며 Web 2.0은 이 정보를 상호 작용할 수 있게 했다고 언급합니다. Web 3.0 또는 Web3는 IPFS 및 Ethereum과 같은 분산 기술을 기반으로 구축된 차세대 인터넷 반복으로 간주됩니다.

이미지 설명
Cloudflare 공식 웹사이트의 사진

Cloudflare Ethereum Gateway를 통해 고객은 HTTP JSON RPC 쿼리를 통해 사용자 지정 도메인으로 보낼 수 있는 자신의 도메인을 사용할 수 있습니다. Cloudflare는 Web3 인프라를 관리, 유지 및 모니터링할 수 있으므로 빌더는 중요한 Dapp 구축에 집중할 수 있습니다. Cloudflare는 업계 최고의 글로벌 네트워크를 통해 Web3 기술을 기반으로 안전하고 안정적이며 빠른 서비스를 만들 수 있습니다.
Cloudflare에서 서비스 중단이 발생하는 이유는 무엇인가요?
보조 제목
2022년 6월 21일 Cloudflare 서비스 중단 이벤트에 대한 공식 설명:
Cloudflare는 공격이나 기타 악의적인 활동으로 인한 것이 아니라 Cloudflare의 잘못인 이 중단에 대해 사과드립니다.
보조 제목
이러한 건축적 변화의 배경
지난 18개월 동안 Cloudflare는 가장 바쁜 모든 데이터 센터의 아키텍처를 혁신하여 더욱 민첩하고 탄력적으로 만들기 위해 노력해 왔습니다. 현재 Cloudflare가 내부적으로 Multi-Colo PoP(MCP)라고 부르는 이 아키텍처로 19개의 데이터 센터가 성공적으로 변환되었습니다. , 맨체스터, 마이애미, 밀라노, 뭄바이, 뉴어크, 오사카, 상파울루, 산호세, 싱가포르, 시드니, 도쿄.

이 새로운 아키텍처는 Clos 네트워크로 설계되었으며, 그 핵심 부분은 추가 라우팅 레이어(아래 다이어그램 참조)를 추가하여 연결 메시를 생성하는 것입니다. 이 메시 구조를 사용하면 유지 관리를 위해 데이터 센터 내부 네트워크의 일부를 쉽게 비활성화 및 활성화하거나 문제를 해결할 수 있습니다. 이 레이어는 아래 그림에서 식별되는 스파인 섹션으로 표시됩니다.
참고: Clos 네트워크는 다단계 교환망으로 1953년 Charles Clos가 처음 공식적으로 사용했으며 실제 다단계 전화 교환 시스템을 이상적으로 표현한 것입니다. Clos 네트워크는 물리적 회로 스위칭 요구 사항이 단일 크로스바 스위치의 최대 달성 가능 용량을 초과할 때 사용됩니다. Clos 네트워크의 주요 장점은 필요한 교차점의 수가 큰 Crossbar Switch를 사용하는 전체 교환 시스템에서 필요한 교차점의 수보다 훨씬 적다는 것입니다.그러나 이러한 위치는 Cloudflare 트래픽의 상당 부분을 호스팅하기 때문에 여기에서 발생하는 모든 문제는 매우 광범위한 영향을 미칠 수 있으며 안타깝게도 Cloudflare 서비스가 6월 21일에 종료된 이유입니다.
보조 제목
서비스 중단의 타임라인 및 영향Cloudflare는 BGP(Border Gateway Protocol, Border Gateway Protocol, TCP에서 실행되는 자율 시스템 라우팅 프로토콜)라는 프로토콜을 사용합니다."프로토콜의 운영자 정의 정책은 피어(연결된 다른 네트워크)에 브로드캐스트되는 접두사(인접한 IP 주소 집합)를 결정합니다. 이러한 정책에는 순차적으로 평가되는 별도의 구성 요소가 있습니다. 최종 결과는 주어진 접두사가 브로드캐스트되거나 브로드캐스트되지 않는 것입니다. 정책 변경은 이전에 브로드캐스트된 접두사가 더 이상 브로드캐스트되지 않음을 의미할 수 있습니다."취소
, 이러한 IP 주소는 더 이상 인터넷에서 제대로 작동하지 않습니다.

운영자는 특정 전략을 수립하고 특정 경로 접두사를 브로드캐스트할 수 있다고 결정했습니다(여기서 브로드캐스트는 다른 에지 bgp 라우터에서 경로를 학습할 수 있고 다른 bgp 네트워크에서 이러한 경로 변경 사항을 알 수 있음을 의미합니다. 접두사는 접두사이며 이는 인터넷에 연결된 네트워크 번호를 고유하게 식별하는 데 사용됨)
접두사 광고 정책이 변경되면 용어가 재정렬되어 Cloudflare가 중요한 접두사 하위 집합을 철회합니다.
03:56 UTC:정책 변경은 이전에 브로드캐스트된 접두사가 더 이상 브로드캐스트되지 않음을 의미할 수 있으며, Cloudflare 엔지니어는 영향을 받는 데이터 센터의 문제가 있는 부분을 복구하는 데 추가적인 어려움을 겪었습니다. Cloudflare에는 이러한 문제를 처리하기 위한 백업 절차가 있습니다.
06:17:Cloudflare는 변경 사항을 첫 번째(데이터 센터) 위치에 배포했으며 해당 위치에서 사용하는 이전 아키텍처로 인해 이 변경 사항의 영향을 받는 위치는 없습니다.
06:27:배포는 Cloudflare의 가장 바쁜 위치로 변경되지만 MCP(Multi-Colo PoP) 아키텍처가 있는 위치로는 변경되지 않습니다.
06:32:배포가 MCP(Multi-Colo PoP)가 활성화되는 지점에 도달했으며 변경 사항이 중요한 부분에 배포되었습니다. 이때 정전이 시작되었고 19개의 데이터 센터가 빠르게 오프라인 상태가 되었습니다.
06:51:Cloudflare는 내부적으로 중단을 발표했습니다.
06:58:근본 원인을 확인하기 위해 라우터에서 첫 번째 변경.
07:42:문제를 해결하여 근본 원인을 찾고 잘못된 것을 복원하십시오.
08:00:마지막 되돌리기가 완료되고 네트워크 엔지니어가 상대방의 변경 사항을 확인하고 상태를 되돌리기 시작했는데 문제가 산발적으로 다시 나타나서 약간의 지연이 있었습니다.
서비스 중단 이벤트가 종료되었습니다.

이러한 문제가 있는 데이터 센터는 Cloudflare 전체 네트워크의 4%만 차지했지만 중단은 전체 요청의 50%에 영향을 미쳤습니다.

(이 부분에는 코드의 작은 부분이 있으며 여기에서는 생략됩니다. 관심 있는 네트워크 엔지니어링 파트너는 원본 텍스트를 볼 수 있습니다.
https://blog.cloudflare.com/cloudflare-outage-on-june-21-2022/)
텍스트
수정 및 다음 단계
이번 서비스 단말기 사고는 광범위하고 심각한 영향을 미쳤습니다. Cloudflare는 항상 사용성을 매우 중시했습니다. 이미 몇 가지 개선 영역을 제안했으며 잠재적으로 서비스 단말기로 이어질 수 있는 모든 문제를 찾기 위해 계속 열심히 노력할 것입니다.프로세스:
MCP 프로그램은 가용성을 높이도록 설계되었지만 이러한 데이터 센터를 업데이트하는 데 심각한 영향을 미치는 절차상의 격차가 있었습니다. Cloudflare는 엇갈린 전략을 염두에 두고 있지만 완벽하지는 않으며 배포 프로세스 및 자동화에는 의도하지 않은 결과가 발생하지 않도록 MCP 테스트 및 특정 배포 프로세스가 포함되어야 합니다.건축학:
잘못 구성된 라우터는 적절한 경로 브로드캐스트를 방해하여 정상적인 트래픽 및 인프라 작업을 방해할 수 있습니다. Cloudflare는 정렬 오류를 방지하기 위해 경로 광고의 정책 설명을 재설계합니다.오토메이션:"이 사건의 부정적인 영향을 완화할 수 있는 Cloudflare 자동화 제품군의 일부가 있습니다. Cloudflare는 자동화 개선, 네트워크 구성 롤아웃을 위한 개선된 인터리빙 정책 시행, 자동화 개선에 초점을 맞출 것입니다."보조 제목
결론적으로
결론적으로


