ProgPoW는 ASIC에 어떻게 저항합니까? 개발팀 IfDefElse가 답변해 드립니다.

MinerHub

特邀专栏作者

2019-04-19 09:09

이 기사는 약 4221자로, 전체를 읽는 데 약 7분이 소요됩니다

주류 언론의 관심을 얻은 후 ProgPoW 개발 팀 IfDefElse는 많은 알고리즘 관련 질문을 받았고 자주 묻는 몇 가지 질문에 답했습니다.

AI 요약

펼치기

주류 언론의 관심을 얻은 후 ProgPoW 개발 팀 IfDefElse는 많은 알고리즘 관련 질문을 받았고 자주 묻는 몇 가지 질문에 답했습니다.

주류 언론의 관심을 얻은 후 ProgPoW 개발 팀 IfDefElse는 많은 알고리즘 관련 질문을 받았고 자주 묻는 몇 가지 질문에 답했습니다. 마인비전은 원문 작성자의 동의를 얻어 이를 번역해 보도했다.

Q: 이더리움 거버넌스에 대한 당신의 입장은 무엇입니까?

답변: 현재로서는 입장이 없으며, ProgPoW를 언제 채택할지 여부와 같은 많은 질문에 대한 답변을 커뮤니티에 남겨야 한다고 생각합니다. 우리는 새로운 알고리즘을 제안할 책임이 있으며 이에 대한 기술적 질문에 기꺼이 답변해 드립니다.

Q: ProgPoW는 어디에서 왔습니까?

A: IfDefElse는 PoW 알고리즘을 분석하고 최적화하는 소규모 팀입니다. 우리는 ETH 커뮤니티가 전문 ASIC 채굴기가 기존 하드웨어 시설에 비해 거의 이점이 없는 새로운 PoW 알고리즘을 반복적으로 요청한 것을 관찰했습니다. 많은 알고리즘이 ASIC 채굴기에 취약한 것을 보면 가슴이 아픕니다 새로운 ASIC 채굴기가 나올 때마다 전체 ETH 커뮤니티는 좌절에 빠질 것입니다.

그래서 2018년 봄 어느 날, 우리는 GPU 마이닝의 기대 효과를 달성하기 위해 Ethash 알고리즘을 수정하는 아이디어를 냈습니다. 처음에 알고리즘을 편집한 후 개발 및 미세 조정을 위해 GitHub 공개 포럼에 올렸습니다.

Q: 누가 ProgPoW를 검토했습니까?

답변: 알고리즘 사용에 대한 피드백을 수집하는 과정에서 이더리움 재단 엔지니어, 이더리움 코어 R&D 엔지니어, NVIDIA 엔지니어 및 AMD 엔지니어로부터 피드백 이메일을 받을 수 있어서 운이 좋았습니다. NVIDIA와 AMD 엔지니어 모두 알고리즘에 대해 일반적으로 긍정적인 평가를 내렸습니다.

커뮤니티 구성원인 mbevand 및 Schemeykh의 평가를 기반으로 두 가지 알고리즘 업데이트 및 최적화가 있음을 언급할 가치가 있습니다.

Q: AMD는 어떻게 반응했습니까?

A: AMD의 응답은 두 가지 주요 문제를 해결했습니다.

ProgPoW 알고리즘이 Ethash PoW 알고리즘을 대체하는 데 사용된다면 ASIC 채굴기 제조업체가 빠르게 오픈 소스 코드를 연구하고 특화된 ASIC 채굴기를 제작할 방법이 없을까요?

ProgPoW 알고리즘은 GPU 채굴자가 Ethereum을 채굴하는 것을 더 어렵게 만들까요?

AMD 엔지니어는 긍정적인 답변을 내놓았습니다 이론적으로는 ProgPoW를 위한 새로운 ASIC 마이닝 머신을 구축하는 것이 가능하지만 이를 위해서는 제조업체가 GPU 지식, 특히 메모리 컨트롤러 기술에 대한 전문적인 배경을 가지고 있어야 합니다.

뿐만 아니라 캐시 크기에 대한 우려도 표명했습니다(로컬 데이터 공유 및 AMD 칩에 데이터 있음).

그들은 이메일에서 캐시가 8KB인지 16KB인지에 관계없이 AMD와 NVIDIA 간에 성능에 큰 차이가 없다고 언급했습니다. 그러나 32KB와 64KB에서는 두 GPU 벤더 아키텍처에 큰 영향을 미칠 수 있으며 Polaris와 Vega에서 비호환성이 있을 것입니다.

그들의 피드백에 따라 PROGPOW_CACHE_BYTES의 크기를 16KB로 설정했습니다.

Q: NVIDIA는 어떻게 대응했습니까?

A: NVIDIA 엔지니어는 일반적으로 우리의 접근 방식에 동의합니다. 알고리즘은 GPU를 고귀한 메모리 컨트롤러처럼 유휴 상태로 두지 않고 계산을 통해 메모리 액세스 사이의 간격을 채웁니다.

그들의 주요 관심사는 알고리즘에 너무 많은 무작위성을 추가하면 결국 메모리 바인딩이 아닌 계산 바인딩이 될 것이라는 점이었습니다. 결과적으로 계산 제약이 있는 알고리즘용으로 구축된 ASIC 채굴기는 더 큰 효율성과 이득을 얻을 수 있습니다.

피드백을 바탕으로 PROGPOW_CNT_CACHE 및 PROGPOW_CNT_MATH를 미세 조정하여 알고리즘이 대부분의 최신 GPU에서 메모리 바인딩 상태를 유지하도록 했습니다.

Q: ProgPoW가 메인 루프에서 모듈을 호출하고 임의의 명령을 선택하기 위해 kiss99()를 사용한다면, 이 알고리즘을 위해 설계된 ASIC 채굴기가 더 효율적이지 않을까요?

A: 이것은 알고리즘을 처음 볼 때 일반적으로 오해하는 것입니다. 실제로 주회로에서 modulus와 kiss99()를 호출하는 것은 CPU에서 임의의 프로그램을 생성하기 위해 계산한 다음 CPU에서 컴파일합니다. GPU는 실행할 명령과 사용할 혼합 상태를 파악한 최적화된 코드 실행을 담당합니다.

Alexey가 언급했듯이 ProgPoW는 50블록마다 소스 코드를 생성합니다. 생성된 프로그램의 예는 kernel.cu를 참조하십시오.

우리는 또한 표준에서 더 설명할 것입니다.

Q: 채굴자는 생성된 소스 코드를 컴파일하기 위해 AMD 또는 NVIDIA 소프트웨어 개발 키트를 설치해야 합니까?

답변: 필요 없습니다. AMD 및 NVIDIA 드라이버에는 OpenCL, DirectX 및 Vulkan 컴파일러가 포함됩니다. CUDA의 경우 바이너리 커널 파일은 작은 소프트웨어 개발 키트와 함께 배포됩니다.

Q: ProgPoW 알고리즘은 GPU 아키텍처를 선호합니까?

답변: 아니요, ProgPoW 알고리즘의 원래 의도는 최대한 공정성을 보장하는 것입니다. OpenCL과 CUDA 간에 실행에는 차이가 없으며 16KB 캐시 크기는 두 아키텍처에서 원활하게 실행됩니다.

AMD의 인덱싱된 레지스터 파일이든 NVIDIA의 LOP3이든 하나의 아키텍처에서만 16비트 또는 24비트 작업을 수행하는 것을 피하고 모든 작업이 여러 세대의 아키텍처에서 잘 지원됩니다.

마이닝 워크로드에서 ProgPoW 알고리즘을 사용하는 GPU의 성능은 해당 GPU의 평균 게임 성능도 반영합니다.

Q: Ethash와 ProgPoW의 속도 차이가 VBIOS를 많이 수정한 GPU에서 예상보다 2배 이상 느린 이유는 무엇입니까?

답변: ProgPoW는 Ethash보다 해시당 두 배 많은 메모리를 읽으므로 예상 해시 비율은 1/2입니다. 우리가 이전에 보고한 모든 조정 및 샘플 해시레이트(자세한 내용은 "결과: 해시레이트" 참조)는 정상 주파수에서 실행되는 GPU에서 수행되었습니다. 코어 주파수를 줄이기 위해 VBIOS를 광범위하게 수정하면 채굴자가 알고리즘을 실행하여 메모리 제한이 아닌 계산 제한을 받게 됩니다.

사용자가 새로운 알고리즘으로 전환해야 하는 경우 VBIOS 수정 및 튜닝을 다시 수행해야 합니다.

Q: Ethash ASIC 채굴기가 GPU 채굴기보다 2배 더 효율적인 이유를 설명해 주시겠습니까?

Ethash 알고리즘은 3가지 구성 요소만 실행하면 됩니다.

고대역폭 메모리(DAG 액세스용)

Keccak f1600 엔진(초기/최종 해싱용)

작은 컴퓨팅 코어(내부 루프 FNV 및 모듈 호출용)

FPGA 데이터는 Keccak 계산이 거의 무시할 수 있는 전력을 소비함을 보여줍니다. Ethash 알고리즘을 실행할 때 GPU 전력의 약 1/2만이 메모리 액세스에 사용되는 것으로 추정됩니다. 그러나 Ethash ASIC 마이닝 머신의 Keccak 및 컴퓨팅 코어의 전력은 미미하고 그 전력은 주로 메모리 액세스에 소비되므로 GPU의 마이닝 효율성을 두 배로 향상시킬 여지가 여전히 남아 있습니다.

현재 Ethash 마이닝 하드웨어에 대한 간략한 요약:

Titan V를 제외한 모든 데이터는 whattomine.com 및 asicminervalue.com에서 가져온 것입니다.

Ethash ASIC 마이닝 머신의 1세대인 Bitmain의 Antminer E3는 GPU 마이닝 머신보다 효율성 이점이 없습니다. 이는 DDR3 메모리가 GPU 채굴기의 GDDR 메모리보다 더 많은 전력을 소비하기 때문입니다.

우리가 아는 한 아직 출시되지 않은 Innosilicon A10 ETHMaster가 더 효율적이라고 합니다. Innosilicon은 이 마이닝 머신 시리즈에서 GDDR6 IP 기술을 사용하기 때문에 현재 가장 효율적인 마이닝 GPU RTX 2070보다 두 배 더 효율적입니다.

질문: HBM은 얼마나 실용적입니까?

A: 초기 알고리즘 평가는 동일한 메모리 유형을 사용하는 벤치마크 비교입니다. HBM은 전력 소모가 적지만 가격이 비싸 실용성이 떨어진다. 예를 들어, HBM이 탑재된 NVIDIA Titan V는 A10 ETHMaster보다 약간 덜 효율적이지만 3,000달러의 비용으로 분명히 실용적이지 않습니다.

HBM이 탑재된 AMD Vega 카드의 가격은 합리적이지만 어떤 이유로 컴퓨팅 성능이 175KH/s/W에 도달할 수 없습니다. 액세스 크기를 늘리면 상황이 크게 개선되어 Vega의 효율성을 제한하는 것이 무엇인지 확신할 수 없지만(대역폭 사용률이 61%에서 75%로 증가했습니다. 자세한 내용은 "결과: 해시레이트" 참조) Vega 그래픽 카드의 전력 소비는 여전히 너무 큽니다. 높은. 우리는 방금 발표된 Double Bandwidth AMD Radeon VII 그래픽 카드에서 상당한 효율성 향상을 기대하고 있습니다.

HBM의 성능은 GDDR6의 절반 수준으로 추정되며, HBM을 고가의 Ethash ASIC 마이닝 머신을 제조하는 데 사용할 경우 컴퓨팅 성능은 1MH/s/W를 초과하며 이는 기존 GPU 효율성의 약 4배입니다. 시장.

Q: ProgPoW ASIC은 얼마나 효율적일 수 있습니까?

A: ProgPoW는 전용 ASIC 채굴기의 효율성 향상을 대폭 줄이는 것을 목표로 합니다. 알고리즘 실행은 다음 구성 요소를 충족해야 합니다.

고대역폭 메모리(DAG 액세스용)

Keccak f800 엔진(초기/최종 해싱용)

대형 레지스터 파일(혼합 상태용)

고처리량 SIMD 정수 수학(무작위 연산용)

처리량이 높은 SIMD 캐시(임의 캐시 액세스용)

Keccak은 용량이 더 작기 때문에 GPU의 전력 소비는 이미 무시할 수 있습니다. 이런 식으로 전력 소비를 줄이는 ASIC 마이닝 머신의 이점은 더 이상 존재하지 않습니다.

무작위 시퀀스를 실행하기 위해 ProgPoW ASIC 채굴기는 GPU의 컴퓨팅 코어와 매우 유사한 것을 실행해야 합니다. 모든 SIMD 레지스터 액세스, 수학 연산 및 캐시 액세스에는 GPU와 같은 런타임이 필요합니다.

맞습니다. ProgPoW ASIC ISA는 부동 소수점 제거, 명시적 merge() 및 기타 작업 추가와 같은 ProgPoW 알고리즘과 일치하도록 정밀하게 설계될 수 있습니다. 그러나 이 전문화는 엄청난 이점이 아니라 미미한 이점만 제공합니다.

낙관적으로 우리는 잘 설계된 ProPoW ASIC ISA가 컴퓨팅 코어 전력 소비의 1/4을 제거할 수 있다고 가정합니다. GPU 코어는 ProPoW를 수행할 때 훨씬 더 활성화되기 때문에 메모리 인터페이스가 GPU 전력의 약 1/3을 소비하는 것으로 추정됩니다. 그러면 GDDR을 사용하는 Prop PoW ASIC 채굴기의 상대적인 전력 소비는 다음과 같습니다.

1/3(메모리) * 1 + 2/3(연산) * 3/4 = 5/6

1.2배의 이점

HBM을 사용하는 경우 ProgPoW ASIC 채굴기의 상대적인 전력 소비는 다음과 같습니다.

1/3(메모리) * 1/2 + 2/3(연산) * 3/4 = 2/3

1.5배의 이점

Q: FPGA에서 ProgPoW를 실행할 수 있습니까?

A: 첫째, FPGA에서 ProgPoW를 실행하는 데 실질적인 문제가 있습니다. 랜덤 프로그램은 12.5분마다 변경되기 때문에 새로운 비트스트림을 자주 컴파일하고 로드해야 합니다. 이 작업을 수행하기 위한 도구와 시설은 대체로 존재하지 않습니다.

이 문제를 무시하더라도 ProgPoW는 FPGA에 잘 매핑되지 않습니다. FPGA는 Keccak 또는 Lyra와 같은 계산 집약적인 알고리즘에 적합합니다. 이러한 알고리즘은 여러 작업을 단일 클록 주기로 압축하고 여러 작업을 동시에 실행하여 성능을 크게 개선하고 전력 소비를 줄일 수 있습니다.

ProgPoW 알고리즘 루프에는 순차적으로 인터리브된 많은 캐시 읽기가 있어 단일 클록 주기로 압축되거나 병렬로 실행될 수 있는 작업을 크게 줄입니다. ProgPoW 알고리즘 하에서 FPGA의 패키징 작업은 마이닝 하드웨어의 성능을 감소시킬 뿐만 아니라 정보 채널의 길이를 늘립니다. 늘어난 메시지 채널 길이도 큰 혼합 상태(16 레인 * 32 regs * 4 바이트 = 2 킬로바이트)로 인해 문제가 됩니다.

이 대규모 혼합 상태가 각 정보 채널을 따라 단계적으로 복제된다면 많은 전력이 낭비될 것입니다. 물론 혼합 상태를 레지스터 파일에 저장할 수도 있으므로 FPGA의 컴퓨팅 코어가 ASIC 또는 GPU와 많이 비슷해 보이지만 이 경우 FPGA의 컴퓨팅 효율성은 ASIC.

Q: 위의 모든 질문과 답변이 매우 긴 것 같습니다. 간단히 요약해 주시겠습니까?

답변: 물론입니다

채굴 하드웨어의 상대적 효율성

원본 링크:

https://medium.com/@ifdefelse/progpow-faq-6d2dce8b5c8b

원저자: IfDefElse 번역 및 교정: 물고기가 있다

이 기사는 Mining Vision에서 번역 및 편집했습니다. 전재가 필요한 경우 출처를 표시하십시오.

开发者

Odaily 공식 커뮤니티에 가입하세요