ProgPoW は ASIC にどのように抵抗しますか?開発チーム IfDefElse があなたのために答えます

MinerHub

特邀专栏作者

2019-04-19 09:09

この記事は約4221文字で、全文を読むには約7分かかります

主流メディアの注目を集めた後、ProgPoW 開発チーム IfDefElse はアルゴリズムに関する多くの質問を受け、よくある質問のいくつかに答えました。

AI要約

展開

主流メディアの注目を集めた後、ProgPoW 開発チーム IfDefElse はアルゴリズムに関する多くの質問を受け、よくある質問のいくつかに答えました。

主流メディアの注目を集めた後、ProgPoW 開発チーム IfDefElse はアルゴリズムに関する多くの質問を受け、よくある質問のいくつかに答えました。原文著者の承諾を得て、マインビジョンが翻訳して報道しました。

Q: イーサリアムのガバナンスについてのあなたの立場は何ですか?

回答: 現時点では私たちに立場はありませんが、ProgPoW を採用するかどうか、いつ採用するかなど、多くの質問の回答はコミュニティに委ねられるべきだと考えています。私たちは新しいアルゴリズムを提案する責任を負い、それらに関する技術的な質問に喜んで答えます。

Q: ProgPoW はどこから来たのですか?

A: IfDefElse は、PoW アルゴリズムを分析して最適化する小規模なチームです。私たちは、ETH コミュニティが新しい PoW アルゴリズムを繰り返し要求していることを観察しました。このアルゴリズムでは、プロの ASIC マイニングマシンは従来のハードウェア設備に対してほとんど利点がありません。多くのアルゴリズムが ASIC マイニングマシンに対して脆弱であるのを見るのは悲痛であり、新しい ASIC マイニングマシンが登場するたびに、ETH コミュニティ全体がフラストレーションに陥ることになります。

そこで 2018 年春のある日、私たちは Ethash アルゴリズムを変更して GPU マイニングの期待される効果を達成するというアイデアを思いつきました。最初にアルゴリズムを編集した後、開発と微調整のために GitHub パブリックフォーラムに公開しました。

Q: ProgPoW をレビューしたのは誰ですか?

回答: アルゴリズムの使用に関するフィードバックを収集する過程で、幸運なことに、イーサリアム財団エンジニア、イーサリアムコア研究開発エンジニア、NVIDIA エンジニア、および AMD エンジニアからフィードバックの電子メールを受け取ることができました。 NVIDIA と AMD の両方のエンジニアは、アルゴリズムについて概して肯定的にコメントしました。

コミュニティメンバーの mvevand と Schemeykh の評価に基づいて、2 つのアルゴリズムの更新と最適化があることは言及する価値があります。

Q: AMDはどのように対応しましたか?

A: AMD の回答は、次の 2 つの大きな懸念に対処しました。

ProgPoW アルゴリズムが Ethash PoW アルゴリズムの代わりに使用される場合、ASIC マイニングマシンのメーカーは、オープンソースコードを迅速に調査して、専用の ASIC マイニングマシンを製造する方法はありませんか?

ProgPoW アルゴリズムにより、GPU マイナーによるイーサリアムのマイニングはさらに困難になりますか?

AMDのエンジニアは肯定的な回答をしており、理論上はProgPoW用の新しいASICマイニングマシンを構築することは可能だが、それにはメーカーがGPUの知識、特にメモリコントローラーテクノロジーの専門的な背景を持っている必要があるという。

それだけでなく、彼らはキャッシュのサイズについても懸念を表明しました（ローカルデータ共有とAMDチップ上のデータがあります）。

メールでは、キャッシュが8KBでも16KBでもAMDとNVIDIAのパフォーマンスに大きな差はないと述べていました。ただし、32 KB と 64 KB では、両方の GPU ベンダーアーキテクチャに大きな影響が生じる可能性があり、Polaris と Vega では非互換性が発生します。

彼らのフィードバックに基づいて、PROGPOW_CACHE_BYTES のサイズを 16KB に設定しました。

Q: NVIDIA はどのように対応しましたか?

A: NVIDIA のエンジニアは、一般的に私たちのアプローチに同意しています。このアルゴリズムは、高貴なメモリコントローラーのように GPU を放置するのではなく、メモリアクセス間のギャップを計算で埋めるものだと彼らは言います。

彼らの主な懸念は、アルゴリズムにランダム性を追加しすぎると、最終的にはメモリ制限ではなく計算制限がかかってしまうということでした。その結果、計算的に制約のあるアルゴリズム向けに構築された ASIC マイナーは、より優れた効率と利益を達成できる可能性があります。

彼らのフィードバックに基づいて、PROGPOW_CNT_CACHE と PROGPOW_CNT_MATH を微調整し、最新の GPU でアルゴリズムがメモリに依存しないようにしました。

Q: ProgPoW がメインループでモジュールを呼び出し、kiss99() を使用してランダムな命令を選択する場合、このアルゴリズム用に設計された ASIC マイナーの方が効率的ではないでしょうか?

A: これは、アルゴリズムを初めて見たときによくある誤解です。実際には、メイン回路での modulus と Kiss99() の呼び出しは、CPU によって計算されてランダムなプログラムが生成され、CPU によってコンパイルされます。 GPU は、実行する命令と使用するハイブリッド状態を把握した最適化されたコードを実行する責任があります。

Alexey 氏が述べたように、ProgPoW は 50 ブロックごとにソースコードを生成します。生成されたプログラムの例については、kernel.cu を参照してください。

規格についても詳しく解説していきます。

Q: マイナーは生成されたソースコードをコンパイルするために AMD または NVIDIA ソフトウェア開発キットをインストールする必要がありますか?

答え: 必要ありません。 AMD および NVIDIA ドライバーには、OpenCL、DirectX、および Vulkan コンパイラーが含まれています。 CUDA の場合、バイナリカーネルファイルは小さなソフトウェア開発キットとともに配布されます。

Q: ProgPoW アルゴリズムには GPU アーキテクチャが優先されますか?

回答: いいえ、ProgPoW アルゴリズムの本来の目的は、可能な限り公平性を確保することです。 OpenCL と CUDA の間で実行に違いはなく、16KB のキャッシュサイズはどちらのアーキテクチャでもスムーズに実行されます。

AMD のインデックス付きレジスタファイルであっても、NVIDIA の LOP3 であっても、1 つのアーキテクチャのみで 16 ビットまたは 24 ビットの操作を実行することは避けます。すべての操作はアーキテクチャの世代にわたって適切にサポートされています。

マイニングワークロードで ProgPoW アルゴリズムを使用する GPU のパフォーマンスは、その GPU の平均ゲームパフォーマンスも反映します。

Q: Ethash と ProgPoW の速度差が、大幅に変更された VBIOS を搭載した GPU で予想されるよりも 2 倍以上遅いのはなぜですか?

回答: ProgPoW はハッシュごとに Ethash の 2 倍のメモリを読み取るため、予想されるハッシュレートは 1/2 になります。以前に報告したすべてのチューニングとサンプルハッシュレート (詳細については「結果: ハッシュレート」を参照) は、通常の周波数で実行されている GPU 上で行われました。コア周波数を下げるために VBIOS を大幅に変更すると、マイナーが実行するアルゴリズムがメモリ制限ではなく、計算量に制限されます。

ユーザーが新しいアルゴリズムに切り替える必要がある場合は、VBIOS の変更とチューニングを再度行う必要があります。

Q: Ethash ASIC マイナーがどのように GPU マイナーの 2 倍効率的であるかを説明していただけますか?

Ethash アルゴリズムは 3 つのコンポーネントを実行するだけで済みます。

高帯域幅メモリ (DAG アクセス用)

Keccak f1600 エンジン (初期/最終ハッシュ用)

小型計算コア (内部ループ FNV およびモジュール呼び出し用)

FPGA データによると、ケチャック計算の消費電力はほぼ無視できるほどです。 Ethash アルゴリズムの実行時にメモリアクセスに費やされるのは GPU パワーの約 1/2 だけであると推定されます。ただし、Ethash ASIC マイニングマシンの Keccak とコンピューティングコアのパワーは無視でき、そのパワーは主にメモリアクセスで消費されるため、GPU のマイニング効率を 2 倍向上させる余地がまだあります。

現在の Ethash マイニングハードウェアの簡単な概要:

Titan V を除くすべてのデータは、whattomine.com および asicminervalue.com からのものです。

Ethash ASIC マイナーの第 1 世代である Bitmain の Antminer E3 には、GPU マイナーと比べて効率上の利点がありません。これは、DDR3 メモリが GPU マイナーの GDDR メモリよりも多くの電力を消費するためです。

私たちが知る限り、まだリリースされていない Innosilicon A10 ETHMaster の方が効率的であると言われています。 Innosilicon はこのシリーズのマイニングマシンで GDDR6 IP テクノロジーを使用しているため、現在最も効率的なマイニング GPU RTX 2070 の 2 倍の効率になります。

Q: HBM はどの程度実用的ですか?

A: 最初のアルゴリズム評価は、同じメモリタイプを使用したベンチマーク比較です。 HBMは消費電力は低いですが高価なので実用的ではありません。たとえば、HBM を搭載した NVIDIA Titan V は、A10 ETHMaster よりもわずかに効率が劣るだけですが、3,000 ドルのコストがかかるため、明らかに実用的ではありません。

HBM を搭載した AMD Vega カードの価格は手頃ですが、何らかの理由でその計算能力は 175 KH/s/W にしか達しません。 Vega の効率を制限しているものはわかりませんが、アクセスサイズを増やすと状況は大幅に改善されました (帯域幅使用率が 61% から 75% に増加しました - 詳細については「結果: ハッシュレート」を参照してください)。ただし、Vega グラフィックスカードの消費電力は依然として多すぎます。高い。私たちは、発表されたばかりの Double Bandwidth AMD Radeon VII グラフィックスカードによる効率の劇的な向上を期待しています。

HBM の能力は GDDR6 の約半分であると推定されており、高価な Ethash ASIC マイニングマシンの製造に HBM が使用された場合、計算能力は 1 MH/s/W を超え、これは従来の GPU の効率の約 4 倍となります。市場。

Q: ProgPoW ASIC はどの程度効率的ですか?

A: ProgPoW は、専用の ASIC マイナーの効率向上を大幅に削減することを目的としています。アルゴリズムの実行は、次のコンポーネントを満たす必要があります。

高帯域幅メモリ (DAG アクセス用)

Keccak f800 エンジン (初期/最終ハッシュ用)

大きなレジスタファイル (混合状態の場合)

高スループット SIMD 整数演算 (ランダム演算用)

高スループット SIMD キャッシュ (ランダムキャッシュアクセス用)

Keccak は容量が小さいため、GPU での電力消費はすでに無視できるほどになっています。このようにして、消費電力を削減するという ASIC マイニングマシンの利点はなくなります。

ランダムシーケンスを実行するには、ProgPoW ASIC マイナーは GPU 上のコンピューティングコアと非常によく似たものを実行する必要があります。すべての SIMD レジスタアクセス、数学演算、およびキャッシュアクセスには、GPU のようなランタイムが必要です。

そうです。ProgPoW ASIC ISA は、浮動小数点の削除、明示的な merge() およびその他の操作の追加など、ProgPoW アルゴリズムに一致するように正確に設計できます。ただし、この特化によって得られるメリットはわずかであり、桁違いの利益は得られません。

楽観的に考えれば、適切に設計された ProPoW ASIC ISA によってコンピューティングコアの消費電力の 1/4 を削減できると考えられます。 ProPoW を実行すると GPU コアがよりアクティブになるため、メモリインターフェイスが GPU 電力の約 1/3 を消費すると推定されます。 GDDR を使用した Prop PoW ASIC マイニングマシンの相対的な消費電力は次のようになります。

1/3 (メモリ) * 1 + 2/3 (コンピューティング) * 3/4 = 5/6

1.2倍のメリット

HBM が使用されている場合、ProgPoW ASIC マイニングマシンの相対的な消費電力は次のようになります。

1/3 (メモリ) * 1/2 + 2/3 (コンピューティング) * 3/4 = 2/3

1.5倍のメリット

Q: ProgPoW は FPGA 上で実行できますか?

A: まず、FPGA 上で ProgPoW を実行する場合には実際的な問題があります。ランダムプログラムは 12.5 分ごとに変更されるため、新しいビットストリームを頻繁にコンパイルしてロードする必要があります。このタスクを達成するためのツールや設備はほとんど存在しません。

この問題を無視したとしても、ProgPoW は、Kecchak や Lyra などの計算量の多いアルゴリズムではうまく機能する FPGA にうまくマッピングされません。これらのアルゴリズムは、複数の操作を 1 つのクロックサイクルにパックし、複数の操作を同時に実行することにより、パフォーマンスを大幅に向上させ、消費電力を削減できます。

ProgPoW アルゴリズムループでは、多くのキャッシュ読み取りが順番にインターリーブされるため、単一クロックサイクルにパックしたり、並列実行したりできる操作が大幅に削減されます。 ProgPoW アルゴリズムでは、FPGA のパッケージング操作によりマイニングハードウェアのパフォーマンスが低下するだけでなく、情報チャネルの長さも長くなります。大規模な混合状態 (16 レーン * 32 regs * 4 バイト = 2 キロバイト) のため、メッセージチャネルの長さの増加も問題になります。

この大規模な混合状態が各情報チャネルに沿って段階的に複製されると、多くの電力が無駄になります。もちろん、混合状態をレジスタファイルに保存して、FPGA のコンピューティングコアを ASIC や GPU によく似たものにすることもできますが、その場合、FPGA のコンピューティング効率は、FPGA のコンピューティング効率よりも大幅に低くなります。 ASIC。

Q: 上記の質問と回答はすべて非常に長いようですが、簡単に要約していただけますか?

答え: もちろんです

マイニングハードウェアの相対効率

元のリンク:

https://medium.com/@ifdefelse/progpow-faq-6d2dce8b5c8b

原著者：IfDefElse 翻訳・校正：魚がある

この記事はマイニングビジョンが翻訳・編集したものです、転載する場合は出典を明記してください。

开发者

Odaily公式コミュニティへの参加を歓迎します