リスク警告:「仮想通貨」「ブロックチェーン」の名のもとでの違法な資金調達のリスクに注意してください。—銀行保険監督管理委員会など5部門
検索
ログイン
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt
BTC
ETH
HTX
SOL
BNB
View Market
ProgPoW は ASIC にどのように抵抗しますか?開発チーム IfDefElse があなたのために答えます
MinerHub
特邀专栏作者
2019-04-19 09:09
この記事は約4221文字で、全文を読むには約7分かかります
主流メディアの注目を集めた後、ProgPoW 開発チーム IfDefElse はアルゴリズムに関する多くの質問を受け、よくある質問のいくつかに答えました。
主流メディアの注目を集めた後、ProgPoW 開発チーム IfDefElse はアルゴリズムに関する多くの質問を受け、よくある質問のいくつかに答えました。原文著者の承諾を得て、マインビジョンが翻訳して報道しました。

1

Q: イーサリアムのガバナンスについてのあなたの立場は何ですか?

回答: 現時点では私たちに立場はありませんが、ProgPoW を採用するかどうか、いつ採用するかなど、多くの質問の回答はコミュニティに委ねられるべきだと考えています。私たちは新しいアルゴリズムを提案する責任を負い、それらに関する技術的な質問に喜んで答えます。

2

Q: ProgPoW はどこから来たのですか?

A: IfDefElse は、PoW アルゴリズムを分析して最適化する小規模なチームです。私たちは、ETH コミュニティが新しい PoW アルゴリズムを繰り返し要求していることを観察しました。このアルゴリズムでは、プロの ASIC マイニング マシンは従来のハードウェア設備に対してほとんど利点がありません。多くのアルゴリズムが ASIC マイニング マシンに対して脆弱であるのを見るのは悲痛であり、新しい ASIC マイニング マシンが登場するたびに、ETH コミュニティ全体がフラストレーションに陥ることになります。

そこで 2018 年春のある日、私たちは Ethash アルゴリズムを変更して GPU マイニングの期待される効果を達成するというアイデアを思いつきました。最初にアルゴリズムを編集した後、開発と微調整のために GitHub パブリック フォーラムに公開しました。

3

Q: ProgPoW をレビューしたのは誰ですか?

回答: アルゴリズムの使用に関するフィードバックを収集する過程で、幸運なことに、イーサリアム財団エンジニア、イーサリアムコア研究開発エンジニア、NVIDIA エンジニア、および AMD エンジニアからフィードバックの電子メールを受け取ることができました。 NVIDIA と AMD の両方のエンジニアは、アルゴリズムについて概して肯定的にコメントしました。

コミュニティ メンバーの mvevand と Schemeykh の評価に基づいて、2 つのアルゴリズムの更新と最適化があることは言及する価値があります。

4

Q: AMDはどのように対応しましたか?

A: AMD の回答は、次の 2 つの大きな懸念に対処しました。

ProgPoW アルゴリズムが Ethash PoW アルゴリズムの代わりに使用される場合、ASIC マイニング マシンのメーカーは、オープン ソース コードを迅速に調査して、専用の ASIC マイニング マシンを製造する方法はありませんか?

ProgPoW アルゴリズムにより、GPU マイナーによるイーサリアムのマイニングはさらに困難になりますか?

AMDのエンジニアは肯定的な回答をしており、理論上はProgPoW用の新しいASICマイニングマシンを構築することは可能だが、それにはメーカーがGPUの知識、特にメモリコントローラーテクノロジーの専門的な背景を持っている必要があるという。

それだけでなく、彼らはキャッシュのサイズについても懸念を表明しました(ローカルデータ共有とAMDチップ上のデータがあります)。

メールでは、キャッシュが8KBでも16KBでもAMDとNVIDIAのパフォーマンスに大きな差はないと述べていました。ただし、32 KB と 64 KB では、両方の GPU ベンダー アーキテクチャに大きな影響が生じる可能性があり、Polaris と Vega では非互換性が発生します。

彼らのフィードバックに基づいて、PROGPOW_CACHE_BYTES のサイズを 16KB に設定しました。

5

Q: NVIDIA はどのように対応しましたか?

A: NVIDIA のエンジニアは、一般的に私たちのアプローチに同意しています。このアルゴリズムは、高貴なメモリ コントローラーのように GPU を放置するのではなく、メモリ アクセス間のギャップを計算で埋めるものだと彼らは言います。

彼らの主な懸念は、アルゴリズムにランダム性を追加しすぎると、最終的にはメモリ制限ではなく計算制限がかかってしまうということでした。その結果、計算的に制約のあるアルゴリズム向けに構築された ASIC マイナーは、より優れた効率と利益を達成できる可能性があります。

彼らのフィードバックに基づいて、PROGPOW_CNT_CACHE と PROGPOW_CNT_MATH を微調整し、最新の GPU でアルゴリズムがメモリに依存しないようにしました。

6

Q: ProgPoW がメイン ループでモジュールを呼び出し、kiss99() を使用してランダムな命令を選択する場合、このアルゴリズム用に設計された ASIC マイナーの方が効率的ではないでしょうか?

A: これは、アルゴリズムを初めて見たときによくある誤解です。実際には、メイン回路での modulus と Kiss99() の呼び出しは、CPU によって計算されてランダムなプログラムが生成され、CPU によってコンパイルされます。 GPU は、実行する命令と使用するハイブリッド状態を把握した最適化されたコードを実行する責任があります。

Alexey 氏が述べたように、ProgPoW は 50 ブロックごとにソース コードを生成します。生成されたプログラムの例については、kernel.cu を参照してください。

規格についても詳しく解説していきます。

7

Q: マイナーは生成されたソース コードをコンパイルするために AMD または NVIDIA ソフトウェア開発キットをインストールする必要がありますか?

答え: 必要ありません。 AMD および NVIDIA ドライバーには、OpenCL、DirectX、および Vulkan コンパイラーが含まれています。 CUDA の場合、バイナリ カーネル ファイルは小さなソフトウェア開発キットとともに配布されます。

8

Q: ProgPoW アルゴリズムには GPU アーキテクチャが優先されますか?

回答: いいえ、ProgPoW アルゴリズムの本来の目的は、可能な限り公平性を確保することです。 OpenCL と CUDA の間で実行に違いはなく、16KB のキャッシュ サイズはどちらのアーキテクチャでもスムーズに実行されます。

AMD のインデックス付きレジスタ ファイルであっても、NVIDIA の LOP3 であっても、1 つのアーキテクチャのみで 16 ビットまたは 24 ビットの操作を実行することは避けます。すべての操作はアーキテクチャの世代にわたって適切にサポートされています。

マイニング ワークロードで ProgPoW アルゴリズムを使用する GPU のパフォーマンスは、その GPU の平均ゲーム パフォーマンスも反映します。

9

Q: Ethash と ProgPoW の速度差が、大幅に変更された VBIOS を搭載した GPU で予想されるよりも 2 倍以上遅いのはなぜですか?

回答: ProgPoW はハッシュごとに Ethash の 2 倍のメモリを読み取るため、予想されるハッシュ レートは 1/2 になります。以前に報告したすべてのチューニングとサンプル ハッシュレート (詳細については「結果: ハッシュレート」を参照) は、通常の周波数で実行されている GPU 上で行われました。コア周波数を下げるために VBIOS を大幅に変更すると、マイナーが実行するアルゴリズムがメモリ制限ではなく、計算量に制限されます。

ユーザーが新しいアルゴリズムに切り替える必要がある場合は、VBIOS の変更とチューニングを再度行う必要があります。

10

Q: Ethash ASIC マイナーがどのように GPU マイナーの 2 倍効率的であるかを説明していただけますか?

Ethash アルゴリズムは 3 つのコンポーネントを実行するだけで済みます。

高帯域幅メモリ (DAG アクセス用)

Keccak f1600 エンジン (初期/最終ハッシュ用)

小型計算コア (内部ループ FNV およびモジュール呼び出し用)

FPGA データによると、ケチャック計算の消費電力はほぼ無視できるほどです。 Ethash アルゴリズムの実行時にメモリ アクセスに費やされるのは GPU パワーの約 1/2 だけであると推定されます。ただし、Ethash ASIC マイニング マシンの Keccak とコンピューティング コアのパワーは無視でき、そのパワーは主にメモリ アクセスで消費されるため、GPU のマイニング効率を 2 倍向上させる余地がまだあります。

現在の Ethash マイニング ハードウェアの簡単な概要:

Titan V を除くすべてのデータは、whattomine.com および asicminervalue.com からのものです。

Ethash ASIC マイナーの第 1 世代である Bitmain の Antminer E3 には、GPU マイナーと比べて効率上の利点がありません。これは、DDR3 メモリが GPU マイナーの GDDR メモリよりも多くの電力を消費するためです。

私たちが知る限り、まだリリースされていない Innosilicon A10 ETHMaster の方が効率的であると言われています。 Innosilicon はこのシリーズのマイニング マシンで GDDR6 IP テクノロジーを使用しているため、現在最も効率的なマイニング GPU RTX 2070 の 2 倍の効率になります。

11

Q: HBM はどの程度実用的ですか?

A: 最初のアルゴリズム評価は、同じメモリ タイプを使用したベンチマーク比較です。 HBMは消費電力は低いですが高価なので実用的ではありません。たとえば、HBM を搭載した NVIDIA Titan V は、A10 ETHMaster よりもわずかに効率が劣るだけですが、3,000 ドルのコストがかかるため、明らかに実用的ではありません。

HBM を搭載した AMD Vega カードの価格は手頃ですが、何らかの理由でその計算能力は 175 KH/s/W にしか達しません。 Vega の効率を制限しているものはわかりませんが、アクセス サイズを増やすと状況は大幅に改善されました (帯域幅使用率が 61% から 75% に増加しました - 詳細については「結果: ハッシュレート」を参照してください)。ただし、Vega グラフィックス カードの消費電力は依然として多すぎます。高い。私たちは、発表されたばかりの Double Bandwidth AMD Radeon VII グラフィックス カードによる効率の劇的な向上を期待しています。

HBM の能力は GDDR6 の約半分であると推定されており、高価な Ethash ASIC マイニング マシンの製造に HBM が使用された場合、計算能力は 1 MH/s/W を超え、これは従来の GPU の効率の約 4 倍となります。市場。

12

Q: ProgPoW ASIC はどの程度効率的ですか?

A: ProgPoW は、専用の ASIC マイナーの効率向上を大幅に削減することを目的としています。アルゴリズムの実行は、次のコンポーネントを満たす必要があります。

高帯域幅メモリ (DAG アクセス用)

Keccak f800 エンジン (初期/最終ハッシュ用)

大きなレジスタ ファイル (混合状態の場合)

高スループット SIMD 整数演算 (ランダム演算用)

高スループット SIMD キャッシュ (ランダム キャッシュ アクセス用)

Keccak は容量が小さいため、GPU での電力消費はすでに無視できるほどになっています。このようにして、消費電力を削減するという ASIC マイニング マシンの利点はなくなります。

ランダム シーケンスを実行するには、ProgPoW ASIC マイナーは GPU 上のコンピューティング コアと非常によく似たものを実行する必要があります。すべての SIMD レジスタ アクセス、数学演算、およびキャッシュ アクセスには、GPU のようなランタイムが必要です。

そうです。ProgPoW ASIC ISA は、浮動小数点の削除、明示的な merge() およびその他の操作の追加など、ProgPoW アルゴリズムに一致するように正確に設計できます。ただし、この特化によって得られるメリットはわずかであり、桁違いの利益は得られません。

楽観的に考えれば、適切に設計された ProPoW ASIC ISA によってコンピューティング コアの消費電力の 1/4 を削減できると考えられます。 ProPoW を実行すると GPU コアがよりアクティブになるため、メモリ インターフェイスが GPU 電力の約 1/3 を消費すると推定されます。 GDDR を使用した Prop PoW ASIC マイニング マシンの相対的な消費電力は次のようになります。

1/3 (メモリ) * 1 + 2/3 (コンピューティング) * 3/4 = 5/6

1.2倍のメリット

HBM が使用されている場合、ProgPoW ASIC マイニング マシンの相対的な消費電力は次のようになります。

1/3 (メモリ) * 1/2 + 2/3 (コンピューティング) * 3/4 = 2/3

1.5倍のメリット

13

Q: ProgPoW は FPGA 上で実行できますか?

A: まず、FPGA 上で ProgPoW を実行する場合には実際的な問題があります。ランダム プログラムは 12.5 分ごとに変更されるため、新しいビットストリームを頻繁にコンパイルしてロードする必要があります。このタスクを達成するためのツールや設備はほとんど存在しません。

この問題を無視したとしても、ProgPoW は、Kecchak や Lyra などの計算量の多いアルゴリズムではうまく機能する FPGA にうまくマッピングされません。これらのアルゴリズムは、複数の操作を 1 つのクロック サイクルにパックし、複数の操作を同時に実行することにより、パフォーマンスを大幅に向上させ、消費電力を削減できます。

ProgPoW アルゴリズム ループでは、多くのキャッシュ読み取りが順番にインターリーブされるため、単一クロック サイクルにパックしたり、並列実行したりできる操作が大幅に削減されます。 ProgPoW アルゴリズムでは、FPGA のパッケージング操作によりマイニング ハードウェアのパフォーマンスが低下するだけでなく、情報チャネルの長さも長くなります。大規模な混合状態 (16 レーン * 32 regs * 4 バイト = 2 キロバイト) のため、メッセージ チャネルの長さの増加も問題になります。

この大規模な混合状態が各情報チャネルに沿って段階的に複製されると、多くの電力が無駄になります。もちろん、混合状態をレジスタ ファイルに保存して、FPGA のコンピューティング コアを ASIC や GPU によく似たものにすることもできますが、その場合、FPGA のコンピューティング効率は、FPGA のコンピューティング効率よりも大幅に低くなります。 ASIC。

14

Q: 上記の質問と回答はすべて非常に長いようですが、簡単に要約していただけますか?

答え: もちろんです

 

マイニングハードウェアの相対効率

元のリンク:


元のリンク:

https://medium.com/@ifdefelse/progpow-faq-6d2dce8b5c8b

原著者:IfDefElse 翻訳・校正:魚がある

この記事はマイニングビジョンが翻訳・編集したものです、転載する場合は出典を明記してください。




开发者
Odaily公式コミュニティへの参加を歓迎します
購読グループ
https://t.me/Odaily_News
チャットグループ
https://t.me/Odaily_CryptoPunk
公式アカウント
https://twitter.com/OdailyChina
チャットグループ
https://t.me/Odaily_CryptoPunk