人工知能コンテンツ生成の詳細な復号化の開発と現状
まとめ
AIGC は Web3.0 時代の生産性ツールであり、Web3.0 とブロックチェーンの適用により生産関係とユーザー主権が決まり、AIGC は多大な生産性を提供します。
まとめ
AIGC は Web3.0 時代の生産性ツールであり、Web3.0 とブロックチェーンの適用により生産関係とユーザー主権が決まり、AIGC は多大な生産性を提供します。
しかし、AIGC と Web3 は 2 つの異なる方向であることを認識する必要があります。 AIGCはAI技術を活用した制作ツールとして、Web2の世界でもWeb3の世界でも適用可能です。これまでに開発されたプロジェクトのほとんどは、依然として Web2 分野にあります。この二人について一緒に話すのは不適切だ。そしてWeb3は、ブロックチェーンとスマートコントラクト技術を利用して、ユーザーが仮想資産の主権を持てるようにしたいと考えている。これと作成モードの間には直接的な関係はありません。
本稿ではAIGCの発展と現状を以下の4つの側面から読み解いていきます。
コンテンツ作成フォームの進化
技術試験の概要
AIGC の産業応用
AIGC と Web3
パート 1: コンテンツ作成フォームの進化
次の 3 つの段階に分けることができます。
第一段階はPGC(Professionally-Generated Content)で、専門家がコンテンツを生成し、コンテンツ関連分野の資格を持った専門チームが制作するもので、敷居もコストも高く、品質はある程度保証されています。テレビドラマや映画などの商業チャンネルのメリットを追求しており、その代表的なプロジェクトがAyoutengが主導する動画プラットフォームです。これらのプラットフォームでは、Web1.0 の概念と同様に、ユーザーは主に視聴するビデオ リソースを受信して検索します。
しかし現段階では、創作の権利は一部の専門家に握られており、一般のクリエイターの功績は一般の目には見えにくい。第2段階では、TwitterやYouTube、Ayoutengなどの国内動画プラットフォームなど、一連のUGCプラットフォーム(User-generated Content、ユーザー生成コンテンツ)が派生した。これらのプラットフォームでは、ユーザーは受信者であるだけでなく、コンテンツの提供者でもあり、コンテンツ制作の規模は大きく拡大していますが、ユーザーが制作するコンテンツの品質にはばらつきがあり、Web2.0時代のコンテンツとも言えます。 。


では、Web3.0時代のコンテンツ制作の生態とはどのようなものなのでしょうか? AIGC と web3 の関係はどこにありますか?
AIGC (AI 生成コンテンツ、人工知能生成コンテンツ) とは、人工知能がコンテンツ作成において人間を支援、または人間に取って代わることを意味します。これは、Web3.0 およびメタバースにおけるいくつかの実際的な問題の解決に役立つ強力な生産性ツールとして使用できます。より頻繁に生産され、あらゆる人のニーズに合わせてスタイルを設定できます。コンテンツ作成のインスピレーションを無限に拡張でき、結果も悪くありません。

パート II: 技術テストの概要
AIGC テクノロジーの急速な発展は、GAN (Generation Against Network、2014) モデルの発表から始まりました。これは、生成モデルと識別モデルの 2 つのモデルで構成されます。ジェネレーターは「偽」データを生成し、ディスクリミネーターを騙そうとします。ディスクリミネーターは生成されたデータを検証し、すべての「偽」データを正しく識別しようとします。トレーニングの反復中に、平衡状態に達するまで 2 つのネットワークが互いに改善されます。
AIGC テクノロジーの急速な発展は、GAN (Generation Against Network、2014) モデルの発表から始まりました。これは、生成モデルと識別モデルの 2 つのモデルで構成されます。ジェネレーターは「偽」データを生成し、ディスクリミネーターを騙そうとします。ディスクリミネーターは生成されたデータを検証し、すべての「偽」データを正しく識別しようとします。トレーニングの反復中に、平衡状態に達するまで 2 つのネットワークが互いに改善されます。
GAN の公開後 2 ~ 3 年で、業界では GAN モデルのさまざまな変換と応用が行われました。 2016年と2017年には、音声合成、感情検出、顔の変更などの分野で多くの実用的なアプリケーションが生まれました。

2017 年に Google によって開発された Transformer モデルは、長期および短期メモリ (LSTM) などの従来の RNN モデルを徐々に置き換え、NLP 問題に選択されるモデルになりました。
Se q2 seq モデルとして、各単語とそのコンテキストの相関関係を計算して、目前のタスクにとってどの情報が最も重要かを判断する注意メカニズムを提案します。 Transformer は他のモデルよりも高速で、有効な情報をより長く保持します。
BERT (Bidirectional Encoder Representations from Transformer、2018) は、Transformer を使用して自然言語処理のための完全なモデル フレームワークを構築します。さまざまな自然言語処理タスクにおいて既存のモデルよりも優れたパフォーマンスを発揮します。

BERT (Bidirectional Encoder Representations from Transformer、2018) は、Transformer を使用して自然言語処理のための完全なモデル フレームワークを構築します。さまざまな自然言語処理タスクにおいて既存のモデルよりも優れたパフォーマンスを発揮します。
それ以来、モデルのサイズは増加し続け、ここ 2 年間で GPT-3、InstructGPT、ChatGPT などの大きなモデルが多数登場し、コストも指数関数的に増加しました。
今日の言語モデルには、大規模なモデル、大規模なデータ、および大規模な計算能力という 3 つの特徴があります。上のプロットでは、モデル パラメーターの数がいかに急速に増加するかがわかります。言語モデルのムーアの法則(1 年で 10 倍)を提案する人もいます。新しくリリースされた ChatGPT モデルには 1,750 億個のパラメーターがあり、その後の GPT-4 にどれだけのパラメーターがあるのかを想像するのは困難です。
ChatGPT の利点:
HFRL (Human Feedback RL、2022.03) テクノロジーを導入し、トレーニング データセットに人間のフィードバックを追加し、人間のフィードバックに基づいて最適化しますが、多数の人間によるアノテーションが必要になるため、コストはさらに増大します。
2 番目のポイントは、質問に答える際にモデルには独自の原則があるということです。以前のチャットボットは、ユーザーとのチャット中に否定的でデリケートな内容を学習し、最終的には悪用したり差別的な発言をしたりすることを学習しました。以前のモデルとは異なり、ChatGPT は悪意のあるメッセージを識別し、応答を拒否できます。
メモリ: ChatGPT は継続的な対話をサポートしており、ユーザーとの以前の会話の内容を記憶できるため、複数ラウンドの対話の後、ユーザーは答えが常に改善されていることに気づくでしょう。
Link:https://new.qq.com/rain/a/20221121 A 04 ZNE 00
パート III: AIGC の産業応用
2022年の七事荘潭秋季キャンプに参加する55社のうち、AIをテーマとする企業が19社、メタバースをテーマとする企業が15社、大規模モデルをテーマとする企業が16社ある。 AIGC に関連するプロジェクトは 10 件以上あり、その半数以上が画像関連です。各プロジェクトの詳細は以下のリンクに添付されています。
AIGC の最も人気のある細分分野は画像分野であり、安定拡散の業界適用のおかげで、画像 AIGC は 2022 年に爆発的な成長を遂げるでしょう。具体的には、画像 AIGC トラックには次の利点があります。
CV分野は自然言語処理の大規模モデルに比べてモデルサイズが比較的小さく、Web3との適合度が高く、NFTやメタバースとの密接な連携が可能です。
写真はより興味深く、多様性があり、この部分のテクノロジーは現在成熟しており、急速に改良されています。
普及モデル

2022年の七事荘潭秋季キャンプに参加する55社のうち、AIをテーマとする企業が19社、メタバースをテーマとする企業が15社、大規模モデルをテーマとする企業が16社ある。 AIGC に関連するプロジェクトは 10 件以上あり、その半数以上が画像関連です。各プロジェクトの詳細は以下のリンクに添付されています。
普及モデル
2022 CVPR 論文「潜在拡散モデルによる高解像度画像合成」
画像にノイズを追加すると、拡散モデルがノイズを除去する方法を学習しながら、画像をランダムなノイズの多い画像に変えることができます。次に、モデルはこのノイズ除去プロセスをランダムなノイズのある画像に適用し、リアルな画像を生成します。
現在のイメージ AIGC フィールドには、特に次のようないくつかの制限もあります。
モデルは効果と効率の間でトレードオフを行う必要がありますが、ユーザーが第 2 レベルで期待する正確でカスタマイズされた効果を生成することは依然として困難です。
これらの企業は運用コストと保守コストが高く、モデルを駆動するために大量のグラフィックス カード機器を必要とします。
このトラックには最近、多くのスタートアップが参入しており、競争は激しいものの、キラーアプリは不足している。
次に、3D-AIGC について説明します。これは大きな可能性を秘めたトラックであり、現在のモデルはまだ成熟していませんが、将来的にはメタバースに必要なインフラとなるでしょう。
2D 画像の生成と同様に、3D-AIGC プロジェクトは 3D オブジェクトを生成し、3D シーンを自動的にレンダリングして構築することもできます。将来的にメタバースが普及すると、仮想3桁資産の需要が大きくなるでしょう。ユーザーが 3 次元のシーンにいる場合、ユーザーが必要とするのは 2 次元の画像ではなく、3 次元のオブジェクトとシーンです。

3D で仮想アセットを生成するには、2D 画像を生成する場合よりも多くの考慮事項が必要です。 3次元の仮想物体は2つの部分から構成されており、1つは立体的な形状、もう1つはテクスチャと呼ばれる物体の表面の模様や模様です。
したがって、モデルは 3D 仮想アセットを選択する必要があり、2 つのステップで生成できます。 3D オブジェクトのジオメトリを取得した後、テクスチャ マッピング、環境マッピング、その他の方法で表面テクスチャを与えることができます。
三次元物体の幾何学的形状を記述する際には、グリッドや点群などの明示的な表現だけでなく、代数やNeRF(Neural Radiation Field)などの暗黙的な表現も含め、さまざまな表現を考慮する必要があります。具体的には、モデルを適応させる方法を選択する必要があります。
つまり、最終的にはこれらすべてのプロセスを統合して、テキストから 3D 画像までのプロセス パイプラインを形成する必要がありますが、パイプラインは比較的長く、成熟したアプリケーション側モデルはまだありません。しかし、拡散モデルの人気により、多くの研究者が 3D 画像生成技術をさらに研究するようになるでしょう。現在、この方向の技術モデルも急速に反復されています。
VR、XR、および人と対話する必要があり、リアルタイムのパフォーマンスに対する厳しい要件があるその他のテクノロジーと比較します。 3D AIGC のリアルタイム要件は低くなり、アプリケーションのしきい値と速度は速くなります。
パート 4: AIGC と Web3
AIGC は web3.0 時代の生産性ツールであると言われており、AIGC は大きな生産性を提供しますが、web3.0 とブロックチェーンの適用は生産とユーザー主権の関係を決定します。
しかし、AIGC と Web3 は 2 つの異なる方向であることを認識する必要があります。 AIGCはAI技術を活用した制作ツールとして、Web2の世界でもWeb3の世界でも適用可能です。これまでに開発されたプロジェクトのほとんどは依然として Web2 分野にあります。この二人について一緒に話すのは不適切だ。そしてWeb3は、ブロックチェーンとスマートコントラクト技術を利用して、ユーザーが仮想資産の主権を持てるようにしたいと考えている。これと作成モードの間には直接的な関係はありません。
しかし、実際にはこの 2 つの間には多くの類似点があります。
一方で、それらはすべて、既存の制作およびオーサリング モデルを最適化するプログラムに依存しています。 AIGC は創造のために人間を AI に置き換え、Web3 は人工の集中型機関をスマートコントラクトやブロックチェーンなどの分散型プログラムに置き換えます。人間の代わりに機械を使用すると、主観的なエラーや逸脱がなくなり、効率が大幅に向上します。
一方、Web3 とメタバースでは、2 次元の画像と音声、3 次元の仮想オブジェクトとシーンに対する大きな需要があり、AIGC はそれらに応える良い方法です。
しかし、Web3.0 の概念が一般に普及していない場合、新興プロジェクトはほぼ Web2 プロジェクトであり、Web3 分野のアプリケーションは依然としてほとんどが画像生成用の AIGC 上にあることがわかります。 NFT作成用。
実際、アプリケーション側では、AIGC と web3.0 の関係は、「生産性」と「生産関係」の間の関係だけに依存することはできません。これは、AIGC は web2 プロジェクトにも生産性の向上をもたらすことができる一方で、web3 プロジェクトの利点は次のとおりであるためです。明らかではない。

したがって、AIGC 開発のチャンスをつかむためには、現在の web3 プロジェクトを次の 2 つの側面で最適化する必要があると考えています。
1 つは、AIGC がサポートするネイティブ Web3.0 プロジェクト、つまり Web3 側でのみ適用できるプロジェクトを探すことです。言い換えれば、AIGC を使用して Web3 プロジェクトが直面している現在のジレンマを解決する方法を考えると、そのようなソリューションも Web3 にネイティブです。たとえば、ReadOn は AIGC を使用して記事クイズを生成し、Proof of Read の新しいモデルを開き、ReadFi に常に存在していたコインのブラッシングの問題を解決し、実際に読んだユーザーにトークン報酬を提供します。難しいことですが、Web3 にはこのようなモデルの革新が必要です。
2 つ目は、AIGC を使用して既存の Web3 アプリケーションの効率とユーザー エクスペリエンスを最適化することです。現在、AIGC のアプリケーションは主に画像と NFT に存在しますが、実際には、作成は非常に広い概念であり、画像以外にも作成方法は数多くあります。前述の3D-AIGCはメタバースで考えられる応用チャネルであり、クイズ生成も現時点で光るアイデアである。 eduDAO と開発者プラットフォームは、質問の設定やモジュラー コードの変更、単体テストの生成など、教育を強化するために AIGC を使用することを検討できます。GameFi は、AIGC をゲーム内の NPC として使用できるかどうか、さらには AIGC を使用できるかどうかを検討できます。 AIGC スマート コントラクトを生成するコーディング機能。
ビデオリンク: https://www.bilibili.com/video/BV17D4y1p7EY/spm_id_from=333.999.0.0

ありがとう:
分散型メディアおよび研究組織である DAOrayaki は、THUBADAO に公的資金を提供して、独立した研究を実施し、結果を公に共有しました。研究テーマは主にWeb3、DAOおよびその他の関連分野に焦点を当てています。この記事は、資金調達結果の共有の 6 回目です。
DAOrayaki は、完全に機能する分散型メディア プラットフォームであり、コミュニティの意志を代表する研究組織です。クリエイター、資金提供者、読者を結び付け、報奨金、助成金、予測市場などの複数のガバナンス ツールを提供し、コミュニティがさまざまなトピックについて自由にリサーチ、キュレーション、レポートを行うことを奨励することを目的としています。
DAOrayaki & THUBADAO|Web 3.0時代のメディア:オンチェーンメディアプラットフォーム、オンチェーンセルフメディア、メディアDAO


