オープンソース プロジェクトへのコミュニティの参加をどのように評価するか?
副題
なぜコミュニティが重要なのか
オープンソース プロジェクトは、ほとんどの貢献者が最終プロジェクトのコードを作成しない場合でも、基本的にコミュニティからのインプットによって推進されます。多くのオープンソース プロジェクトは少数の開発者によって維持されており、実際にコードを記述してプロジェクトを指導する際には、バグ レポート、製品ロードマップのフィードバック、機能リクエストの送信を通じて、コミュニティが依然としてプロジェクト内で基本的な役割を果たしています。
私たちは、コミュニティがプロジェクトに関する情報を有機的に広め、製品の評判を向上させ、ユーザーのニーズに応じてプロジェクトが確実に成長するように支援することで、オープンソース プロジェクトに最大の価値を提供すると信じています。
副題
どの指標が重要か
コミュニティのような定性的なものの成功を正確に測定することは、特にすべてのさまざまな関係者と関連する指標を考慮すると困難です。
ベッセマーへの投資目標については、コミュニティ ユーザーと寄稿者の数が最も懸念されます。なぜなら、彼らはコミュニティの規模について最も洞察を持っているグループだからです。だからこそ、私たちは Github Stars のような数字にほとんど注意を払わないのですが、この数字は他のバニティ指標と同様、大規模なプレスリリースで急増する傾向があり、継続的なエンゲージメントを反映していないため、ある程度の価値はあります。
ユーザーと寄稿者は、プロジェクトに積極的に関与し、プロジェクトに依存しているグループを表しますが、ほとんどのプロジェクトがユーザーによる遠隔測定に依存していることを考えると、限定的なため、真のアクティブ ユーザーを測定することは困難です。
一方、貢献者はユーザーのほんの一部に過ぎませんが、このグループを測定するのは簡単です。これらのユーザーは、問題コメントの形でフィードバックを提供することに時間を投資したり、場合によってはプロジェクトにコードを貢献したりすることで、プロジェクトにより深く関与する傾向があります。私たちは、プロジェクトの開発能力を測定するために貢献者の数を使用するのではなく、プロジェクトがどの程度採用されているかを示す代理指標として使用します。
副題
最適なエンゲージメントとはどのようなものですか
最大のオープンソース プロジェクト コミュニティについて議論するとき、テクノロジー大手のプロジェクトに触れないわけにはいきません。史上トップ 5 のオープンソース プロジェクトは、Google、Microsoft、Facebook によるものです。これらのプロジェクトは、現代のソフトウェア開発とクラウド インフラストラクチャにおいて基本的な役割を果たしており、それぞれのプロジェクトに毎月 1,000 人を超える貢献者がいる信じられないほど大規模なコミュニティを構築しています。興味深いことに、各プロジェクトは、VSCode (注: オープンソースの無料のクロスプラットフォーム コード エディター、広く使用されている IDE)、Kubernetes (Google エンジンによってオープンソース化されたコンテナ オーケストレーション プログラム) など、それぞれのカテゴリで最も人気のあるテクノロジの 1 つまたは 2 つになっています。 、自動化されたデプロイメント、大規模なスケーラビリティ、アプリケーション コンテナ管理)、および React Native と Flutter(最も人気のある 2 つのクロスプラットフォーム フロントエンド フレームワーク)をサポートします。
ただし、大手テクノロジー企業が支援するプロジェクト (独立したオープンソース プロジェクトとは関連性が低い) を削除し、代わりに関連する商用スタートアップに関連する独立系プロジェクトのトップ 10 に焦点を当てると、グラフの見た目は大きく変わるでしょう。
エンゲージメントの観点から見ると、Moby プロジェクト (Docker の背後にある基礎プロジェクト)、そして最近では Gatsby が、このグラフの他のプロジェクトの平均よりも大幅に高くなっています。表内の残りのプロジェクトの月間平均貢献者数は 200 ~ 600 人であり、これは間違いなくこのカテゴリのトップレベルです。私たちが分析した上位 10,000 プロジェクトのうち、毎月 250 人を超える貢献者がいるプロジェクトは 5% 未満で、6 か月以上継続的に 250 人を超える貢献者がいるプロジェクトはわずか 2% でした。
貢献者の活動を測定することは科学とは程遠いですが、私たちの分析ではいくつかの傾向が見つかりました。
成熟度の変動 - ほとんどのプロジェクトは初期に大きな成長を経験し、コミュニティ活動のピークを過ぎた後、プロジェクトが完全に成熟するにつれて参加は横ばいになります。これを念頭に置いて、エンゲージメントとベンチマークを評価する際には、プロジェクトの経過期間と成熟度を考慮します。
タイプによる違い - 一部のタイプのプロジェクト (例: データベース) は、より大きな開発者チームが貢献できる他のタイプ (例: フロントエンド フレームワーク) に比べて、はるかに少ないコントリビューターを集めます。したがって、プロジェクト間の違いを比較するには、ソフトウェア カテゴリごとにセグメント化してこれらの変数を調整することが重要です。これについては、以下でさらに詳しく説明します。
偏り - 貢献者の活動は最大規模のプロジェクトに大きく偏っています。最大規模のプロジェクトには月あたり 1000 人を超える寄稿者がいることがよくありますが、月あたりの寄稿者が 100 人未満のプロジェクトはほとんどありません。私たちは大規模なプロジェクトに偏っているため、フェーズとタイプに一致する特定のしきい値を満たす新しいプロジェクトに重点を置きます。
また、プロジェクトがどれほどよく組織されているか、新しい貢献者をどの程度歓迎しているか、コミュニティの広さなど、プロジェクトが多数の貢献者を引きつけることができるかどうかに影響を与える可能性があるプロジェクトには、数え切れないほどの微妙な違いがあります。分析の目的で、私たちは最大の要素の 1 つである、プロジェクトの潜在的なユーザーは何人の開発者であるかに焦点を当てます。たとえば、ElasticSearch に専門知識を提供している開発者よりも、Font Awesome のようなフロントエンド プロジェクトに貢献できる開発者の方がはるかに多いことがわかっています。したがって、データベース プロジェクトに予想される貢献者の数は、フロントエンド プロジェクトの数よりも大幅に少なくなります。
上のグラフは、プロジェクトのエンゲージメントの推移を示しており、React Native や Font Awesome などの人気のあるフロントエンド プロジェクトと、ElasticSearch や Apache Spark などの人気のあるデータベースおよび分析エンジンとの規模の違いを示しています。
これは完璧な評価システムには程遠いですが、4 つの主要なテクノロジ タイプ (フロントエンド、バックエンド、devop、データベース) の上位 10 ~ 20 プロジェクトのベンチマーク セットを組み合わせて、プロジェクト タイプの違いを考慮したベンチマーク セットの開発を試みました。 ) ベンチマークは、関連する技術者とプロジェクトを比較するのに役立ちます。上のグラフは、これらの上位プロジェクトにおける毎月の貢献者の関与の範囲を示しています。
分析から導き出された結論は次のとおりです。
このグラフは、さまざまなプロジェクト カテゴリの貢献者数の明らかな違いを示しています。上位のフロントエンド プロジェクトは平均貢献者数が最も多いのに対し、上位のデータベース プロジェクトは平均貢献者数がはるかに低くなります。
私たちはこれらの範囲を使用して、各カテゴリのトップのオープンソース コミュニティがどのように開発されているかについてのコンテキストを提供しますが、これらのベースライン範囲を成功を定義する厳格なルールとは見なしません。
これらのベンチマークをより広く適用できるようにするために、私たちが投資した Cypress や Netdata などの現在のプロジェクトを調べて、今日の関連ベンチマークと比較した人気のあるプロジェクトの結果を理解することができます。
一流のベンチマークは有用なガイドですが、ベンチマーク規模のエンゲージメントを達成するプロジェクトはほとんどありません。率直に言って、ある程度までは、参加者が多ければプロジェクトや企業が商業的に成功するというわけではありません。
一部の新興オープンソース プロジェクトが毎月 100 人を超える貢献者を維持できれば、それらは業界のトップ分野に入るでしょうし、毎月の貢献者の数が 250 人を超えれば、史上最も活発なプロジェクトの成果に近づくことになります。実際、上位 10,000 プロジェクトのうち、毎月 250 人のコントリビューターを 6 か月以上維持しているプロジェクトはわずか 6% です。
副題
ソフトウェアの未来はコミュニティ主導型です
私たちは、ソフトウェア開発がますますコミュニティによって推進される段階にあり、商用ソフトウェアとオープンソース ソフトウェアの間の境界線があいまいになりつつあります。オープンソースはコミュニティに恩恵をもたらすことができるため、より多くの企業がコア テクノロジをオープンソース化することを期待しています。会社との共通の利益を重視し、収益性を達成する方法に焦点を当てます。このような種類の企業に対するベッセマーの投資は増加し続けるため、分析に含めるデータ ソースが増え、メトリクスがさらに改良されるため、オープンソース プロジェクトのメトリクスに関する研究は継続されます。


