Deep Dive2026年2月15日Abcas Security Research

人気は低リスクの代わりにならない: 10件のMCPサーバーで見たダウンロード数と判定のズレ

10件のMCPサーバーを見た範囲では、ダウンロード数と検査判定は連動しなかった。人気は普及度のシグナルにはなるが、低リスクの根拠にはならない。

用語

実際の導入判断では、ダウンロード数や GitHub Star が「なんとなく信頼できそう」という近道として使われがちである。「多くの人が使っているなら、重大な問題はもう見つかっているだろう」という発想だ。

本稿で見るのは、もっと実務的な問いである。10件のMCPサーバーを詳細に見ると、人気は本当に判定と連動していたのか。今回のサンプルでは、そうではなかった。重要なのは「人気が無意味」という話ではなく、人気はリスク判断の代わりにはならないという点である。

サンプル内の人気の差は大きかった。

対応する検査判定は以下だった。

ここで重要なのは、人気順と判定順がきれいに並ばなかったことである。

観測された具体例:

この時点で、「人気ならすでに十分に検証されているだろう」という近道は、運用判断の根拠として弱い。

ダウンロード数が答えるのは「どれだけ多くインストールされたか」であって、次の問いではない。

普及と検証は別の情報である。

通常のライブラリは、既存のアプリ権限の中で実行されることが多い。MCPサーバーは違う。AIエージェントに対してツールや実行時操作を露出するため、信頼判断を誤ると、そのままファイル操作、外部通信、コマンド実行に結びつきやすい。

だから、仮に従来のパッケージエコシステムで人気が弱い安心材料になっていたとしても、MCPではさらに弱い。

広く使われているパッケージは、侵害できれば影響範囲が大きい。攻撃者にとっては、ニッチなツールより投資対効果が高い場合がある。

この意味で、人気は「安全ラベル」どころか、攻撃対象としての価値の一部でもある。

ダウンロード数の代わりに、導入前に確認すべきなのは次のような根拠である。

これらは人気指標ではなく、導入リスクに直接つながる材料である。

本稿は、母集団全体で「人気とリスクは絶対に無関係だ」と証明するものではない。サンプルは10件であり、その主張には小さい。

本稿が支えるのは、もっと狭くて実務的な結論である。

これだけでも運用判断としては十分に強い。

今回の10件のMCPサーバーでは、ダウンロード数は低リスクの信頼できる代理指標にはならなかった。人気が説明していたのは普及度であって、検査結果ではない。

実務上、最初に問うべきは「どれだけ人気か」ではなく「何の根拠があるか」である。出所、実動作、過去の検査履歴、依存関係、機能構成。導入判断を支えるのは、そうした直接根拠である。

MCP Guard は、人気指標ではなく検査根拠に基づいてMCPサーバーを評価する。