AI活用でスループットとレビュー負荷が2倍に ── 活用の効果と課題

supateam プロダクト責任者の若月です。

「AIにいくら使って、スループットがどれくらい上がっているのか?」

AIコーディングツールの全社導入が進む中、多くの組織で同じ問いが出てきているのではないでしょうか。

今回は、社内の約15名を対象にClaude CodeのOpenTelemetryログとGitHubのPRデータ、各AIプロバイダのコスト情報を突合し、AIコストとスループットの相関、そしてPRの品質への影響を分析しました。

※ 今回扱うデータにはユーザープロンプトの内容は一切含まれていません。プライバシーを保ったまま活用度だけを計測できる仕組みになっています。


1. AIの利用メトリクス(OpenTelemetry・Cursor)とGitHubデータからわかったこと

AIの積極的活用によってスループットが向上

6ヶ月間のAIのヘビーユーザー(コスト上位)のアウトプットを追うと、 AIコストとコード上のスループットに相関があり、特にPR数に大きな差がありました。

上位メンバーにおいては、プロダクトの成熟期にも関わらずエージェントモードの活用・習熟によってPRサイズは変わらずPR作成数が2倍に増加しており、AIの使い方や習熟度がスループットに影響を与えることも分かりました。

1-2. スループットが増えた結果、組織のレビュー負荷が上がっている

スループット(PR数・変更行数)の増加に伴って、PRあたりの平均レビュー回数が1.0回(2025年4月)→3.2回(2026年2月)に増加していました。

内訳を見ると、人間のレビュー回数は0.96→1.92で約2倍。残りの増分はAIレビュー(botによるコメント)で、2026年2月にはAIのレビュー回数が人間に匹敵する水準に達しています。

スループットが上がった分、レビュー側の負荷が増えており、AIが作成したPRの品質向上や、認知負荷の低減がチームのスループットを阻む要因となっている可能性があります。


2. Claude Codeの分析手法(2026年4月現在)

2-1. Claude Teamプランのコスト・トークン数を分析する

2026年4月現在、Claude Teamプランにはダッシュボードや利用分析APIが提供されていません。「誰がどれだけ使っているか」を把握するには、Claude CodeのOpenTelemetry(OTel)エクスポート機能を利用する必要があります。

主に取得できるデータは以下の通りです。

メトリクス(時系列データ)

  • claude_code.cost.usage ── APIコスト(モデル別)
  • claude_code.tokens.usage ── トークン数(input/output/cache_read/cache_creation)
  • claude_code.lines_of_code.count ── AI生成行数(added/removed)
  • claude_code.active_time.total ── アクティブ時間(cli/user)
  • claude_code.code_edit_tool.decision ── コード編集の採用/却下

ログ(イベントデータ) - セッションID、ユーザーメール、ツール呼び出し(Read/Edit/Agent/WebSearch等)、プロンプトイベント

これらを組み合わせることで、メンバー別のコスト、トークン消費量、AI生成行数、ツール利用パターンが可視化できます。

2-2. supateam MCPでの分析環境セットアップ

supateamでは、OTelデータをDuckDBに蓄積し、MCP経由で自然言語クエリを実行できます。 またCursorの利用データ分析もAdmin APIキーを設定するだけで可能となります。

claude mcp add supateam-mcp-server -s local -- \
    npx mcp-remote https://api.supateam.com/public/v1/mcp \
    --header "Authorization: Bearer sk-..."

呼び方の例

# ユーザー別の月間AIコストを出す
> supateam MCPで、3月のユーザー別AIコストを集計して

# マージ済みPRを検索する
> 3月にマージされたPRを、botを除外して一覧で出して

# AIコストとスループットを突合する
> 3月のAIコストとPR数・変更行数を突合して、ユーザーごとに比較して

MCPを通じて自然言語で依頼するだけで、OTelへのDuckDBクエリとGitHub PR検索が実行され、突合分析が返ってきます。


まとめ

OpenTelemetryとGitHubのPRデータを突合することで、「AIにいくら使って何が起きているか」を定量的に把握できるようになりました。

また今回はあくまでスループットを計測したものであり、コード負債や変更のビジネスインパクトを考慮したものではないため、定性的なヒアリングや各チームの文脈の重要性も改めて感じました。


supateamについて

supateam.com

supateamは、AI時代の開発組織を支援する開発生産性プラットフォームです。

本記事で紹介した分析は、supateam MCPのOpenTelemetry/GitHub分析機能を使って実施しました。MCPを活用することによって、Claude Code OpenTelemetryデータの蓄積・可視化、GitHub PRデータとの突合分析を、コードを書くことなく自然言語で実行することができます。

変更のリードタイム・PRの平均レビュー数・変更障害率といったFour Keys指標に加え、AIコーディングツールの活用状況やPRあたりのAIコストを定点観測するためのダッシュボードとしてご活用いただけます。