性能基准测试与回归检测

v20260517

benchmark

该工具用于建立多维度的性能基准线。它能够测量核心网页指标（如LCP、CLS、INP）、API延迟（p50、p95、p99）以及开发构建效率。在代码合并前，用于检测性能回归，确保持续集成/持续部署流程的稳定性，并对比不同的技术栈替代方案。

性能测试网页性能 API 持续集成开发回归检测

获取技能

242 次下载

概览

ベンチマーク — パフォーマンスベースラインと回帰検出

使用時期

PR前後にパフォーマンスへの影響を測定
プロジェクトのパフォーマンスベースラインを設定
ユーザーが「遅く感じる」と報告したとき
ローンチ前 — パフォーマンスターゲットを満たしていることを確認
スタックを代替案と比較

動作方法

モード1：ページパフォーマンス

ブラウザMCPを介してリアルブラウザメトリクスを測定：

1. 各ターゲットURLに移動
2. Core Web Vitalsを測定：
   - LCP (Largest Contentful Paint) — ターゲット < 2.5s
   - CLS (Cumulative Layout Shift) — ターゲット < 0.1
   - INP (Interaction to Next Paint) — ターゲット < 200ms
   - FCP (First Contentful Paint) — ターゲット < 1.8s
   - TTFB (Time to First Byte) — ターゲット < 800ms
3. リソースサイズを測定：
   - 合計ページウェイト（ターゲット < 1MB）
   - JSバンドルサイズ（ターゲット < 200KBgzipped）
   - CSSサイズ
   - 画像ウェイト
   - サードパーティスクリプトウェイト
4. ネットワークリクエストをカウント
5. レンダリングブロッキングリソースをチェック

モード2：APIパフォーマンス

APIエンドポイントをベンチマーク：

1. 各エンドポイントに100回ヒット
2. 測定：p50、p95、p99レイテンシ
3. トラック：レスポンスサイズ、ステータスコード
4. ロード下でテスト：10個の同時リクエスト
5. SLAターゲットと比較

モード3：ビルドパフォーマンス

開発フィードバックループを測定：

1. コールドビルド時間
2. ホットリロード時間（HMR）
3. テストスイート期間
4. TypeScriptチェック時間
5. Lint時間
6. Dockerビルド時間

モード4：前後の比較

変更前後に実行して影響を測定：

/benchmark baseline    # 現在のメトリクスを保存
# ... 変更を加える ...
/benchmark compare     # ベースラインと比較

出力：

| Metric | Before | After | Delta | Verdict |
|--------|--------|-------|-------|---------|
| LCP | 1.2s | 1.4s | +200ms | WARNING: WARN |
| Bundle | 180KB | 175KB | -5KB | ✓ BETTER |
| Build | 12s | 14s | +2s | WARNING: WARN |

出力

.ecc/benchmarks/にJSONとしてベースラインを保存。Gitで追跡されるため、チームはベースラインを共有します。

統合

CI：すべてのPRで/benchmark compareを実行
/canary-watchとペアリングしてデプロイ後の監視
/browser-qaとペアリングして完全な出荷前チェックリスト

信息

Category 编程开发

Name benchmark

版本 v20260517

大小 2.94KB

Source affaan-m/everything-claude-code

更新时间 2026-05-18