Aller au contenu
SEOの基礎

Googleインデックス:クロール、クロールバジェット、ブロック解除

7 min

Googleはページを3段階でインデックスします:発見、クロール、インデックス。クロールバジェットの管理が不適切だと、主要ページがインデックスから漏れます。まずSearch Consoleでカバレッジを確認し、次にクォータを無駄に消費する不要なURLを排除してください。

インデックスされていないページは見えないページです。それでも多くのサイトが、所有者が気づかないままサイレントなインデックス問題を抱えています。これらの障害を診断・解決する方法をご紹介します。

Googleがページを発見・インデックスする方法

Googlebotは既知のページから出発し、リンクをたどって新しいページを発見します。次にコンテンツを読み取り、必要に応じてJavaScriptをレンダリングし、ページをインデックスに転送します。このプロセスには数時間から数週間かかることがあります。

インデックスは保証されません。Googleはページの品質、独自性、サイトの権威に基づいて、どのページをインデックスするか独自に判断します。

クロールバジェット:その定義と重要なケース

クロールバジェットとは、Googlebotが一定期間内にサイト上でクロールを許可するページ数です。サーバーに過負荷をかけないよう制限されています。

1,000ページ未満のサイトの大部分では、クロールバジェットは問題になりません。大規模なECサイト、ファセットがあるサイト、数千の動的URLを生成するプラットフォームでは重要になります。

付加価値の低いページ(フィルター結果、セッションURL、重複コンテンツ)はこのバジェットを無駄にし、優先ページのインデックスを遅らせます。

大規模ECサイトでは、クロールされたURLの20〜60%が、クロールバジェットを不必要に消費する低付加価値のバリアントである可能性があります。

2025〜2026年ECサイトのSEOアーキテクチャに関する業界調査

インデックス問題の診断

Search Consoleの「カバレッジ」レポート(現在は「ページのインデックス登録」)が最初のツールです。インデックス済み、除外済み、エラーのページを、各カテゴリの正確な理由とともに区別します。

URL検査ツールを使用して特定のページをテストしてください:Googleがインデックスされているかどうか、最終クロール日、検出された問題を教えてくれます。

  • 404または5xxエラー:クロール時にページにアクセスできない。
  • robots.txtによるブロック:Googlebotがアクセスを禁止されている。
  • noindexタグの存在:明示的に除外を要求している。
  • 重複ページ:Googleが別の正規URLを選択した。
  • 発見不可能:ページを指す内部リンクがない。

新しいページのインデックス登録を加速する

Search ConsoleのURL検査ツールまたはIndexing API(理論上は求人情報とポッドキャスト向けですが、他のコンテンツにも広く使用されています)経由で新しいURLを送信してください。

最も信頼性の高い方法は、既にインデックスされているページから新しいURLへの内部リンクを構築することです:Googlebotは次のクロール時に自然にそれらを発見します。

FAQ

サイトマップを送信したにもかかわらず、ページがGoogleに表示されないのはなぜですか?

サイトマップはGoogleにページの存在を知らせますが、インデックス登録を強制するものではありません。Googleはインデックス前に品質、独自性、関連性を評価します。noindexが存在しないこと、ページが実質的なコンテンツを提供していることを確認してください。

robots.txtでブロックされたページは検索結果に表示されますか?

はい、他のサイトがそのページへのリンクを持っている場合は可能です。GoogleはクロールができなかったままでもそのページのURLを表示することがあり、その場合は抜粋が表示されません。ページを完全に除外するには、robots.txtとnoindexタグを組み合わせるか、noindexのみを使用してください。

公開からインデックス登録までの通常の期間はどのくらいですか?

確立されたサイトでは、ホームページからリンクされているページは数時間から48時間かかります。新しいサイトや孤立したページの場合、数週間かかることがあります。