公開したページがいつまでもインデックスされない。または、公開する予定ではなかったページを過って検索結果に表示(インデックス)させてしまったなんてことはありませんか?
このページでは、サーチコンソールを使用して、自サイトのページがインデックスされているか確認する方法と、検索結果に表示(インデックス)されているページを除外する方法を紹介します。
インデックスを一覧で確認できる機能「インデックスカバレッジレポート」
サーチコンソールの機能のひとつであるインデックスカバレッジレポートを使用すると現在、自サイトのページが検索結果にどのように反映されているのかを確認できます。意図せずにインデックス対象外になっているページやインデックスに登録されていないページと理由がわかるので、必要であればすぐに対処しましょう。
インデックスカバレッジレポートはサーチコンソール画面の左メニュー「カバレッジ」をクリックすると確認できます。この機能で表示されるページのステータスは以下の4種類です。
- 除外
- エラー
- 有効
- 有効(警告あり)
カバレッジレポートで確認したい項目はエラーと除外です。この2つの項目の確認を行い、インデックスさせるさせないをはっきりさせて、サイト内ページが検索エンジンに正しく認識されるように修正することでサイトの質をより高めることができます。
1. 除外
サーバーエラーやnoindexタグが設置されているといった理由で、インデックスされていないページが除外と表示されます。除外される主な理由をいくつか紹介します。
1-1. noindexタグによって除外されました
noindexタグが設置されていることにより、ページがインデックスされていない場合の理由です。意図的にサイト運営者がnoindexタグを設置している場合は問題ないので、何も対処する必要はありません。
1-2. robots.txtによりブロックされました
robots.txtに含まれているページが該当します。noindexタグと同じく意図して含まれている場合は問題ありませんが、robots.txtにページを含んでいてもインデックスされることがありえるので、インデックスさせたくない場合はnoindexタグを設置することを推奨します。
1-3. 検出 – インデックス未登録
サイトマップや内部リンクによってクローラーがページを検出したが、インデックスが未登録の状態のページが該当します。この原因として、コンテンツの品質に問題がある、またはクロールするページ数が多いため、クロールバジェットの枯渇が考えられます。
コンテンツの品質をより高めることとクロールすべきページを減らすことで対処できます。
1-4. クロール済み – インデックス未登録
検索エンジンにクロールされたものの重要なページではないと判断した場合にインデックスされることがあります。この理由はECサイトに頻発する傾向にあり、ページが多い、または重複するコンテンツが多いために起こります。
重複のチェックは: https://seoauv.com/how-to-check-for-duplicate-content/
コンテンツの品質を高めることで、検索エンジンのクロール頻度を高めることで対処できます。
1-5. 重複しています。送信された URL が正規 URL として選択されていません
サイトマップに含まれていますが、検索エンジンに重複コンテンツだと判断されて、別ページがインデックスされているページが該当します。
この場合、別ページが正規ページとして検索エンジンに認識されている状態なので、canonicalタグを設置してURLを統一化する、もしくはサイトマップに記載しているページが誤っていないかを確認してください。
この他にも様々なインデックスから除外される理由があります。意図的に除外する場合は問題ありませんが、インデックスさせたいページが除外となっている場合は、理由を確認して早急に対処するようにしましょう。
2. エラー
エラーが表示されているページは現在、インデックスに登録されていない状態です。インデックスされない理由も確認することが出来るので、もし意図してインデックスさせていないのであれば対処してください。
3. 有効(警告あり)
インデックスされていますが、サイト運営者が意図していない場合があります。ですから「有効(警告あり)」となっている場合は、該当するページを確認してインデックスするべきページなのか確認する必要があります。
4. 有効
有効と表示されているページは、問題なくインデックスされているページです。
ページを削除しても検索結果から消えません
Googleなど検索エンジンは、インターネット上の情報を検索インデックスに保存します。検索エンジンのロボットであるクローラーがサイトを巡回することで、最新情報がインデックスに保存されることになります。
ですから、ページが存在しない場合は、クローラーが上書きするための最新情報を取得することが出来ないので、検索結果に表示されているページはそのままの状態で表示され続けることになります。
検索結果から完全に除外するためには、サイト内でページを削除するだけではなく、検索エンジンにたいして削除申請を行う必要があります。
ページを検索結果から除外するための手順
実際に検索結果に表示されているページを除外する手順を紹介します。
ステップ1. 表示されているページの確認
まずは、サイト内のどのページが表示しているのかを確認しましょう。
ステップ2. サーチコンソールから削除申請
Googleが無料で提供している分析ツールサーチコンソールを使って、検索結果に表示しているページを削除してもらうように申請をしましょう。
- サーチコンソールにログインすると左のサイドバーに削除と書かれているのでクリック
- 削除したいページのURLを入力して、「新しいリクエスト」をクリック
- 「このURLのみを削除」または「このプレフィックスで始まるURLをすべて削除」を選択
「このURLのみを削除」の場合は、wwwの有無やhttp(s)が同時に削除されますが、パラメータ違いのURLについては別URLとして扱われるので削除されません。
削除したい場合は、個別でパラメータを含むURLを指定する必要があります。
「このプレフィックスで始まるURLをすべて削除」は、サイト全体とディレクトリ全体、そしてパラメータ違いのURLを含めて削除申請する場合に選択します。
URLの入力欄を空白にした場合は、サイト全体の削除申請することができます。
一時的に削除とキャッシュされたURLを消去の違いは?
「URLを一時的に削除する」は、Googleが削除申請を承認してから約半年の間は検索エンジンの検索結果で申請したURLが非表示となります。
「キャッシュされたURLを消去する」は、検索エンジンが再度クロールを行うまで、スニペット(説明文)とキャッシュが検索結果から消去され、URLは残ります。誤った情報を発信してしまい。検索結果に表示されている情報を早急に新しくしたい場合に役に立ちます。
まとめ
サーチコンソールで自サイトのページが検索エンジンにどのように反映されているかを確認する方法と、意図せずインデックスされているページを除外する方法をお伝えしました。
インデックスされているかされていないかは1か月に一度確認することをおすすめします。
サイト状態をより良いものに整えることで、検索エンジンに評価され検索上位に表示されやすくなる可能性が高まります。インデックス状況を確認する癖をつけましょう!