クロラボ
SEO

重複コンテンツのチェック方法を紹介!誰でもすぐに実践可能

2021.07.12

検索順位に悪い影響を与える原因の一つである「重複コンテンツ」が自分のWEBサイト内に存在しないかをチェックする方法を紹介します。

重複コンテンツとは?

重複コンテンツとは、ページ内容が完全に一致か主要な部分がほとんど同じコンテンツを指します。自分のサイト内に発生した重複コンテンツはペナルティの対象にはなりませんが、いくつかのネガティブな要素にはなりますし、外部サイトとの重複コンテンツ問題はサイト評価を落とす原因となるので、もし存在するのであれば早急に対応する必要があります。

重複コンテンツのチェック方法

自分のサイトが問題あるかどうか重複コンテンツのチェック方法を紹介します。

1. タイトルやディスクリプションなどの重複確認

Google Search ConsoleのHTMLの改善から重複するタイトルやディスクリプションを確認することができます。完全一致していなくともサイト内に似ているタイトルやディスクリプションが存在する場合は、検索順位やコンテンツ内容をチェックしながら修正することをおすすめします。

2. URLが統一化されていない

URL末尾にindex.htmlや先頭にwwwが存在する場合があるなどURKが統一されていない場合、検索エンジンはそれぞれのURLでそれぞれのページが存在すると認識する恐れがあります。

その場合は、URLの正規化を行う必要があるため、正規化するURLを1つ選択して、canonicalタグを設置するか301リダイレクトを設定しましょう。

3. PC用とスマートフォン用でURLが異なる場合

自分のサイトのページがPC用とスマートフォン用で別々に作成されているにもかかわらず内容が同じ場合は、アノテーション設定をする必要があります。alternateタグとcanonicalタグを使用してURLの最適化を行いましょう。

4. ページ内容の重複確認

ページ内容の重複を確認するなら、重複を調べたい文章を「””」で囲み検索する方法が定番です。一度に入力する文章は30文字以内に抑えるとより正確に重複コンテンツが存在するかを確認することができますよ。

その他にも、重複しているページが存在すれば、重複確認ツール「sujiko.jp」で、類似度を判定することができます。

重複コンテンツが存在するとどんな影響があるのか?

重複コンテンツは自分のサイトと外部サイトに生まれる可能性があります。その際に、重複コンテンツがどのような影響を与えるのか紹介します。

自分のサイト

被リンク効果が分散される

URLが異なった同じ内容のページが複数存在すれば、本来であると1枚のページに集められているはずの被リンクがそれぞれのページに分散されるおそれがあります。

例えば、本来ですと10個の被リンクが1枚のページに貼られるはずだったのに、同じ内容のページが3枚存在した場合、3、3、4のように被リンクが貼られる場合があります。

そうなれば、タグやリダイレクト設定を利用してページ評価を1枚に集約させる取り組みは可能ですが、検索エンジンが正しく処理できなかった場合、本来得られるはずの評価を得られないことになります。

クローリング効率の低下

重複コンテンツが存在する場合、そのすべてがインデックス(検索結果に表示される)訳ではありません。

検索エンジンは、内部リンクや被リンク等の数、そしてSNSや外部サービスでシェアされている点などから1ページを選び、正規URLとしてインデックスさせます。

正規URLに選ばれなかった他のURLは重複コンテンツだと判断されるのでインデックスされることはありません。

Googleの無償で提供している分析ツールSearch Consoleのカバレッジレポートを確認すれば、重複コンテンツだと判断されたページのステータスは「除外」となっていることが確認できます。

重複コンテンツが絶対に存在しないということは極めて稀で、データベース型のサイトやECサイトで重複コンテンツを0にすることは不可能です。

ただし、重複コンテンツが多くなれば、クローラーがサイトを巡回する際に、インデックスさせたページがクローリングされないでいつまでもインデックスされなくなることも考えられるので、できる限り重複コンテンツを発生させないように調整することが重要です。

外部サイト

重複はGoogleの定めるガイドラインで禁止されている

自分のサイト内での重複コンテンツによる検索エンジンからのペナルティの恐れはありませんし、直接的なWEBサイトの評価低下の心配もありません。

ただし、外部サイトとの重複コンテンツ問題は違います。外部サイトからページ内容をコピーするという行為は当然許される行為ではなく、Googleのガイドラインで禁止されています。

完全一致の重複でなくても、若干手を加えただけのような重複元外部サイトと内容が同じであれば、転載しているとなりガイドライン違反で検索エンジンからペナルティを受けることになる可能性は十分にあります。

重複コンテンツのような悪質なコンテンツは、ペナルティの対象となるおそれがありますし、WEBサイトが低品質だと評価される原因にもなりますので絶対にやめてください。

詳しい詳細はこちら

Googleの重複コンテンツについての見解

重複コンテンツ事態のペナルティは存在しない

自分のサイト内での重複コンテンツによる検索順位の低下やサイト評価が低くなるといったペナルティは存在しません。ただし、検索エンジンが重複コンテンツを無視する場合があるので複数の同じ内容のページを作成する意味はありません。

また、外部サイトから複製・転載したコンテンツを自分のサイトで公開することはGoogleのガイドラインで禁止されている行為となるのでペナルティを受けて、インデックスされない、検索順位の低下、サイト評価の低下につながるおそれがあります。

異なる形式であれば内容が同じでも重複と見なされない

例えば、自分のサイトで作成したページ内容とYouTubeで公開した動画内容が重複していたとしても形式が異なるので重複コンテンツとは見なされません。

重複コンテンツが上位表示される場合もある

検索エンジンは稀に複製・転載されたコンテンツをオリジナルコンテンツより上位に表示させることがあります。検索エンジンはどのページが複製・転載されたコンテンツとオリジナルコンテンツは認識できます。

そして、認識した上にオリジナルコンテンツを公開しているサイトの質が全体的に良くない場合、または複製・転載したサイトがオリジナルコンテンツを公開しているサイトより質の良いものの場合は、複製・転載コンテンツが検索結果に表示される可能性があります。

英語で読める方はこちらのページで確認できます。

対処方法

複製・転載されたコンテンツを検索結果に表示させない方法として、コンテンツの品質を考慮する必要があります。ページ内に質の低くない内部リンクと外部リンクを設置してコンテンツを良質に保ちましょう。

また、オリジナルコンテンツが検索結果に表示されない場合、サイトに使用しているドメインを確認する必要があるかもしれません。

非常に稀なケースとなりますが、ドメインが過去にスパム目的で使用されていたり、何らかのペナルティを受けていることがあります。

ドメインがペナルティを受けているかどうかは分析ツールを使用しても確認することができないです。確認するためにはウェイバックマシンで過去のサイト情報を閲覧したり、ドメインのペナルティチェックをする必要があります。

まとめ

サイトを長く運営していれば意図していなくても自分のサイト内に重複コンテンツが生まれてしまうことはあります。その数が多くならないためにも定期的に重複コンテンツが存在するかをチェックすることが重要です。

そして、サイト運営が大変だったとしても、絶対に外部サイトからコンテンツを複製・転載するようなみっともない真似はしないでおきましょう。

関連記事