【SEO対策】 ソフト404エラーの概要を知って、対策してみよう!

SEO対策をしている男性 IT関連

先日、GoogleSearchConsoleを使って、「ソフト404エラー」を調査しました。

そして、このブログの影響範囲が広いということが判明しました……!

今回は、そのソフト404エラーについての調査方法から、対策についてご紹介します。

ソフト404エラーとは

404エラーとは、指定されたファイルがない場合にレスポンスで返ってくる「エラーコード」のことです。

ソフト404エラーは、指定されたファイル自体は存在しつつもクローラが「このファイルはないも同然だ」と判断したページのことを指しています。

どういった場合に、ソフト404エラーが検知される?

例えば、以下のような場合が挙げられます。

  • 記事や商品などがない・削除されたページ
  • 該当する記事がないカテゴリ(一覧)ページ
  • 記事の文字数が著しく少ないページ

また、404ページにありがちな「Not Found」「存在しません」「見つかりませんでした」などのような言葉が強調されていると、誤判定の原因となりうるので、注意が必要です!

調査の方法について

Google Search Consoleにて、調査を行いました。

手順は以下の通りです。

  • インデックスカテゴリの「カバレッジ」を選択
  • 「除外」にチェックを入れる

GoogleSearchConsoleのカバレッジ解析画面

「除外」とは

除外になっているページは、クローリングしたけど、インデックスされていないというものです。

こちらは低品質コンテンツである可能性が高いので、何かしらの対策を施す必要があります。

今回はソフト404エラーに焦点を絞っていきます。

GoogleSearchConsoleのソフト404エラーの解析ページ

原因を調査する

なぜソフト404エラーになっているのか調査していきます。

今回の対象は「https://pursue.fun/tech/how-to-file-not-found-ios/feed/」です。

開くと、以下のようなXML形式の変なページが表示されました。見覚えがないです。

RSS用XMLページ

調査したところ、「/feed」というのはRSSリーダー用のフィード情報のようでした。

RSSって何?RSSの仕組みを理解し、RSSリーダー「Feedly」を使ってみよう! | ビジネスとIT活用に役立つ情報(株式会社アーティス)
ホームページの新着情報やブログについている「RSS」という表記や のアイコンを見かけたことはありますか? RSSを理解し、活用することで、興味関心のあるWebサイトの更新情報をタイムリーかつ効率的に取得できるようになりま...

このフィード情報は、Wordpressデフォルトで有効になっています。

使用しないページでも、RSSのフィード内容を公開してしまうことになってしまいます。

これを改善していきましょう。

対応策

いくつかの対応策をご紹介します!

【対策1】 WordPressの設定を変更する

WordPress管理画面を開き、「設定 > 表示設定」を開きます。

そして、デフォルトでは「RSS/Atomフィードで表示する最新の投稿数」が10項目、「フォードの各投稿に含める内容」が全文を表示になっています。

これを、「1件」で、「要約」に設定しなおします。

WordPressでRSSフィードを使用しない場合は機能の無効化推奨
使用しない場合はRSSフィードを無効化 企業サイトを作成する際にWordPressが使用されることがある。 WordPressを使用すれば企業のサイトの内容によっては普通に作成するよりも作成しやすくなるため、WordPr …

経過観察

2021/6/12時点では、以下の通りでした。

  • 「除外」が355件
  • 「クロール済み – インデックス未登録」が164件
    • 一部feedのページも含まれる。

2021/7/4時点では、以下の通りでした。

  • 「除外」が379件
  • 「クロール済み – インデックス未登録」が155件
    • 一部feedのページも含まれる。
  • 「ソフト404」が1件で変わらず。

除外の件数が増えてるのなんで……😢

原因

クローリングが回ってくるのは、半年ほどかかったりする場合があります。

そこで、自分からクローリングして確認してもらう機能がありますので、それを使ってみます。

まず初めに、該当のURLを選択し、「URLを検査」というところをクリックします。

よく見ると「前回のクロール」が数ヶ月前になっていました。そりゃ更新されんわ。

GoogleSearchConsoleでURL検査を行う

しばらく待つと、結果が表示れます。

画面右上の「公開URL をテスト」というボタンをクリックします。

GoogleSearchConsoleの URL検査画面

すると、先ほど設定で noindex になるよう設定を変えたので、「URL は Google に登録できません」と表示されます。これでOKです。

GoogleSearchConsoleのURL検査結果

【対策2】 RSSフィードを配信しないように設定する

そもそもRSSフィード情報を配信しないようにも、修正可能です。

一回試してみました。

RSSフィードの配信を停止してリンクも除去する方法

よくよく調べてみると、Googleとしては、フィードを推奨しているようです。

Best practices for XML sitemaps and RSS/Atom feeds  |  Google Search Central Blog  |  Google for Developers

私は今回はこちらの対応はやめておいて、次の3の対応をしました。

【対策3】 プラグインを利用する

こちらの記事の「フィードページ」を参照ください。

今の私と全く同じ状況を解説されていました。

プラグインの「All in One SEO Pack」を導入して、フィードにnoindexが入るように対策しました。

→ちょっとAll in One SEO PackのUIが異なるので、新しいこちらの記事が参考になります。

こちらの記事を参考に、noindexの確認を行いました。

ぜひご参照ください。

最後に

ブログを運営していると、自分が気づかない間に不要なページまでクローリングされていたり、不要なページと見なされていたりします。

少ない件数であればいいですが、数百件ともなる大量のカバレッジが見つかると、クローリングにも影響を及ぼす可能性があります。

定期的にGoogleSearchConsoleを確認して、改善を施していきましょう!💪

タイトルとURLをコピーしました