Notion製ブログ公開時、Super.soで生成されたsitemap.xmlをSearch Consoleに提出しようとしたところ、「取得できませんでした」というエラー。
Super.so × NotionブログのデメリットとテクニカルSEO面2つの不満 の記事でも言及している、Notion製ブログはXMLサイトマップをSearch Consoleに提出できない、という問題です。
ほとんどの場合、Search ConsoleでのXMLサイトマップ「取得できませんでした・読み込めませんでした」エラーの正体は、「保留中」が本来のステータスであるところが、誤って異なるメッセージのエラーとして表示されてしまっているというもの。Search Console側でのバグのようです。
Sitemap could not be read in new GSC - Google Search Central Community
ただし、robot.txtにDisallow設定でクローラに辿らせない設定をしている場合などは別。Search Consoleライブテスト等で確認しましょう。
以下、状況と調査内容について詳細を書き残しておきます。
目次:
- Search ConsoleでのXMLサイトマップ提出時「取得できませんでした・読み込めませんでした」エラーが発生
- まずはライブテストでサイトマップが本当に読み込み不可かどうかを確認
- Search Console上にあるXMLサイトマップを一旦すべて削除
- Cloudflareのファイアウォールログを確認するも、ブロックされた形式なし
- 「取得できませんでした・読み込めませんでした」メッセージの本来ステータスは「保留中」。Search Console側での表示エラー
- Search Consoleにおける表示バグ。実際のステータスは「保留」
- 解決を急ぐ場合には、Search Consoleのフィードバック機能でGoogleに問い合わせを
- GCPのIndexing API経由で申請すると解消されるかも?
- XMLサイトマップ「取得できませんでした・読み込めませんでした」エラーの発生から3〜4ヶ月程度で「成功」と正常に
- SEO分析やSEO改善施策について、お気軽にご相談ください
Search ConsoleでのXMLサイトマップ提出時「取得できませんでした・読み込めませんでした」エラーが発生
下画像のように、XMLサイトマップを提出したところ、「取得できませんでした」が表示されました。
さらにクリックして詳細を見てみると、「サイトマップが読み込めませんでした」というエラー表示となっています。
ブラウザからアクセスした際にはXML形式でのサイトマップを閲覧することができているので、Search Consoleからの読み取り時に何か起きているのでは、と推察。
まずはライブテストでサイトマップが本当に読み込み不可かどうかを確認
まずは「サイトマップが読み取れない仕様になっていないか?」をSearch Consoleのライブテスト機能を使ってチェックします。
たとえばrobot.txtにサイトマップファイルを辿らせない設定(Disallow)をしていると、GoogleのクローラがXMLサイトマップをたどることができません。
検索パフォーマンス > 上欄のURLでsitemap.xmlファイルのURL > 右上の「公開URLをテスト」
結果は登録の可否詳細が
クロールを許可?: はい(robot.txtなどでブロックされている訳ではない)
ページの取得: 成功
となっており、sitemap.xml側を設置しているホスト側に何か問題があるようでもありませんでした。
Search Console上にあるXMLサイトマップを一旦すべて削除
Search Console上に複数のXMLサイトマップが登録されている場合、他のサイトマップが優先されてしまい後から追加したサイトマップが読み取られない、ということがあるとのこと。
提出済サイトマップを削除するには、サイトマップ詳細画面へ進み、画面右上の三点リーダを選択。
サイトマップの削除、で削除することが可能です。
複数個のサイトマップを提出している方は、一旦すべて削除してから再提出するというステップを試してみてもいいでしょう。
Cloudflareのファイアウォールログを確認するも、ブロックされた形式なし
私はCDNとしてCloudflareを挟む形で公開しています。ライブテストでは確かに成功しているものの、もしかしたらCloudflareのファイアウォールにGoogleのボットが引っかかってしまったのかもしれない、と思いCloudflareを確認しましたが、ログにそのような形跡は検出できませんでした。
Why XML sitemap is not fetch? - General - Cloudflare Community
Cloudflare is blocking sitemap.xml - General - Cloudflare Community
念の為、"Rules"タブからsitemap.xmlドメインのページルールを変更し、「セキュリティをOFF」へとマッチした際の挙動を変更しましたが、「取得できませんでした」エラーに変化はなし。
ここはライブテストで成功しているなら、まずあまり問題にはならないポイントでした。
「取得できませんでした・読み込めませんでした」メッセージの本来ステータスは「保留中」。Search Console側での表示エラー
Search Consoleにおける表示バグ。実際のステータスは「保留」
Google Search Central Community に同様の質問を見つけ、以下の回答を発見。
That the new console says 'couldnt fetch' is a bug in the console. Pending is the real status!
(著者訳)新しいサーチコンソールでの「読み込めませんでした」の表示はサーチコンソール側のバグ。実際の裏側ステータスでは「ペンディング」(保留中)になっていますよ!
Sitemap could not be read in new GSC - Google Search Central Community
ということで、Search Consoleにおける表示バグのようです。
今回は誤ったエラーメッセージが表示されていただけ、ということのようです。直してほしいところ…
How to fix Couldn't fetch sitemap error on Search Console - BetterStudio の記事にも解説がありましたが、ライブテストで「ページの取得: 成功」となっているようなら、上記のように保留中ステータスと判断して良いでしょう。
解決を急ぐ場合には、Search Consoleのフィードバック機能でGoogleに問い合わせを
なお、XMLサイトマップの保留中ステータスは、解決するまでに数週間以上を要することがあります。
どうしても解決を急ぎたい、という方はSearch Consoleのフィードバック機能でGoogleに問い合わせをするというのも一つの手。
GCPのIndexing API経由で申請すると解消されるかも?
サイトマップ以外に早急にサイトの存在と構成、更新ステータスを知らせる方法として、GCPの"Indexing API"なるものがあるようなので、近日中にそちらを試してみたいと思います。
Indexing APIでサイト更新を素早くGoogleに知らせ、インデックスを加速させる!
XMLサイトマップ「取得できませんでした・読み込めませんでした」エラーの発生から3〜4ヶ月程度で「成功」と正常に
(2023/02/06追記)下ツイートのような疑問をいただいたので追記します。
こちらのXMLサイトマップ「取得できませんでした・読み込めませんでした」エラーの発生から3〜4ヶ月程度を経過した頃に、ふと思い出して確認しに行ったところ、正常に「成功」のステータスとなっていました。
上画像でのXMLサイトマップ提出日は、保守システムによって自動的に再提出されるため日付が2023年のものになっています。実際には初回提出した日のおよそ3〜4ヶ月後には、勝手に「成功」へとステータスが変更されていました。
SEO分析やSEO改善施策について、お気軽にご相談ください
SEOコンサルタントとして、アクセス低下の原因分析や改善施策のご提案、また施策の実行までサポートしています。
🍀 Webサイト制作とSEOの専門家 - Marketing Wizard
上リンクには私のプロフィール・実績を掲載しています。
アルゴリズム変更の影響を受けてアクセスが下落したおそれのある方、原因はよく分からないがSEOが上手くいかないという方、SEOに力を入れていきたいがリソースが不足しているという方、ぜひお気軽にご相談くださいませ。
この記事の気になった箇所を読み返す:
- Search ConsoleでのXMLサイトマップ提出時「取得できませんでした・読み込めませんでした」エラーが発生
- まずはライブテストでサイトマップが本当に読み込み不可かどうかを確認
- Search Console上にあるXMLサイトマップを一旦すべて削除
- Cloudflareのファイアウォールログを確認するも、ブロックされた形式なし
- 「取得できませんでした・読み込めませんでした」メッセージの本来ステータスは「保留中」。Search Console側での表示エラー
- Search Consoleにおける表示バグ。実際のステータスは「保留」
- 解決を急ぐ場合には、Search Consoleのフィードバック機能でGoogleに問い合わせを
- GCPのIndexing API経由で申請すると解消されるかも?
- XMLサイトマップ「取得できませんでした・読み込めませんでした」エラーの発生から3〜4ヶ月程度で「成功」と正常に
- SEO分析やSEO改善施策について、お気軽にご相談ください
tag: SEO | Search Console
category: SEO