XML sitemapのPing送信が実は役立たずではなかった話

もしも・・・子サイトマップのURLでPingしたら

XML sitemapとは、ウェブサイト内の文章コンテンツのページURLや画像や動画などのコンテンツのURLを検索エンジンに通知するためのファイルです。Ping送信とは、XML sitemapファイルを更新したことを検索エンジンに伝えるための手法です。これらはウェブサイト運営者が検索エンジン最適化(SEO)を行う際に重要な役割を果たすと言われています。

しかし、XML sitemapのPing送信が本当に効果的なのか疑問視する声もあります。 特に親子型のXML sitemapをPing送信してもコンテンツページが記載されている子XML sitemapがクロールされない問題は多くのウェブサイトのオーナーが気付いています。そこで、このPing送信の問題について実際に試してみることにしました。

実験方法 1

今回、このサイト「がとらぼ(inta.net)」で実験しました。このウェブサイトではWordPressというCMS (コンテンツ管理システム)を使用しており、「Google XML Sitemaps」というプラグインでXML sitemapファイルを生成しています。

このプラグインでは、「通知」設定で各種検索エンジンへPing送信するかどうか選択できます。私はこの設定をオフ(Ping送信しない)からオン(Ping送信する)へ変更しました。オンにすると、このプラグインは記事の公開/更新時や定期時にXML sitemapのサイトマップインデックス (親XML sitemap)をGoogleにPing送信します。

そして、WordPressで新しい記事を公開(更新)してプラグインによる自動Ping送信を行いました。Google Search ConsoleというGoogleが提供するオンラインツールでは、XML sitemapファイルの状態や最新の読み込み日時、エラーなどを確認することができます。

この実験では、Ping送信することでGoogle検索エンジンが親XML sitemapファイルと子XML sitemapを早くクロールしようとするかクロールしないのかを検証します。
以上が実験方法です。

実験結果 1

実験は2022年12月1日から2022年12月31日までの31日間行いました。その間に「がとらぼ(inta.net)」では6件の新規記事を投稿しました。Ping送信から1時間以内にXML sitemapがクロールされたことをGoogle Search Consoleの最終読み込み日時で確認しました。
実験結果は以下の表にまとめました。

記事投稿日時親sitemap子sitemap
112月1日更新あり更新無し
212月6日更新あり更新無し
312月13日更新あり更新無し
412月18日更新あり更新無し
512月19日更新あり更新無し
612月31日更新あり更新無し

表を見ると、サイトマップインデックスをPing送信することによってサイトマップインデックス(親XML sitemap)は即時から数分以内にクロールされるものの子XMLサイトマップはクロールされないことが判ります。
なお、子XML sitemapがクロールされて最終読み込み日時が更新されるまでに何日もかかりますが、次の新しい投稿までに更新されないため実際に何日かかるかを調べることはできませんでした。
また、Ping送信しなかった期間にはSearch Consoleの「読み込まれたサイトマップ」でサイトマップインデックスの最終読み込み日時が更新されませんでした。

実験結果に基づく結論 1

実験結果1から、以下のような結論を導くことができます。

  • 通常のXML sitemapのPing送信はサイトマップインデックスを早く認識させる効果がある
  • 通常のXML sitemapのPing送信は子XMLサイトマップを早く認識させる効果はない

子XML sitemapをPing送信する実験

「Googleにサイトマップを送信する」というドキュメント
Google検索セントラルの「サイトマップの作成と送信」という記事によると
https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP
というURLにPing送信すると書かれています。旧Google Webmaster Tools時代は
http://www.google.com/webmasters/sitemaps/ping?sitemap=FULL_URL_OF_SITEMAP
というURLが使われてしました。この古いURLは、WordPressのXMLサイトマップ出力プラグインとしては最もメジャーな(Google) XML Sitemapsプラグインが現在も使用しています。このURLは、応答があるので有効と思われます。

ターミナルやコマンドラインでコマンドを入力してPing送信を行ってみました。

$ curl "https://www.google.com/ping?sitemap=https://intaa.net/wp-sitemap.xml"
<html><meta http-equiv="content-type" content="text/html; charset=UTF-8">
<head><title>Google Webmaster Tools
-
Sitemap Notification Received</title>
<meta name="robots" content="noindex, noodp">
<script src="https://ssl.google-analytics.com/urchin.js" type="text/javascript">
    </script>
<script type="text/javascript">
      _uacct="UA-18009-2";
      _utcp="/webmasters/";
      _uanchor=1;
      urchinTracker();
    </script></head>
<body><h2>Sitemap Notification Received</h2>
<br>
Your Sitemap has been successfully added to our list of Sitemaps to crawl. If this is the first time you are notifying Google about this Sitemap, please add it via  <a href="http://www.google.com/webmasters/tools/">http://www.google.com/webmasters/tools/</a>  so you can track its status. Please note that we do not add all submitted URLs to our index, and we cannot make any predictions or guarantees about when or if they will appear.</body></html>

この例ではサイトマップURLはhttps://intaa.net/wp-sitemap.xml (サイトマップインデックス)にPing送信しています。このような応答を得ることができればPing送信に成功しています。

実験結果 2

実験は2023年1月2日にサイトマップインデックスを除く個別8つの子XML sitemapにPing送信を行いました。Ping送信から3分以内にXML sitemapがクロールされたことをGoogle Search Consoleの最終読み込み日時で確認しました。
実験結果は以下の表にまとめました。

子sitemap最終読み込み日時更新の有無
12023/01/02更新あり
22023/01/02更新あり
32023/01/02更新あり
42023/01/02更新あり
52023/01/02更新あり
62023/01/02更新あり
72023/01/02更新あり
82023/01/02更新あり

表を見ると、子XML sitemapをPing送信することによって即時から3分以内にクロールされることが判ります。
また、子XML sitemapをPing送信することによって、他の子XML sitemapの最終読み込み日時が更新されることはありませんでした。

実験結果に基づく結論 2

実験結果2から、以下のような結論を導くことができます。

  • 子XML sitemapのPing送信は子XML sitemapを素早く認識させる効果がある

Search ConsoleでPing送信したサイトマップを確認
Pingを送信して画像を取得したのは2023年1月2日です。
この「がとらぼ(inta.net)」の子サイトマップは8個ありますが、この画像の取得時点ではその内の3つだけPing送信して3分後にSearch Consoleのサイトマップレポートを表示しました。つまり3つの子XML sitemapの最終読み込み日時が2023/01/02になっています。
最終的には上の実験2のとおり全ての子XML sitemapにPingを行い最終読み込み日時が2023/01/02になったことを確認しています。

まとめ

この記事では、XML sitemapのPing送信によってGoogleがXML sitemapを素早く認識するかどうかを実際に試してみました。

その結果、Ping送信したURLのXML sitemapだけをすぐにクロールして検索エンジンがXML sitemapファイルを早く認識し、Ping送信していないURLのXML sitemapはすぐにはクロールされないことがわかりました。これは親子型のXML sitemapでは部分的にしか素早く認識されないことを意味します。
また、サイトマップインデックスをPing送信した場合にはコンテンツURLを記載した子XML sitemapがクロールされないため、そのPing送信には意味がないことがわかりました。
また、Google Search ConsoleユーザーがPing送信を疑問視している内容とも一致する結論を導くことができました。

したがって、XML sitemapのPing送信を有効なものにするのであれば子XML SitemapのPing送信が欠かせません。
今後、親子型XML sitemap出力ツール(プラグイン)を作成しPing送信機能を実装するなら、公開/更新されたコンテンツURLを含む子サイトマップのURLをPing送信するべきです。

もしあなたがウェブサイト運営者ならば、ぜひ子XML sitemapのPing送信を活用してみてください。