ホームやさしいIT研究室

XML Sitemaps Generat...

XML Sitemaps Generatorでサイト構成を把握する

はじめに


世の中に公開されているサイトの中には、そもそもサイトマップが配置されていなかったり、かなり古いまま放置されているケースも珍しくありません。

例えば、クライアントからサイトの改修を依頼された際には、現状のサイト構成を確認したいものです。
しかし、最新のサイトマップが用意されていないと、構成の把握に時間がかかってしまいます。

そこで今回は、こうした悩みを解決してくれる便利なツール「XML Sitemaps Generator」をご紹介します。
すでにご存知の方も多いかもしれませんが、ぜひ参考にしてみてください。

サイトマップとは何か


サイトマップは、「本の目次」と同じ役割です。
そのサイトの中にどのようなページがあり、どんな構成になっているかをまとめた情報を指します。

サイトマップとは何か

サイトマップには、主に2種類あります。
細かい部分では違いもありますが、「サイトの構成を把握する情報」という意味では同じです。

XMLサイトマップ

検索エンジンのクローラー向け

HTMLサイトマップ

サイトの訪問者向け

検索エンジン向けのXMLサイトマップは、たとえば

https://サイトのトップページ/sitemap.xml

のような場所に設置されていることが多いです。

通常、特別な事情がなければ誰でも閲覧できますが、外部からアクセスできないよう制限されている場合もあります。

また、WixやWordPressといったメジャーなCMSを使っている場合は、サイトマップも自動生成され、常に最新の状態が保たれます
一方、スクラッチで作成したサイトの場合、手動でサイトマップを更新しない限り、情報が古いままになることもあります。

XML Sitemaps Generatorとは


XML Sitemaps Generatorは、その名の通り、指定したURLからサイトマップを自動生成してくれる便利なツールです。

自社サイトはもちろん、他社サイトであってもURLを入力すればサイトマップを作成できます。

ただし、他社サイトのサイトマップ生成は、相手方のサイト運営者に迷惑をかける場合があります。
個人で利用するだけなら問題になりにくいですが、生成した情報を公開したり第三者に提供する場合は、相手方が不快な想いをしないよう節度を持って活用しましょう。

XML Sitemaps Generatorの使い方


以下が主な使い方の手順です。

  1. XML Sitemaps Generatorのサイトにアクセスする

  2. サイトマップを生成したいサイトのURLを入力し、「START」ボタンを押す

  3. 「DOWNLOAD ALL SITEMAPS IN A ZIP FILE」ボタンからサイトマップをダウンロードする

XML Sitemaps Generatorの使い方

使い方はとてもシンプルで、ボタンを押してファイルをダウンロードするだけなので、特別な操作は一切必要ありません。

XML Sitemaps Generatorからダウンロードできるファイル


ダウンロードした「sitemaps.zip」を解凍すると、いくつかのファイルが格納されています。

XML Sitemaps Generatorからダウンロードできるファイル

中でも重要なのは、以下のファイルです。

  • sitemap.xml(XMLサイトマップ)

  • sitemap.html(HTMLサイトマップ)

  • urllist.txt(テキストベースのURL一覧)

これらのファイルを活用することで、サイトの構成やページ一覧を簡単に把握できます。

スプレッドシートを使って簡易的な関係図を作る


基本的にはHTMLサイトマップだけでもサイト全体の構成をある程度把握できますが、一度ご自身の手で資料化してみることで、より理解が深まります

まずは、urllist.txtのURL一覧をスプレッドシートに貼り付け、SPLIT関数で「/」ごとに区切ります。

=SPLIT(対象セル, "/")

次に、分割されたデータをCOUNTA関数でカウントし、各URLの階層を求めます。
このとき、SPLIT関数で区切った結果に出てくる「https:」の列は、不要なので削除して構いません。

=COUNTA(対象範囲)

ここまでできたら、列や行を自分が見やすいように並び替えます。
階層の列を一番左に移動し、階層順でソートすると構造が分かりやすくなります。

最後に、まとめた表をもとに、実際のサイトと照らし合わせながらGoogleスライドなどで図解すれば完成です。

階層が浅いページから順番に図にしていけば、スムーズにサイト構成を可視化できます。

さいごに


重要度の高いページは大抵取得できますが、サイトの階層が複雑すぎる場合などは、XML Sitemaps Generatorでもページを拾いきれないことがあります。

そのため、今回ご紹介した方法はサイトのおおまかな構成を把握するのには有効ですが、サイト全体を完全に再現することはできません。

また、前述の通り、他社サイトのサイトマップを生成する際は、節度を持った利用を心がけてください

参考サイト