アーカイブをnoindexすべきか問題
http://notnil-creative.com/blog/archives/2675
WordPressのアーカイブに<meta name="robots" content="noindex">タグをつけるべきかどうか?という話題がありまして、こちらの記事に巻き込まれています。 【改訂版】重複コンテンツ問題まとめ~ややTogetter風~|ウェブシュフ ざっくり言うと「アーカイブが重複コンテンツ(Duplicate Content)とみなされるとGoogleの順位が落ちるから、アーカイブはあらかじめ検索インデックスに含まれないようにすべき」という話かと思うのですが、全くナンセンスだと思います。ここからはおでさんの記事と同じようなことを書いてますが サイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の理由にはなりません。 - 重複するコンテンツ – ウェブマスターツールヘルプ ということですので。さらに Google は、固有の情報を持つページをインデックスに登録して表示するよう努めています。たとえば、サイトの各記事に「通常」バージョンと「印刷用」バージョンがあり、両方とも noindex メタ タグでブロックされていない場合、フィルタリングによってどちらか 1 つが登録されます。 - 重複するコンテンツ – ウェブマスターツールヘルプ コンテンツが重複してて noindex が入ってなかったとしても、よろしくやっとくよ。ということですね。 ごくまれなケースとして、Google でのランキングの操作やユーザーへの偽装を意図した重複コンテンツが表示される可能性が認識された場合も、Google では関係するサイトのインデックス登録とランキングに対して適切な調整を行います。その場合、該当するサイトはランキングが低下するか、Google インデックスから完全に削除されて検索結果に表示されなくなる可能性があります。 - 重複するコンテンツ – ウェブマスターツールヘルプ 通常のサイトではあり得ないごくまれなケース(In the rare cases)ではあるが、偽装を意図して重複コンテンツを作っている人がいますので、そういう悪い子は検索結果から削除するよ。ということですね。 重複するコンテンツに関して事前に対処し、ユーザーに意図したとおりのコンテンツが表示されるようにするための手順を以下に示します。 - 重複するコンテンツ – ウェブマスターツールヘルプ Googleは重複コンテンツがあってもどれを検索結果に出すべきかちゃんと判断するけど、自動なので自分の意図通りじゃないものが検索結果に出る可能性がある。そう言う場合は事前にGoogleに知らせる方法があるよ。ということですね。 これ以上なにか疑問があるかしら、というくらい明確な文章ですが、似たような質問に動画でも答えています。 「robots.txtを使って自分で重複コンテンツ対策することは推奨しない。全てクロールしたうえで、サイトの構造を解析して、どのURLを検索結果に表示するか判断したいからね。」 結論としてはGoogle神の祟りを畏れてnoindexを入れなくても全然問題ないし、でも検索結果に不本意なURLが出ていたら対策することもできるよ。と言うことだと思います。Twitterで @web_shufu さんに教えてもらったんですが(Thanks!)、Webmaster Centralのフォーラムでも同様の回答がありました。 - If you have a lot of tag-pages and feel that they aren’t providing a great user-experience, you could use a “noindex” meta tag on them. That would allow us to crawl through them, while avoiding them being shown in the search results. - Webmaster Central Forum もしたくさんのタグページがあって、それらが良いユーザーエクスペリエンスを提供していないと感じる場合は、noindexメタタグを使用してもやむを得ないだろう。それらが検索結果に表示されなくはなるが、我々は依然クロールすることはできるからね。 ということですね。”you could use” なのでだいぶ弱い表現です。ユーザーエクスペリエンスを損なうと感じるならば、noindex使うのも仕方ないけど、robots.txtで拒否するのはやめてね。って感じですね。 Googleの姿勢として全体的に、ユーザーが検索エンジンに何を求めているのか、オマエラより俺らの方が分かってるんだから任せておけ、というニュアンスを感じます。それはそれで過去の歴史上そうでもなかっただろという気がしなくもないですが。 ここまでの情報を集めて、ふとこの記事を思い出しました。 【WordPressカテゴリーページのSEO】meta name=”robots”をindexにする前にやるべき8つのこと|ウェブシュフ 低品質なアーカイブはnoindexした方がいいんじゃないの、という記事ですね。確かに、今回この記事に”noindex”というタグ(metaタグじゃなくて、WordPressのタグ機能のことですよ)をつけますが、このブログに”noindex”タグがついた記事は今のところこの1件ですので、”noindex”タグのアーカイブはユーザーが見ても何の意味も無いページだと思います。一方、WordPressという検索語でユーザーが当ブログにアクセスした時、どのURLが最もWordPressというキーワードに合致しているかと言うとWordPressタグのアーカイブだと思います。個々の記事がもっとも役に立つWordPress記事かどうかなんて判断できませんので、アーカイブから見てもらうのが一番いいと思います。 つまり、タグアーカイブもぼくはインデックスしてほしいし、でも件数が少ないタグアーカイブはそうでもないな。ということです。で、作ってみました。記事数が2件以下、つまりまだ1件しか記事がないタグアーカイブにnoindexを出力するプラグインです。すでに有効化済みです。 サイトのコンテンツや構造によっては件数を調整したいかもしれませんので、そのときは $number 変数を調整してください。 01 02 03 04 05 06 07 08 09 10 11 12 13 14 <?php /* Plugin Name: No-indexing newborn tag archives */ function my_archives_noindexing() { global $wp_query; $number = 2; // Print noindex tag if the tag archive has posts less than this number if (is_tag() && (int) $wp_query->found_posts < $number) { echo '<!-- This tag archive does not have much content. -->'; echo '<meta name="robots" content="noindex,follow">'; } } add_action( 'wp_head', 'my_archives_noindexing' ); 最後の判断基準は「ユーザーエクスペリエンス」これを忘れないようにしたいものです。 こちらからは以上です。