デフォルトコンテンツのページが検索エンジンに引っかからないようにする

  • ページ: BugTrack2
  • 投稿者: umorigu
  • 優先順位: 低
  • 状態: 完了
  • カテゴリー: その他
  • 投稿日: 2015-07-14 (火) 23:12:27
  • バージョン: 1.5.0
  • リリース予定バージョン: 1.5.1

メッセージ

標準配布状態で Plugin Manual 等が デフォルトコンテンツとして含まれています。 これらのページが通常コンテンツとして検索エンジン等から扱われるため、PukiWiki設置サイトの数だけPlugin Manual が検索結果に含まれてしまいます。

nofollow,noindex等を使って、これらのページが検索対象にならないようにします。

対象:

  • BracketName
  • FormattingRules
  • Help
  • InterWiki
  • InterWikiName
  • InterWikiSandbox
  • PHP
  • PukiWiki
  • PukiWiki/1.4
  • PukiWiki/1.4/* 以下すべて (PukiWiki/1.4/Manual/Plugin/A-D etc)
  • SandBox
  • WikiEngines
  • WikiName
  • WikiWikiWeb
  • YukiWiki

対象外:

  • FrontPage
  • MenuBar

なお、公式サイトofficial:FrontPageのコンテンツは対象外です。(検索エンジンの検索対象になった方が都合がよいため)

実装


  • デフォルトコンテンツのうち、マニュアル類にはnofollow プラグインが仕込まれていたような気が→BugTrack2/72
    なので、公式サイトのページ
    <meta name="robots" content="NOINDEX,NOFOLLOW" />
    を発行していて、凍結されていない開発サイトのページでは
    #nofollow: Page not freezed
    エラーメッセージが出ています。 -- 2015-07-16 (木) 21:51:18
    • お、ほんとですね。これは気が付いていませんでした。そうするとたまに引っかかるページは、なんでしょうね。スキンに nofollow の指定があるので、スキンをカスタマイズしてると入らないこともありそうです。 -- umorigu 2015-07-16 (木) 22:56:35
    • X-Robots-Tag のHTTPヘッダを出力するのが安全なのかな -- umorigu 2015-07-16 (木) 22:57:27
  • 注ぎ足し注ぎ足しアップデートして使い続けているからスキンやデフォルトコンテンツをアップデート対象外にして昔のままに、なんてパターンもありそうですね -- 2015-07-18 (土) 21:24:46
  • 検索エンジンのインデックス対象外にしたいファイルに対しては、これまでスキンファイルで HTML metaヘッダとして robots: nofollow,noindex を出力していました。これに加えて、HTTPヘッダの X-Robots-Tag: nofollow,noindex を出力するようにしました。これによりスキンをカスタマイズしていても意図通り「検索エンジンにキャッシュさせない」ことを期待できます。対象はデフォルトで含まれるマニュアルページ(#nofollow + #freese)、それから編集画面などread以外の画面です。 -- umorigu 2016-02-06 (土) 06:58:25


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2016-02-06 (土) 07:01:45
Site admin: PukiWiki Development Team

PukiWiki 1.5.2+ © 2001-2019 PukiWiki Development Team. Powered by PHP 5.6.40-0+deb8u8. HTML convert time: 0.303 sec.

OSDN