Adopting (Google) nofollow attribute

  • ページ: BugTrack
  • 投稿者: henoheno
  • 優先順位: 普通
  • 状態: 完了
  • カテゴリー: 本体新機能
  • 投稿日: 2005-01-23 (日) 10:37:28
  • バージョン:

修正 (Results)

To make Spamdexing(SEO)-results worse for spam promoters, want to add URIs inside PukiWiki contents:

All links within user contents will be forced "nofollow" by design. No setting available to disable it without suitable strategies.

メッセージ

アンカー(<a>)タグに特別なオプション rel="nofollow" を追加することにより、そのハイパーリンクを検索エンジンの評価対象外にする手法が発表されました。PukiWikiもWikiSPAM に対する攻撃手段のひとつとして、これを速やかに実装します。

  • ページ間アンカーについては付与しない (recent, 他のページへのリンク)
  • URL直書き、URL埋め込みに対する付与
  • 外部へのアンカーを出力する機能やプラグインに対する付与 (特にInterWiki, showrss, TrackBack, Referer)

関連ページ

検索エンジンへのインデックス化を辞退する話題

  • BugTrack/143 googleの検索で、編集ページなどが引っかかってしまう
    • 過去の話題。システムが使用するページに関する記述
  • BugTrack/736 robots.txt
  • BugTrack2/72 nofollowプラグイン -- PukiWiki初期コンテンツを検索エンジンに覚えさせない

関連資料

  • Google Blog: Tuesday, January 18, 2005: Preventing comment spam
    • http: //googleblog.blogspot.com/2005/01/preventing-comment-spam.html
  • Yahoo! Search blog: A Defense Against Comment Spam

Comments

Hyperlinks to _the site itself_ (including outside of the Wiki) should not be nofollowed

  • rel="nofollow"についてですが、自サイト内のページへのリンクはどんなもんでしょう。Googleの現在のPageRankの仕組みが明らかにされていない(ような気がする)ので何とも言えないのですが、いくつかのサイトでは「自サイト内のリンクも考慮されてるかも」という記述が見られます。また、metaタグのcontent="nofollow"は「このページからのリンクを辿るな」だったので、今回も「このリンクを辿るな」になっているかもしれません。*1念のため、自サイトに対するURL直書き、URL埋め込みリンクにはrel="nofollow"は付加しない方がいいかもしれません。 -- でぃあばぁ 2005-01-23 (日) 12:57:54
    • こんにちは :) 「自サイト内へのリンク」を判別する手段と実装があればいいのですが、 (1) 同じPukiWikiの他のページへのリンク (2) 同じサーバーで自分のコンテンツへのリンク (3) 同じサーバーで他人のコンテンツへのリンク があったとして、(1) は最初から対象外です。(2)と(3)は判別する手段を実装しないと、PukiWikiには判別できませんよ。 -- henoheno 2005-01-23 (日) 13:16:33
    • nofollowをどのように解釈するかが検索エンジンの実装に依存するのは当然ですので (^^; -- henoheno 2005-01-23 (日) 13:18:57
    • 普通のWikiは全てのデータが「ユーザーが書き込める領域」なので、URL直書き、URL埋め込みリンクの全てにデフォルトでnofollowを付ける様にしないと、Wiki SPAMmerに対する防御(というか能動的な攻撃)ができませんよ。 -- henoheno 2005-01-23 (日) 13:20:02
    • そうですね、一つの回避策としては、InterWikiに自サイト内への固定的な設定を施して、そのレンダリング時だけnofollowを外すというのはどうでしょうか。書き換えられない様に、InterWikiNameに書くのではなくてInterWikiのキーワードとURLをハードコードするのです。 -- henoheno 2005-01-23 (日) 13:25:38
    • (あ、拡張InterWikiNameはこのようにして nofollow を外しておいてもいいな) -- henoheno 2005-01-23 (日) 13:26:21
    • 凍結しているページに対して nofollow を外す様にしてしまうのは、凍結したページに #comment / #pcomment / #include プラグインなどがあった時に穴が出来ます。 -- henoheno 2005-01-23 (日) 13:40:36
    • こんにちは :) 当初想定していたのはpukiwiki.ini.phpに用意したリストに認定済みURLを記述するという方法でしたが、InterWikiを使う方がスマートですね。 -- でぃあばぁ 2005-01-23 (日) 14:01:34
    • ハードコードInterWikiの指定は :config/InterWikiName でするような形がいいかも。 -- でぃあばぁ 2005-01-23 (日) 14:06:40
    • とりあえずはInterWikiをレンダリングしている部分に対するハックか、そこに固定値を割り込ませる設定を用意するのが固いとおもいますでふ -- henoheno 2005-01-24 (月) 23:09:28
    • 了解でふ。 -- でぃあばぁ 2005-01-26 (水) 09:53:46

How about avoiding nofollow by referring PKWK_READONLY flag

  • BugTrack/744 Read-Only 構成を容易に と併せて、Read-Only時にはnofollow を外すっていうのもありかも知れず。変なトコにこだわり過ぎですかね。 -- でぃあばぁ 2005-01-26 (水) 09:57:34
    • BugTrack/744 の最初に read-only 構成のニーズを並べましたが、それをふまえて考えるに、Readonlyならば自動的にnofollowを外すというのは危険みたいですね。自動的に同期させるミラーサーバーを運営していたとして、一方が侵害されたらたちどころにミラーサーバーにデータがミラーされて(followで)晒されてしまいますから。それぞれをもう少し独立させる必要がありそうです。 -- henoheno 2005-01-26 (水) 22:45:45
    • 考えが足りませんでしたorz spammerに対する攻撃を確実にするためには安易な例外は設けない方がいいですね。 -- でぃあばぁ 2005-01-27 (木) 08:39:26
    • というわけで無効に戻しました。 -- henoheno 2005-01-27 (木) 22:08:08
    • cvs:lib/make_link.php (1.16)
    • このdiffを見ると、改造したい人の手間も考慮して余地を残したようだなあ(この時点では)。 -- henoheno 2008-07-23 (水) 22:53:26

Setting should not be implemented

  • PKWK_DISABLE_NOFOLLOW といった定数を用意しようかと何回も考えましたが、どのような形であっても安易にONにされそうなので止めておきました。 -- henoheno 2005-01-27 (木) 22:08:08

[Not negative, but irrelevant] Unsharpen standing easily gets lost

  • Nice to see so many ideas on how to do this, and certainly nofollow is one which will reduce spam. However, in using the google nofollow attribute (which some admins may want to disable) as the sole basis of spam reduction or prevention is a very poor idea. This very topic is one which has been ongoing over the last 5 years, and the majority of these approaches are more ways which rely upon human cognitive techniques, rather than flat-out prevention or IP banning, etc. The more advanced ones are particularly difficult Artificial Intelligence applications, which in our case would be pointless to even consider. Furthermore, PKWK_DISABLE_NOFOLLOW and other constants, please check the PukiWiki2 page where I am fighting a battle to destroy the use of these constants and have a more dynamic method of retrieving and creating configuration options inkeeping with an extended modular architecture, and ditch these horrendous constants-as-values, they're ugly. The way of fighting SPAM will also be easier if we can make a hierarchical modular structure with more extensive requirements, that way any form of spam fighting can be easily waged due to high flexibility. At the moment, these kinds of measures help, but are far from prevention. -- JordanC 2008-07-04 (金) 03:19:03
    • 抄訳: この件について、こんなに沢山アイデアがあるのは悪くないし、確かに nofollow は spam を減らす かもしれない ね。でも Google nofollow attribute を使うのは (管理者によっては無効にしたくなるだろうコレを使うのは) 単独の spam を 減らしたり/防ぐ 方法としてはいけてない。この大げさなトピックはここ5年継続中の話題の一つのようだけれど、この手のアプローチはもっとあって、それらはたいてい それが人によるものであるかどうかを判別する技術 によるもので、死に物狂いの IP banning*2 による防衛とかじゃない。さらに進歩したものだと、とりわけややこしい人口知能研究の応用だったりして、自分たちにはつかみかねる物かもしれない。あー・・・、 PKWK_DISABLE_NOFOLLOW や他の定数なんだけれども、どうか PukiWiki2 のページで ... (略) ... 定数をどうにかしようとしているのを見て欲しい。spamと戦うなら、階層的なモジュール構造から始まる様々な条件を適えておいた方がいいと思う、そうすれば高い柔軟性でもって、どのようなspamとも容易に競い合えるはずだ。今のところは、この手の対策が気休めになるだろうけれども、防御(予防措置)と言うには遠いね。 -- henoheno 2008-07-08 (火) 00:40:03
    • Thanks for your comment, but it looks like a misguided lightning. I added the summary(results) and some links above/below for you.*3 -- henoheno 2008-07-09 (水) 00:26:17
    • Please refer:
      • BugTrack/736 - for robots.txt. Here you'll see the same talk (already rejected). *4 -- henoheno 2008-07-09 (水) 00:26:36
      • BugTrack/772 - for spamming. It's helpful if you organize these existing applications or techniques you're talking about, especially for wiki, with uris, if they are public. *5 -- henoheno 2008-07-09 (水) 00:26:45
      • BugTrack2/200 - One of spam reduction techniques implemented
    • No constant implemented here. The comment about "PKWK_DISABLE_NOFOLLOW" is : I also considered necessity about the setting, but finally decided it should NOT be implemented. -- henoheno 2008-07-09 (水) 00:26:55
    • Nothing ongoing. This page's bug-tracking state is long "完了(Closed)" (See above) -- henoheno 2008-07-09 (水) 00:27:06
    • Would you please separate comments per topic if possible ... -- henoheno 2008-07-09 (水) 00:27:16
  • heno, I can't see Japanese characters on this client at the moment so I can't see the status! -- JordanC 2008-07-18 (金) 08:09:06
    • You know, "Not knowing about Japanese characters" doesn't cover that. *6 For example, translate.google.com translates the words to " Status: Done". Status issue just may imply not knowing about bugtrack plugin, or/and bug-track practice, doesn't it. Your situation never permits you to post such a research-less work. *7 -- henoheno 2008-07-19 (土) 09:44:42
  • Firstly, I generally try not to use google translate as it comes up with strange results. Secondly, I am very familiar with other bugtrackers which aren't merely just a glorified HTML form, such as bugzilla. So sue me if I wanted to read the page myself and didn't know the character, you arrogant fuckwit. -- JordanC 2008-07-19 (土) 19:05:38
    • As a further addendum to this, I'll say I can use google translate now and that my character issue is resolved. But yet, why is the status "Done" and not "Rejected" ? Still, you're an arrogant motherfucker but you make a point. Does it show I'm not familiar with bugtrackers? Fuck you, I'm familiar with plenty. -- JordanC 2008-07-19 (土) 19:18:30
    • "about Japanese characters" <-- I make an effort to at least try and read Japanese, so try to at least make a fucking effort to to distinguish "READ" from "SEE", you fucking prick. -- JordanC 2008-07-19 (土) 19:25:49
  • This page's rough flow for now, is: -- henoheno 2008-07-21 (月) 13:15:29
    • Title: Adopting nofollow
    • Poster: henoheno
    • Status: Done
    • Results: Forced nofollow by design
    • Message(Usualy poster's claim): Brief overview of nofollow / This will be promptly impremented (comment as a committer) / Basic strategies "where to nofollow"
    • Related Pages: Topics similar to
    • Related Documents: Detail information (External links) for nofollow
    • A line --------------
    • Comments: -- Heading needed, I think
      • They are implemented.
      • Comment from Diabaa (about strategy): Hyperlinks to _the site itself_ (including outside of the Wiki) should not be nofollowed. -- henoheno: There's no mechanism to recognize in/out now. -- henoheno: An another idea avoiding nofollow is using InterWiki hard-wired.
      • Comment from Diabaa (about strategy): How about avoiding nofollow by referring PKWK_READONLY flag -- henoheno: Seems lax for spammers when there are mirror sites. -- henoheno: self-reject about creating a setting to avoid nofollow
    • This topic, seems irrelevant for now -- Heading needed
  • I mean the page status is simply "Done". -- henoheno 2008-07-21 (月) 13:36:27
    • If there's reason about information structure (like headings), I will try to be better. *8 -- henoheno 2008-07-21 (月) 13:45:59
    • If the reason is usual but ambiguous practice about this wiki, or Japanese expression, we may be better. -- henoheno 2008-07-21 (月) 13:46:08
    • If the reason is (clear and silent conceding these are) yours, unfortunately, please be careful and do as an experienced person. -- henoheno 2008-07-21 (月) 13:46:24
  • Results: Forced nofollow by design <-- But why was this implemented? Interestingly enough, it will get no ranks when this is done. Rather than make an actual spam-preventative measure of merit such as a CAPCHA, authentication-challenge or so on. If there are those who want to use this feature, it's fine - but using this as a measure to stop spam is futile as I said before. Affixing these won't stop spam, it'll reduce it's effect on your site's rank due to spam. I'll add another bug for this, but since you created this one there's no way it'd be refuted. -- JordanC 2008-07-22 (火) 22:31:23
    • Let you try to consider why Wikipedia (etc) is/are forcing nofollow, and which situation is better to force it. And read the articles well about nofollow already done, before your redundant doing. (I added some more links about nofollow and Wikipedia above) -- henoheno 2008-07-23 (水) 00:27:47

Comments

  • スパム削除ついでにアイデア出し... (=> BugTrack2/309)

*1 「From now on, when Google sees the attribute (rel="nofollow") on hyperlinks, those links won't get any credit when we rank websites in our search results.」が「辿るけれどPageRankに寄与しない」なのか「辿らないしPageRankにも寄与しない」なのか不明なので。
*2 spammerのアクセスを禁止<ban>して平穏な日々を取り戻すべく、spammerが用いていた実績のあるIPアドレスを書いたリストを、管理者がひたすら地道に更新し続け、たまにささやかな喜びを感じたりもするのだが、日々新陳代謝するそれらが、途方もない物量(質、量、質量)で打ち寄せるので、いずれ心身共に削られて行くという経験則を指している
*3 コメントありがとうございます。でもカミナリの矛先が妙です。サマリー(修正 欄)とリンクを追加しておきました。
*4 既出です。ここに、その意見に反する話題はありません
*5 既存の手法については、具体的な実例などを挙げながら、しかるべき場所で、明確に進めて下さい
*6 Though I agree Japanese-reading is deadly hard and possible mistaken that's ambiguous (many case, roundabout).
*7 道具(辞書も)は可能な範囲で複数を使い分けるでしょう。さらに品質を高めたいなら。
*8 日本語に頼った形のinformation structureが他言語ネイティブの人を惑わせる、という話が根本にあったとしたら、それはそれで取り組むべき問題だと思う。でも今回は違うと思う。

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2008-12-30 (火) 02:28:37
Site admin: PukiWiki Development Team

PukiWiki 1.5.2+ © 2001-2019 PukiWiki Development Team. Powered by PHP 5.6.40-0+deb8u7. HTML convert time: 0.302 sec.

OSDN