Adopting (Google) nofollow attribute†
- ページ: BugTrack
- 投稿者: henoheno
- 優先順位: 普通
- 状態: 完了
- カテゴリー: 本体新機能
- 投稿日: 2005-01-23 (日) 10:37:28
- バージョン:
修正 (Results)†
To make Spamdexing(SEO)-results worse for spam promoters, want to add URIs inside PukiWiki contents:
All links within user contents will be forced "nofollow" by design. No setting available to disable it without suitable strategies.
メッセージ†
アンカー(<a>)タグに特別なオプション rel="nofollow" を追加することにより、そのハイパーリンクを検索エンジンの評価対象外にする手法が発表されました。PukiWikiもWikiSPAM に対する攻撃手段のひとつとして、これを速やかに実装します。
- ページ間アンカーについては付与しない (recent, 他のページへのリンク)
- URL直書き、URL埋め込みに対する付与
- 外部へのアンカーを出力する機能やプラグインに対する付与 (特にInterWiki, showrss, TrackBack, Referer)
関連ページ†
検索エンジンへのインデックス化を辞退する話題
関連資料†
- Google Blog: Tuesday, January 18, 2005: Preventing comment spam
- http: //googleblog.blogspot.com/2005/01/preventing-comment-spam.html
- グーグルなど、リンクスパム対策に乗り出す--「ノーフォロー」タグを導入へ
- Yahoo! Search blog: A Defense Against Comment Spam
- msnsearch's Blog: Working Together Against Blog Spam
- Six Log: Support for nofollow
Comments†
Hyperlinks to _the site itself_ (including outside of the Wiki) should not be nofollowed†
- rel="nofollow"についてですが、自サイト内のページへのリンクはどんなもんでしょう。Googleの現在のPageRankの仕組みが明らかにされていない(ような気がする)ので何とも言えないのですが、いくつかのサイトでは「自サイト内のリンクも考慮されてるかも」という記述が見られます。また、metaタグのcontent="nofollow"は「このページからのリンクを辿るな」だったので、今回も「このリンクを辿るな」になっているかもしれません。*1念のため、自サイトに対するURL直書き、URL埋め込みリンクにはrel="nofollow"は付加しない方がいいかもしれません。 -- でぃあばぁ
- こんにちは :) 「自サイト内へのリンク」を判別する手段と実装があればいいのですが、 (1) 同じPukiWikiの他のページへのリンク (2) 同じサーバーで自分のコンテンツへのリンク (3) 同じサーバーで他人のコンテンツへのリンク があったとして、(1) は最初から対象外です。(2)と(3)は判別する手段を実装しないと、PukiWikiには判別できませんよ。 -- henoheno
- nofollowをどのように解釈するかが検索エンジンの実装に依存するのは当然ですので (^^; -- henoheno
- 普通のWikiは全てのデータが「ユーザーが書き込める領域」なので、URL直書き、URL埋め込みリンクの全てにデフォルトでnofollowを付ける様にしないと、Wiki SPAMmerに対する防御(というか能動的な攻撃)ができませんよ。 -- henoheno
- そうですね、一つの回避策としては、InterWikiに自サイト内への固定的な設定を施して、そのレンダリング時だけnofollowを外すというのはどうでしょうか。書き換えられない様に、InterWikiNameに書くのではなくてInterWikiのキーワードとURLをハードコードするのです。 -- henoheno
- (あ、拡張InterWikiNameはこのようにして nofollow を外しておいてもいいな) -- henoheno
- 凍結しているページに対して nofollow を外す様にしてしまうのは、凍結したページに #comment / #pcomment / #include プラグインなどがあった時に穴が出来ます。 -- henoheno
- こんにちは :) 当初想定していたのはpukiwiki.ini.phpに用意したリストに認定済みURLを記述するという方法でしたが、InterWikiを使う方がスマートですね。 -- でぃあばぁ
- ハードコードInterWikiの指定は :config/InterWikiName でするような形がいいかも。 -- でぃあばぁ
- とりあえずはInterWikiをレンダリングしている部分に対するハックか、そこに固定値を割り込ませる設定を用意するのが固いとおもいますでふ -- henoheno
- 了解でふ。 -- でぃあばぁ
How about avoiding nofollow by referring PKWK_READONLY flag†
- BugTrack/744 Read-Only 構成を容易に と併せて、Read-Only時にはnofollow を外すっていうのもありかも知れず。変なトコにこだわり過ぎですかね。 -- でぃあばぁ
- BugTrack/744 の最初に read-only 構成のニーズを並べましたが、それをふまえて考えるに、Readonlyならば自動的にnofollowを外すというのは危険みたいですね。自動的に同期させるミラーサーバーを運営していたとして、一方が侵害されたらたちどころにミラーサーバーにデータがミラーされて(followで)晒されてしまいますから。それぞれをもう少し独立させる必要がありそうです。 -- henoheno
- 考えが足りませんでしたorz spammerに対する攻撃を確実にするためには安易な例外は設けない方がいいですね。 -- でぃあばぁ
- というわけで無効に戻しました。 -- henoheno
- cvs:lib/make_link.php (1.16)
- このdiffを見ると、改造したい人の手間も考慮して余地を残したようだなあ(この時点では)。 -- henoheno
Setting should not be implemented†
- PKWK_DISABLE_NOFOLLOW といった定数を用意しようかと何回も考えましたが、どのような形であっても安易にONにされそうなので止めておきました。 -- henoheno
[Not negative, but irrelevant] Unsharpen standing easily gets lost†
- Nice to see so many ideas on how to do this, and certainly nofollow is one which will reduce spam. However, in using the google nofollow attribute (which some admins may want to disable) as the sole basis of spam reduction or prevention is a very poor idea. This very topic is one which has been ongoing over the last 5 years, and the majority of these approaches are more ways which rely upon human cognitive techniques, rather than flat-out prevention or IP banning, etc. The more advanced ones are particularly difficult Artificial Intelligence applications, which in our case would be pointless to even consider. Furthermore, PKWK_DISABLE_NOFOLLOW and other constants, please check the PukiWiki2 page where I am fighting a battle to destroy the use of these constants and have a more dynamic method of retrieving and creating configuration options inkeeping with an extended modular architecture, and ditch these horrendous constants-as-values, they're ugly. The way of fighting SPAM will also be easier if we can make a hierarchical modular structure with more extensive requirements, that way any form of spam fighting can be easily waged due to high flexibility. At the moment, these kinds of measures help, but are far from prevention. -- JordanC
- 抄訳: この件について、こんなに沢山アイデアがあるのは悪くないし、確かに nofollow は spam を減らす かもしれない ね。でも Google nofollow attribute を使うのは (管理者によっては無効にしたくなるだろうコレを使うのは) 単独の spam を 減らしたり/防ぐ 方法としてはいけてない。この大げさなトピックはここ5年継続中の話題の一つのようだけれど、この手のアプローチはもっとあって、それらはたいてい それが人によるものであるかどうかを判別する技術 によるもので、死に物狂いの IP banning*2 による防衛とかじゃない。さらに進歩したものだと、とりわけややこしい人口知能研究の応用だったりして、自分たちにはつかみかねる物かもしれない。あー・・・、 PKWK_DISABLE_NOFOLLOW や他の定数なんだけれども、どうか PukiWiki2 のページで ... (略) ... 定数をどうにかしようとしているのを見て欲しい。spamと戦うなら、階層的なモジュール構造から始まる様々な条件を適えておいた方がいいと思う、そうすれば高い柔軟性でもって、どのようなspamとも容易に競い合えるはずだ。今のところは、この手の対策が気休めになるだろうけれども、防御(予防措置)と言うには遠いね。 -- henoheno
- Thanks for your comment, but it looks like a misguided lightning. I added the summary(results) and some links above/below for you.*3 -- henoheno
- Please refer:
- BugTrack/736 - for robots.txt. Here you'll see the same talk (already rejected). *4 -- henoheno
- BugTrack/772 - for spamming. It's helpful if you organize these existing applications or techniques you're talking about, especially for wiki, with uris, if they are public. *5 -- henoheno
- BugTrack2/200 - One of spam reduction techniques implemented
- No constant implemented here. The comment about "PKWK_DISABLE_NOFOLLOW" is : I also considered necessity about the setting, but finally decided it should NOT be implemented. -- henoheno
- Nothing ongoing. This page's bug-tracking state is long "完了(Closed)" (See above) -- henoheno
- Would you please separate comments per topic if possible ... -- henoheno
- heno, I can't see Japanese characters on this client at the moment so I can't see the status! -- JordanC
- You know, "Not knowing about Japanese characters" doesn't cover that. *6 For example, translate.google.com translates the words to " Status: Done". Status issue just may imply not knowing about bugtrack plugin, or/and bug-track practice, doesn't it. Your situation never permits you to post such a research-less work. *7 -- henoheno
- Firstly, I generally try not to use google translate as it comes up with strange results. Secondly, I am very familiar with other bugtrackers which aren't merely just a glorified HTML form, such as bugzilla. So sue me if I wanted to read the page myself and didn't know the character, you arrogant fuckwit. -- JordanC
- As a further addendum to this, I'll say I can use google translate now and that my character issue is resolved. But yet, why is the status "Done" and not "Rejected" ? Still, you're an arrogant motherfucker but you make a point. Does it show I'm not familiar with bugtrackers? Fuck you, I'm familiar with plenty. -- JordanC
- "about Japanese characters" <-- I make an effort to at least try and read Japanese, so try to at least make a fucking effort to to distinguish "READ" from "SEE", you fucking prick. -- JordanC
- This page's rough flow for now, is: -- henoheno
- Title: Adopting nofollow
- Poster: henoheno
- Status: Done
- Results: Forced nofollow by design
- Message(Usualy poster's claim): Brief overview of nofollow / This will be promptly impremented (comment as a committer) / Basic strategies "where to nofollow"
- Related Pages: Topics similar to
- Related Documents: Detail information (External links) for nofollow
- A line --------------
- Comments: -- Heading needed, I think
- They are implemented.
- Comment from Diabaa (about strategy): Hyperlinks to _the site itself_ (including outside of the Wiki) should not be nofollowed. -- henoheno: There's no mechanism to recognize in/out now. -- henoheno: An another idea avoiding nofollow is using InterWiki hard-wired.
- Comment from Diabaa (about strategy): How about avoiding nofollow by referring PKWK_READONLY flag -- henoheno: Seems lax for spammers when there are mirror sites. -- henoheno: self-reject about creating a setting to avoid nofollow
- This topic, seems irrelevant for now -- Heading needed
- I mean the page status is simply "Done". -- henoheno
- If there's reason about information structure (like headings), I will try to be better. *8 -- henoheno
- If the reason is usual but ambiguous practice about this wiki, or Japanese expression, we may be better. -- henoheno
- If the reason is (clear and silent conceding these are) yours, unfortunately, please be careful and do as an experienced person. -- henoheno
- Results: Forced nofollow by design <-- But why was this implemented? Interestingly enough, it will get no ranks when this is done. Rather than make an actual spam-preventative measure of merit such as a CAPCHA, authentication-challenge or so on. If there are those who want to use this feature, it's fine - but using this as a measure to stop spam is futile as I said before. Affixing these won't stop spam, it'll reduce it's effect on your site's rank due to spam. I'll add another bug for this, but since you created this one there's no way it'd be refuted. -- JordanC
- Let you try to consider why Wikipedia (etc) is/are forcing nofollow, and which situation is better to force it. And read the articles well about nofollow already done, before your redundant doing. (I added some more links about nofollow and Wikipedia above) -- henoheno
Comments†