* Adopting (Google) nofollow attribute [#q568dbfe]
-ページ: BugTrack
-投稿者: [[henoheno]]
-優先順位: 普通
-状態: 完了
-カテゴリー: 本体新機能
-投稿日: 2005-01-23 (日) 10:37:28
-バージョン: 

#contents

** 修正 (Results) [#wbfdf17f]

To make [[Spamdexing>Wikipedia:Spamdexing]](SEO)-results worse for spam promoters, want to add URIs inside PukiWiki contents:

All links within user contents will be forced "nofollow" by design. No setting available to disable it without suitable strategies.

- [[cvs:lib/make_link.php]] (1.12, 1.13, 1.16)
- [[cvs:plugin/referer.inc.php]] (1.9)
- [[cvs:plugin/showrss.inc.php]] (1.16)
- [[cvs:plugin/tb.inc.php]] (1.17)

**メッセージ [#x7226e4c]

アンカー(<a>)タグに特別なオプション rel="nofollow" を追加することにより、そのハイパーリンクを検索エンジンの評価対象外にする手法が発表されました。PukiWikiもWikiSPAM に対する''攻撃''手段のひとつとして、これを速やかに実装します。

- ページ間アンカーについては付与しない (recent, 他のページへのリンク)
- URL直書き、URL埋め込みに対する付与
- 外部へのアンカーを出力する機能やプラグインに対する付与 (特にInterWiki, showrss, TrackBack, [[Referer]])


** 関連ページ [#waec16f1]

検索エンジンへのインデックス化を辞退する話題

- [[BugTrack/143]] googleの検索で、編集ページなどが引っかかってしまう
-- 過去の話題。システムが使用するページに関する記述
- [[BugTrack/736]] robots.txt
- [[BugTrack2/72]] nofollowプラグイン -- PukiWiki初期コンテンツを検索エンジンに覚えさせない

** 関連資料 [#lb014f67]

- Google Blog: Tuesday, January 18, 2005: Preventing comment spam
// ↓、spam 対策機能に引っかかるのでこの状態にしてあります
-- http: //googleblog.blogspot.com/2005/01/preventing-comment-spam.html

- グーグルなど、リンクスパム対策に乗り出す--「ノーフォロー」タグを導入へ
-- http://japan.cnet.com/news/media/story/0,2000047715,20080136,00.htm

- Yahoo! Search blog: A Defense Against Comment Spam
-- http://www.ysearchblog.com/archives/000069.html
-- "I'm pleased to announce that Yahoo! Search is one of several organizations in support of a technique that should help ''combat'' weblog comment spam."

- msnsearch's Blog: Working Together Against Blog Spam
-- http://blogs.msdn.com/msnsearch/archive/2005/01/18/nofollow_tags.aspx
-- "''Fighting'' this web spam is one of the harder parts of our job. "

- Six Log: Support for nofollow
-- http://www.sixapart.com/log/2005/01/support_for_nof.shtml

- (Wikipedia) [WikiEN-l] Nofollow back on URL links on en.wikipedia.org articles for now http://lists.wikimedia.org/pipermail/wikien-l/2007-January/061137.html
-- http://slashdot.jp/articles/07/01/25/154257.shtml
-- TechCrunch Japanese アーカイブ &#187; WikipediaはWikiaとWikiを特別扱いしている http://jp.techcrunch.com/archives/wikipedia-special-treatment-for-wikia-and-other-wikis/

- [[BugTrack/772]]: Wiki SPAMming

----
* Comments [#ce438558]

- [[cvs:plugin/showrss.inc.php]] (1.16)
- [[cvs:plugin/tb.inc.php]] (1.17)
- [[cvs:lib/make_link.php]] (1.12)
--強制適用完了 :) -- [[henoheno]] &new{2005-01-23 (日) 12:17:45};
- [[cvs:lib/make_link.php]] (1.13)
-- %%新設の PKWK_READONLY フラグがOnの時のみ、URL直書き・埋め込み時の nofollow を外します。ただし、編集が不可能になる様々な機能も有効になります。(編集不可機能については現在は未実装)%%  -- [[henoheno]] &new{2005-01-23 (日) 12:54:21};
-もし対応漏れ等あればお知らせください。 -- [[henoheno]] &new{2005-01-23 (日) 12:55:11};
-- あ、さっそくreferrerを忘れてた (^^; -- [[henoheno]] &new{2005-01-23 (日) 13:10:36};
-- [[cvs:plugin/referer.inc.php]] (1.9)


** Hyperlinks to _the site itself_ (including outside of the Wiki) should not be nofollowed [#q2d92b0d]

-rel="nofollow"についてですが、自サイト内のページへのリンクはどんなもんでしょう。Googleの現在のPageRankの仕組みが明らかにされていない(ような気がする)ので何とも言えないのですが、いくつかのサイトでは「自サイト内のリンクも考慮されてるかも」という記述が見られます。また、metaタグのcontent="nofollow"は「このページからのリンクを辿るな」だったので、今回も「このリンクを辿るな」になっているかもしれません。((「From now on, when Google sees the attribute (rel="nofollow") on hyperlinks, those links won't get any credit when we rank websites in our search results.」が「辿るけれどPageRankに寄与しない」なのか「辿らないしPageRankにも寄与しない」なのか不明なので。))念のため、自サイトに対するURL直書き、URL埋め込みリンクにはrel="nofollow"は付加しない方がいいかもしれません。 -- [[でぃあばぁ]] &new{2005-01-23 (日) 12:57:54};
-- こんにちは :) 「自サイト内へのリンク」を判別する手段と実装があればいいのですが、 (1) 同じPukiWikiの他のページへのリンク (2) 同じサーバーで自分のコンテンツへのリンク (3) 同じサーバーで他人のコンテンツへのリンク があったとして、(1) は最初から対象外です。(2)と(3)は判別する手段を実装しないと、PukiWikiには判別できませんよ。 -- [[henoheno]] &new{2005-01-23 (日) 13:16:33};
-- nofollowをどのように解釈するかが検索エンジンの実装に依存するのは当然ですので (^^; -- [[henoheno]] &new{2005-01-23 (日) 13:18:57};
-- 普通のWikiは全てのデータが「ユーザーが書き込める領域」なので、URL直書き、URL埋め込みリンクの全てにデフォルトでnofollowを付ける様にしないと、Wiki SPAMmerに対する防御(というか能動的な''攻撃'')ができませんよ。 -- [[henoheno]] &new{2005-01-23 (日) 13:20:02};
-- そうですね、一つの回避策としては、InterWikiに自サイト内への固定的な設定を施して、そのレンダリング時だけnofollowを外すというのはどうでしょうか。書き換えられない様に、InterWikiNameに書くのではなくてInterWikiのキーワードとURLをハードコードするのです。 -- [[henoheno]] &new{2005-01-23 (日) 13:25:38};
-- (あ、拡張InterWikiNameはこのようにして nofollow を外しておいてもいいな) -- [[henoheno]] &new{2005-01-23 (日) 13:26:21};
-- 凍結しているページに対して nofollow を外す様にしてしまうのは、凍結したページに #comment / #pcomment / #include プラグインなどがあった時に穴が出来ます。 -- [[henoheno]] &new{2005-01-23 (日) 13:40:36};
--こんにちは :) 当初想定していたのはpukiwiki.ini.phpに用意したリストに認定済みURLを記述するという方法でしたが、InterWikiを使う方がスマートですね。 -- [[でぃあばぁ]] &new{2005-01-23 (日) 14:01:34};
--ハードコードInterWikiの指定は :config/InterWikiName でするような形がいいかも。 -- [[でぃあばぁ]] &new{2005-01-23 (日) 14:06:40};
-- とりあえずはInterWikiをレンダリングしている部分に対するハックか、そこに固定値を割り込ませる設定を用意するのが固いとおもいますでふ -- [[henoheno]] &new{2005-01-24 (月) 23:09:28};
--了解でふ。 -- [[でぃあばぁ]] &new{2005-01-26 (水) 09:53:46};

** How about avoiding nofollow by referring PKWK_READONLY flag [#i2faa18c]

-[[BugTrack/744]] Read-Only 構成を容易に と併せて、Read-Only時にはnofollow を外すっていうのもありかも知れず。変なトコにこだわり過ぎですかね。 -- [[でぃあばぁ]] &new{2005-01-26 (水) 09:57:34};
-- [[BugTrack/744]] の最初に read-only 構成のニーズを並べましたが、それをふまえて考えるに、Readonlyならば自動的にnofollowを外すというのは危険みたいですね。自動的に同期させるミラーサーバーを運営していたとして、一方が侵害されたらたちどころにミラーサーバーにデータがミラーされて(followで)晒されてしまいますから。それぞれをもう少し独立させる必要がありそうです。 -- [[henoheno]] &new{2005-01-26 (水) 22:45:45};
--考えが足りませんでしたorz spammerに対する攻撃を確実にするためには安易な例外は設けない方がいいですね。 -- [[でぃあばぁ]] &new{2005-01-27 (木) 08:39:26};
-- というわけで無効に戻しました。 -- [[henoheno]] &new{2005-01-27 (木) 22:08:08};
-- [[cvs:lib/make_link.php]] (1.16)
-- このdiffを見ると、改造したい人の手間も考慮して余地を残したようだなあ(この時点では)。 -- [[henoheno]] &new{2008-07-23 (水) 22:53:26};

** Setting should not be implemented [#kcf59548]
- PKWK_DISABLE_NOFOLLOW といった定数を用意しようかと何回も考えましたが、どのような形であっても安易にONにされそうなので止めておきました。 -- [[henoheno]] &new{2005-01-27 (木) 22:08:08};


** [Not negative, but irrelevant] Unsharpen standing easily gets lost [#e76216d6]
- Nice to see so many ideas on how to do this, and certainly nofollow is one which will reduce spam. However, in using the google nofollow attribute (which some admins may want to disable) as the sole basis of spam reduction or prevention is a very poor idea. This very topic is one which has been ongoing over the last 5 years, and the majority of these approaches are more ways which rely upon human cognitive techniques, rather than flat-out prevention or IP banning, etc. The more advanced ones are particularly difficult Artificial Intelligence applications, which in our case would be pointless to even consider. Furthermore, PKWK_DISABLE_NOFOLLOW and other constants, please check the PukiWiki2 page where I am fighting a battle to destroy the use of these constants and have a more dynamic method of retrieving and creating configuration options inkeeping with an extended modular architecture, and ditch these horrendous constants-as-values, they're ugly. The way of fighting SPAM will also be easier if we can make a hierarchical modular structure with more extensive requirements, that way any form of spam fighting can be easily waged due to high flexibility. At the moment, these kinds of measures help, but are far from prevention. -- [[JordanC]] &new{2008-07-04 (金) 03:19:03};
-- 抄訳: この件について、こんなに沢山アイデアがあるのは悪くないし、確かに nofollow は spam を減らす かもしれない ね。でも Google nofollow attribute を使うのは (管理者によっては無効にしたくなるだろうコレを使うのは) 単独の spam を 減らしたり/防ぐ 方法としてはいけてない。この大げさなトピックはここ5年継続中の話題の一つのようだけれど、この手のアプローチはもっとあって、それらはたいてい それが人によるものであるかどうかを判別する技術 によるもので、死に物狂いの IP banning((spammerのアクセスを禁止<ban>して平穏な日々を取り戻すべく、spammerが用いていた実績のあるIPアドレスを書いたリストを、管理者がひたすら地道に更新し続け、たまにささやかな喜びを感じたりもするのだが、日々新陳代謝するそれらが、途方もない物量(質、量、質量)で打ち寄せるので、いずれ心身共に削られて行くという経験則を指している)) による防衛とかじゃない。さらに進歩したものだと、とりわけややこしい人口知能研究の応用だったりして、自分たちにはつかみかねる物かもしれない。あー・・・、 PKWK_DISABLE_NOFOLLOW や他の定数なんだけれども、どうか PukiWiki2 のページで ... (略) ... 定数をどうにかしようとしているのを見て欲しい。spamと戦うなら、階層的なモジュール構造から始まる様々な条件を適えておいた方がいいと思う、そうすれば高い柔軟性でもって、どのようなspamとも容易に競い合えるはずだ。今のところは、この手の対策が気休めになるだろうけれども、防御(予防措置)と言うには遠いね。 -- [[henoheno]] &new{2008-07-08 (火) 00:40:03};
-- Thanks for your comment, but it looks like a misguided lightning. I added the summary(results) and some links above/below for you.((コメントありがとうございます。でもカミナリの矛先が妙です。サマリー(修正 欄)とリンクを追加しておきました。)) -- [[henoheno]] &new{2008-07-09 (水) 00:26:17};
-- Please refer:
--- [[BugTrack/736]] - for robots.txt. Here you'll see the same talk (already rejected). ((既出です。ここに、その意見に反する話題はありません)) -- [[henoheno]] &new{2008-07-09 (水) 00:26:36};
--- [[BugTrack/772]] - for spamming. It's helpful if you organize these existing applications or techniques you're talking about, especially for wiki, with uris, if they are public. ((既存の手法については、具体的な実例などを挙げながら、しかるべき場所で、明確に進めて下さい)) -- [[henoheno]] &new{2008-07-09 (水) 00:26:45};
--- [[BugTrack2/200]] - One of spam reduction techniques implemented 
-- No constant implemented here. The comment about "PKWK_DISABLE_NOFOLLOW" is : I also considered necessity about the setting, but finally decided it should NOT be implemented. -- [[henoheno]] &new{2008-07-09 (水) 00:26:55};
-- Nothing ongoing. This page's bug-tracking state is long "完了(Closed)" (See above) -- [[henoheno]] &new{2008-07-09 (水) 00:27:06};
-- Would you please separate comments per topic if possible ... -- [[henoheno]] &new{2008-07-09 (水) 00:27:16};
- heno, I can't see Japanese characters on this client at the moment so I can't see the status! -- [[JordanC]] &new{2008-07-18 (金) 08:09:06};
-- You know, "Not knowing about Japanese characters" doesn't cover that. ((Though I agree Japanese-reading is deadly hard and possible mistaken that's ambiguous (many case, roundabout).)) For example, [[translate.google.com>http://translate.google.com/]] translates the words to " ''Status: Done''". Status issue just may imply not knowing about bugtrack plugin, or/and bug-track practice, doesn't it. Your situation never permits you to post such a research-less work. ((道具(辞書も)は可能な範囲で複数を使い分けるでしょう。さらに品質を高めたいなら。)) -- [[henoheno]] &new{2008-07-19 (土) 09:44:42};
- Firstly, I generally try not to use google translate as it comes up with strange results. Secondly, I am very familiar with other bugtrackers which aren't merely just a glorified HTML form, such as bugzilla. So sue me if I wanted to read the page myself and didn't know the character, you arrogant fuckwit. -- [[JordanC]] &new{2008-07-19 (土) 19:05:38};
-- As a further addendum to this, I'll say I can use google translate now and that my character issue is resolved.  But yet, why is the status "Done" and not "Rejected" ? Still, you're an arrogant motherfucker but you make a point. Does it show I'm not familiar with bugtrackers? Fuck you, I'm familiar with plenty.  -- [[JordanC]] &new{2008-07-19 (土) 19:18:30};
-- "about Japanese characters" <-- I make an effort to at least try and read Japanese, so try to at least make a fucking effort to to distinguish "READ" from "SEE", you fucking prick. -- [[JordanC]] &new{2008-07-19 (土) 19:25:49};
- This page's rough flow for now, is: -- [[henoheno]] &new{2008-07-21 (月) 13:15:29};
-- Title: Adopting nofollow
-- Poster: henoheno
-- Status: Done
-- Results: Forced nofollow by design
-- Message(Usualy poster's claim): Brief overview of nofollow / This will be promptly impremented (comment as a committer) / Basic strategies "where to nofollow"
-- Related Pages: Topics similar to
-- Related Documents: Detail information (External links) for nofollow
-- A line --------------
-- Comments: -- Heading needed, I think
--- They are implemented.
--- Comment from Diabaa (about strategy): Hyperlinks to _the site itself_ (including outside of the Wiki) should not be nofollowed. -- henoheno: There's no mechanism to recognize in/out now. -- henoheno: An another idea avoiding nofollow is using InterWiki hard-wired.
--- Comment from Diabaa (about strategy): How about avoiding nofollow by referring PKWK_READONLY flag -- henoheno: Seems lax for spammers when there are mirror sites. -- henoheno: self-reject about creating a setting to avoid nofollow
-- This topic, seems irrelevant for now -- Heading needed
- I mean the page status is simply "Done". -- [[henoheno]] &new{2008-07-21 (月) 13:36:27};
-- If there's reason about information structure (like headings), I will try to be better. ((日本語に頼った形のinformation structureが他言語ネイティブの人を惑わせる、という話が根本にあったとしたら、それはそれで取り組むべき問題だと思う。でも今回は違うと思う。)) -- [[henoheno]] &new{2008-07-21 (月) 13:45:59};
-- If the reason is usual but ambiguous practice about this wiki, or Japanese expression, we may be better. -- [[henoheno]] &new{2008-07-21 (月) 13:46:08};
-- If the reason is (clear and silent conceding these are) yours, unfortunately, please be careful and do as an experienced person. -- [[henoheno]] &new{2008-07-21 (月) 13:46:24};
- Results: Forced nofollow by design <-- But why was this implemented? Interestingly enough, it will get no ranks when this is done. Rather than make an actual spam-preventative measure of merit such as a CAPCHA, authentication-challenge or so on. If there are those who want to use this feature, it's fine - but using this as a measure to stop spam is futile as I said before. Affixing these won't stop spam, it'll reduce it's effect on your site's rank due to spam. I'll add another bug for this, but since you created this one there's no way it'd be refuted.  -- [[JordanC]] &new{2008-07-22 (火) 22:31:23};
-- Let you try to consider why Wikipedia (etc) is/are forcing nofollow, and which situation is better to force it. And read the articles well about nofollow already done, before your redundant doing. (I added some more links about nofollow and Wikipedia above) -- [[henoheno]] &new{2008-07-23 (水) 00:27:47};

- %%Topics about CAPTCHA will be moved to [[CAPTCHA]]%% done -- [[henoheno]] &new{2008-08-12 (火) 00:39:57};
- [[開発日記/2008-07-30]] --  &new{2008-08-12 (火) 00:40:28};


** Comments [#a3dcc936]

- スパム削除ついでにアイデア出し... (=> [[BugTrack2/309]])
- cohKDubVBcwZ -- [[tiuydsbojfc]] &new{2008-12-30 (火) 02:28:36};

#comment
//#comment

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Site admin: PukiWiki Development Team

PukiWiki 1.5.2+ © 2001-2019 PukiWiki Development Team. Powered by PHP 5.6.40-0+deb8u7. HTML convert time: 0.060 sec.

OSDN