質問箱/2063

カテゴリ
サマリKAKASI、ChaSenなどを使用しない一覧表示の五十音順分類は可能?
バージョン1.4.2
投稿者もりー?
状態完了
投稿日2004-03-03 (WED) 16:58:44

質問

ChaSenもKAKASIも入れることが出来ない環境でPukiWikiを使用しているのですが、ChaSenやKAKASIを使用せずに一覧表示を五十音で分類することは可能でしょうか?

例えば、よく出てくる語句は予め登録しておき、その順番にソートするという感じです。

読みを登録するのが大変面倒だとは思いますけれど、ある程度でも分類できれば見やすくなるのではと思います。自動的に読みを取得できる方がやはり便利だとは思いますが…。何か方法がありましたらお教えください。

回答

  • 三浦克介 2004-03-03 (WED) 17:30:01

    読みを入力してやれば、可能なはず・・・。

  • もりー? 2004-03-03 (WED) 17:55:41

    読みの入力って、ページ名にですか?(ひょっとしたら見当ハズレな質問になってます?)

  • もりー? 2004-03-03 (WED) 18:07:27

    入力方法を教えていただけますか?

    • reimy 2004-03-03 (WED) 19:18:20

      当然、改造しないとできません。

  • 三浦克介 2004-03-03 (WED) 19:25:10

    改造しました。以下のパッチを当ててみてください。その上で、一覧表示をすると、:config/PageReading というページができますので、それを編集してください。

    • filepagereading.patch
      -[[日本語]] 日本語
      となっている行を
      -[[日本語]] ニホンゴ
      に書き換えると、「ニ」に分類されるようになるはずです。
  • もりー? 2004-03-03 (WED) 22:25:14

    ありがとうございました。最初は動かずに「?」という感じでしたが、patchの中に記載されている$pagereading_enableを1にしたらきちんと分類されました。今から読みを追加していきます。本当にありがとうございました。

  • もりー? 2004-03-04 (THU) 00:06:36

    もう一つついで(?)に教えてください。
    例えば、「ほげ/ほげ1」「ほげ/ほげ2」「ほげ/ほげ3」というタイトルの物があったとして、「ほげ」の読みは「ホゲ」と登録します。
    別に「1」は「イチ」、「2」は「ニ」というように単語ごとに登録するような、文章の読みを登録するというより、単語の音を登録するようなことは技術的には可能でしょうか?
    教えていただいた方法でほぼ完全に動作するのですが、今後、ほぼ同じ読みのタイトルが増える予定ですので、(今でもかなり多いのですが)
    そうなると、:config/PageReading がかなりのボリュームになるようなのです。
    (今もオンラインでは編集しづらいです。)
    いや、可能かどうか聞いたとしても、今の自分ではどうにも出来ないかもしれないのですが…。

    • reimy 2004-03-04 (THU) 00:35:54

      上記の例でいえば「1」や「2」を登録する意味がありません。現在の仕様では、ページ一覧で表示する際に有効な「読み」は先頭の1文字だけで、ページ名は文字コードでソートされて出力されますので。

      つまり、「読み」を「ホゲ」「ホゲ/ホゲ」「ホゲ/ホゲ1」にしなくても、すべて「ホ」でも同じことなのです。長い名前のページ名の「読み」をきちんと書く必要はありません。

      ページ名を「読み」でソートして出力する仕様に変更されれば、また違ってくるのですが。現状は見出しの分類で「読み」(の先頭の1文字)が使われているだけです*1

  • もりー? 2004-03-04 (THU) 08:29:42

    なるほど、最初の一文字だけなんですね。納得しました。ありがとうございました。m(_ _)m

  • もりー? 2004-03-04 (THU) 13:19:17

    くどくなりそうですが、もう一つ教えてください。
    「高崎(タカサキ)」「高知(コウチ)」という言葉を今回のパッチをあてない状態の一覧で出すと先頭の文字コードが同じなので近所に分類されます。
    これにパッチをあて、読み方を登録してやると、「高崎」は「タ」、「高知」は「コ」の所に分類されるようになります。
    それでは例えば次に「高崎ケイバ」という言葉を登録してやると、それは「タ」のところに行くわけはなく、「記号」の所に登録されます。「高知ケイリン」も同様で「コ」の所には行きません。先頭が「高崎」で始まる文字は「タ」に自動的に分類する、「高知」で始まる言葉は「コ」に自動的に分類する、そういうことは可能でしょうか?
    勿論これには穴というか、かえって手間を取らせる事態もあると思います。「河野」は「カワノ」と読んだり「コウノ」と読んだりしますので「河野」を「コウノ」と登録した場合、「カワノ」と読むものは間違って分類されます。
    こういった物はどちらかの読みで登録してしまうと、必ず手作業での修正が必要でしょうけれども、ある程度の文字の読み方データ(読み方辞書?*2)をPukiWiki自体に持たせることが可能なら少しは楽になりそうだなと思ったまでで…。

  • 三浦克介 2004-03-04 (THU) 13:28:38

    感謝の気持ちをpukiwiki.orgへの貢献という形で表していただけるなら、可能です(パッチを作成しますので、ドキュメントを作成していただけませんか? 現在、ChaSen/Kakasiを利用した一覧における日本語ページの分類機能の解説が無く、BugTrack等を見ないとこのような機能があることが分からないはずです。PukiWiki/インストール/1.4系列 あたりに、この機能、および今回の拡張機能の説明ドキュメントを書いていただけると、私としても、やる気がでます(最近、タダでは働かない私・・・ :D))。

  • もりー? 2004-03-04 (THU) 15:16:57

    ChaSen、KAKASIについて全く理解できてないんですけど、可能でしょうか?(致命的な気さえしますけれど。 :( )

  • もりー? 2004-03-04 (THU) 16:21:36

    …とか書きながらも手探りで書いてみました。使えそうなら使ってください。
    とりあえずはdev:BugTrack/436の内容で。(拡張機能の分は含まれていません。)filedoc.txt

  • 三浦克介 2004-03-05 (FRI) 09:41:16

    実装しました。標準のPukiWikiに、パッチfilepagereading2.patchを当て、ページ :config/PageReading/dict にルールを記述して下さい。ルールについては、サンプル を参照してください。JIS第一水準の漢字が50音順になっていることを利用したルールを記述してあり、ChaSen/Kakasiに比べると遥かに精度は落ちますが、そこそこ分類できます。よく作成するページ(「日記」など)を追加で登録しておけば、かなり自動化できるでしょう。

    • もりー? 2004-03-06 (SAT) 15:25:44

      遅くなりましたが、パッチを当て、ルール記述をするとかなり楽に読みの登録ができるようになりました。ありがとうございました。かなり便利ですよね。ChaSenやKAKASIが使えない環境でも充分日本語の分類ができると思います。さて、ドキュメントですが、近いうちに拡張機能分も追加して、あげておきます。お読みいただいて、分かりづらいところなどありましたら、修正していただけますか?(PukiWiki/インストール/1.4系列 あたりになるんでしょうか? PukiWiki/1.4/ちょっと便利に あたりのような気もしますけど…。)

    • にぶんのに 2004-03-07 (SUN) 00:55:38

      既に本体に取り込まれているdoc.txtの内容はdev:PukiWiki/1.4/マニュアルの下で一覧表示の五十音順分類というページに、拡張機能についてはdev:PukiWiki/1.4/ちょっと便利にの下でKAKASI、ChaSenを使わない五十音順分類 というページにそれぞれ作成するのはいかがでしょうか?

  • もりー? 2004-03-07 (SUN) 01:54:42

    にぶんのにさん、はじめまして。アドバイス、ありがとうございます。とりあえず、一覧表示の五十音順分類に先に作成したdoc.txtをアップしました。KAKASI、ChaSenを使わない分類の方は近日中にまとめたいと思っております。


  • blue? 2004-08-20 (FRI) 08:00:28

    pagereading2.patchをpukiwiki1.4.3にあててもパッチ失敗のメッセージが出ます。:config/PageReadingで読みを設定し直しても:config/PageReading/dictで設定しても五十音順に反映されませんでした。ご報告まで。

  • 三浦克介 2004-08-20 (FRI) 09:05:39

    現在は本体に取り込まれていますので、パッチを当てなくても使えるはずなのですが・・・

  • お返事ありがとうございます。上記もりーさんの文書の続きがないようでしたので、取り込まれていないと早合点しておりました。十分に検索しておらず済みません。 -- blue? 2004-08-25 (水) 01:29:40
  • すると、現在の動作が正常だとすると、:config/PageReadingと:config/PageReading/dictで読みを当てた通りに並ぶのは「一覧」のところだけで、ls2などのほうには反映されない(あくまでもファイル名で並べる)ということなのですね。どちらにも反映されるのかと思っておりました。間違ったご報告をして済みません。kakasi/chasenを使用しない限りは、ほげ/ほがほげ、ほげ/ほぎほご などのようになっているものを五十音順に配列するのは難しいようですね。人名や作品名などをうまく並べられないものかと思案しております。 -- blue? 2004-08-25 (水) 01:36:29

*1 「読み」でソートすると、「ほげ/1」(読みは「ホゲ/イチ」)「ほげ/2」(同「ホゲ/ニ」)「ほげ/3」(同「ホゲ/サン」)は、「ほげ/1」「ほげ/3」「ほげ/2」の順に表示されてしまうので、見出し以外、ページ名を文字コードでソートする現状の仕様はそれなりの意味はあるのです。
*2 先頭文字辞書?

添付ファイル: filepagereading2.patch 1368件 [詳細] filedict-euc.txt 687件 [詳細] filedict-sjis.txt 581件 [詳細] filepagereading.patch 1583件 [詳細] filedoc.txt 1901件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-06-07 (月) 17:26:55
Site admin: PukiWiki Development Team

PukiWiki 1.5.2+ © 2001-2019 PukiWiki Development Team. Powered by PHP 5.6.40-0+deb8u7. HTML convert time: 0.319 sec.

OSDN