html2pw.inc.php

サマリshowhtmlのキャッシュからPukiWiki文書の変換を試みる
リビジョン1.0
対応バージョン1.4
投稿者upk
投稿日2003-10-28 (TUE) 01:00:30

掲載先

  • 斎藤家のフォルダ 公開停止

html2pw.inc.php

説明

showhtml で取り込んだ、画像とHTMLを元に、PukiWiki の文書またはフォトアルバムとして取り込むように試みるプラグイン。

showcache プラグインから起動されることを想定しています。

※このプラグイン単体では、HTMLも画像も取得する機能はありません。

補足

あくまでも、HTMLから PukiWiki への移行を支援する目的であり、

変換して、そのままでの利用は、恐らく無理だと思います。

変換後は、手作業で整形して下さい。

対応機能
  • HTML文書を、 PukiWiki な文章に変換を支援する機能
  • 文章のコピー&ペースト作業の軽減
  • 文章の整形作業の軽減
  • 画像ファイルの attach への保管機能
  • 利用していた画像などの添付作業の軽減
  • フォトアルバム作成機能
  • 画像のみ添付した文書の作成

定義

CACHE_DIR

./cache/

キャッシュディレクトリを定義

UPLOAD_DIR

./attach/

アップロードディレクトリを定義(#refと同じに)

DATA_DIR

./wiki/

データの格納ディレクトリ(pukiwiki.ini.phpの定義を使用)

変換後必要となるかもしれないプラグイン

#aname
#ref
#pre

制約事項(言い訳)明確な箇所のみ記述。

  • ヘッダータグの見做し変換

    PukiWiki では、<h2>から<h4>のみユーザ利用可能であるため、

    <h1>、<h5>、<h6>は見做し

変換前変換後見做し
<h1>*<h2>
<h2>*見做しなし
<h3>**見做しなし
<h4>***見做しなし
<h5>***<h4>
<h6>***<h4>
  • <pre>を、正しく認識していないHTML記述があると、おかしくなる

    そもそも対応はいい加減

  • タグの暗黙的な終了に関しての取り扱いがいい加減

    ブラウザが柔軟に対応されていることもあり、DTDから解析しても意味があまりないため

  • </td>無しの場合の取り扱い
  • <font>の入れ子の取り扱い
  • mailto: の取り扱い
  • ?body= などは無視
  • mailto: に画像がある場合は捨て
  •   などの文字の取り扱いは不完全(レアーな文字は捨て)
  • &#xxxx; などのコード指定の変換も不完全(文字コードによっては表示不可文字もあるため)
  • <table>に関しての取り扱い

    <table>の入れ子を無視

    現状の PukiWiki では、表組に限界があるため

  • rawspanやcolspanを無視

    ぱんだ さんが実験中であるものの...

  • alignを無視

    表中に画像などがあると、体裁を大きく崩します

    プラグインは、行頭にある必要があり、唯一な行でないといけないため

  • attach先ページ 画像ファイル名がコンフリクトする場合もあるため、常に変換先ページに添付します
  • RecentChanges に未対応
  • ページを生成しても更新しない(文書は、HTMLキャッシュ取得日時と一致させます)

コメント

  • このプラグインは開発が停止しているとの告知が入っており、現在は公開も停止されています。ライセンスの確認を含めた今後の対応について確認中です(See upk) -- henoheno 2006-03-31 (金) 00:39:59

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2009-05-17 (日) 20:13:24
Site admin: PukiWiki Development Team

PukiWiki 1.5.2+ © 2001-2019 PukiWiki Development Team. Powered by PHP 5.6.40-0+deb8u7. HTML convert time: 0.229 sec.

OSDN