**html2pw.inc.php [#o1f6c123] |RIGHT:100|LEFT:360|c |~サマリ|showhtmlのキャッシュからPukiWiki文書の変換を試みる| |~リビジョン|1.0| |~対応バージョン|1.4| |~投稿者|[[upk]]| |~投稿日|&new{2003-10-28 (TUE) 01:00:30};| ***掲載先 [#n36fbcf1] -[http://briefcase.yahoo.co.jp/katsumi_saitou/ 斎藤家のフォルダ] ***html2pw.inc.php [#d9fcfaba] :説明| ~showhtml で取り込んだ、画像とHTMLを元に、PukiWiki の文書またはフォトアルバムとして取り込むように試みるプラグイン。 ~showcache プラグインから起動されることを想定しています。 ~※このプラグイン単体では、HTMLも画像も取得する機能はありません。 :補足| ~あくまでも、HTMLから PukiWiki への移行を支援する目的であり、 ~変換して、そのままでの利用は、恐らく無理だと思います。 ~変換後は、手作業で整形して下さい。 :対応機能| --HTML文書を、 PukiWiki な文章に変換を支援する機能 --文章のコピー&ペースト作業の軽減 --文章の整形作業の軽減 --画像ファイルの attach への保管機能 --利用していた画像などの添付作業の軽減 --フォトアルバム作成機能 --画像のみ添付した文書の作成 ***定義 [#a550aff4] :CACHE_DIR| ~./cache/ ~キャッシュディレクトリを定義 :UPLOAD_DIR| ~./attach/ ~アップロードディレクトリを定義(#refと同じに) :DATA_DIR| ~./wiki/ ~データの格納ディレクトリ(pukiwiki.ini.phpの定義を使用) ***変換後必要となるかもしれないプラグイン [#e543019d] #aname #ref #pre ***制約事項(言い訳)明確な箇所のみ記述。 [#g8c2afe1] -ヘッダータグの見做し変換 ~PukiWiki では、<h2>から<h4>のみユーザ利用可能であるため、 ~<h1>、<h5>、<h6>は見做し ,変換前, 変換後 ,見做し ,<h1>, * ,<h2> ,<h2>, * ,見做しなし ,<h3>, ** ,見做しなし ,<h4>, *** ,見做しなし ,<h5>, *** ,<h4> ,<h6>, *** ,<h4> -<pre>を、正しく認識していないHTML記述があると、おかしくなる ~そもそも対応はいい加減 -タグの暗黙的な終了に関しての取り扱いがいい加減 ~ブラウザが柔軟に対応されていることもあり、DTDから解析しても意味があまりないため -</td>無しの場合の取り扱い -<font>の入れ子の取り扱い -mailto: の取り扱い -?body= などは無視 -mailto: に画像がある場合は捨て - などの文字の取り扱いは不完全(レアーな文字は捨て) -&#xxxx; などのコード指定の変換も不完全(文字コードによっては表示不可文字もあるため) -<table>に関しての取り扱い ~<table>の入れ子を無視 ~現状の PukiWiki では、表組に限界があるため -rawspanやcolspanを無視 ~ぱんだ さんが実験中であるものの... -alignを無視 ~表中に画像などがあると、体裁を大きく崩します ~プラグインは、行頭にある必要があり、唯一な行でないといけないため -attach先ページ 画像ファイル名がコンフリクトする場合もあるため、常に変換先ページに添付します -RecentChanges に未対応 -ページを生成しても更新しない(文書は、HTMLキャッシュ取得日時と一致させます)