« PyAoMobi 青空文庫ルビタグ処理スクリプト (1)補遺 | トップページ | ケンウッド音質マイスター講座 LP編(2) »

2010年4月 6日 (火)

PyAoMobi 青空文庫ルビタグ処理スクリプト (2)

2010-04-06(火)晴れ

 先日の「PyAoMobi 青空文庫ルビタグ処理スクリプト (1)」で書いた「題記」のスクリプトですが改訂しました。

改訂内容概略

 (1)下記の3種類のルビタグに対応させました。
    ・<ruby>のHTMLファイル
    ・<!R> のHTMLファイル
    ・《》 のテキストファイル

 (2)上記3種類を自動判別して処理するようにしました。

 (3) 正常終了したときに、入力ファイルをアーカイブフォルダに移す処理を追加
   しました。 (使用有無はオプションで指定します)。

 ちょこまかと先ほどまで変更を繰り返したので、テストが足りているかどうか悩ましいところですが、今日書かないと随分と先になりそうなので記事にしました。自分用としては、便利になったと思っています。E52は青空文庫専用になりそうです。

■やるかどうか分からない課題
 入力ファイル選択画面で複数ファイルを選択して、まとめて処理する方式にする。
 選択や結果表示のやり方としては、以前作った PyresizeJpg と同じなので簡単
 かなとは思いますが、自分としてはひとつずつでも問題ないので課題のままかも
 しれません、、、。

----- モジュール --------------------------------------------------

  「PyAoMobi_002_0.zip」  (注)

(注):「・《》 のテキストファイル」 の変換ではうまく動かないケースがあります。このフォーマットについては、次のバージョンで改訂予定です。 2010-04-08 追記 )

  PyAoMobi_002_1 に改訂しました。(2010-04-13)
 記事はこちらです。
  「PyAoMobi 青空文庫ルビタグ処理スクリプト (3)

------------------------------------------------------------------

 

|

« PyAoMobi 青空文庫ルビタグ処理スクリプト (1)補遺 | トップページ | ケンウッド音質マイスター講座 LP編(2) »

Python」カテゴリの記事

アプリケーション」カテゴリの記事

携帯電話」カテゴリの記事

コメント

ご苦労様です。
早速試してみました。「吾輩は猫である」のtextを変換してみました。E71で53秒でhtmlの64秒よりファイルサイズが小さい分だけ処理時間は短かかったです。
テキストのルビ範囲をどう処理しているのかなと思ったら、直前の1文字を取っているのですね。
青空文庫のテキストではルビ範囲の頭に"|"を付けるのが決まりらしいですが、「吾輩は・・・」でも付いてあったり、付いてなかったりできちんとは守られてい内容ですね。自分的にはhtmlを変換する方がやっぱり好きです。

投稿: レオナパパ | 2010年4月 7日 (水) 21時23分

レオナパパ さん、どもです。
漢字が続く場合は|が入るのですが、直前が漢字でない場合は入らないようです。

最近は、ほとんどHTMLファイル(rubyタグ,
!Rタグいずれかに形式になりますが)があるので、テキスト版を使うことは殆どないと思います。また、ルビを隠すのが主目的だったので、今回のテキスト版は、当面これで良いかなと思います(ただ、説明書に書き忘れました)。
ルビ範囲を取り出すテストをしているので、処理時間が余り長くならないようであれば入れてみたいなとは思っています。

投稿: masa | 2010年4月 8日 (木) 10時40分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/513620/48016001

この記事へのトラックバック一覧です: PyAoMobi 青空文庫ルビタグ処理スクリプト (2):

« PyAoMobi 青空文庫ルビタグ処理スクリプト (1)補遺 | トップページ | ケンウッド音質マイスター講座 LP編(2) »