« 危ない、忘れ物をした、、 | トップページ | 草は直ぐ伸びてくる »

2024年5月 9日 (木)

Pythonスクリプト:久々にスクリプトを弄った(PyBookGet_114_0)

2024-05-09(木)曇り/晴れ、朝は小雨

 久々にPythonスクリプトを弄りました。動かなくなっていたところを修正しようとしたのですが、すっかり忘れていました。忘れているのは、対象のPythonスクリプトの中とPythonの仕様です。

 WEB小説は、主に「小説家になろう」サイトのものを、Pythonスクリプト「PyBookGet」でダウンロードして、「ChainLP」というアプリで縦書きPDFファイルにして、Sony Readerで読んでいます。このダウンロード時に、HTMLのルビタグ部分を検出して青空文庫のルビフォーマットにしています。これで、PDFファイル化したときにルビになります。
 この、HTMLのルビタグから青空文庫のルビフォーマットへの変換がうまくいかなくなったようです。HTMLのままのファイルを覗いて調べたところ、ルビタグの使用方法が変わったようでした。具体的に言うと<rb>と</rb>のタグが使用されなくなったようです。

--------------------------------------------------------------------
以前のルビタグ
<ruby><rb>国王陛下</rb><rp>(</rp><rt>父上</rt><rp>)</rp></ruby>、

現在のルビタグ
<ruby>国王陛下<rp>(</rp><rt>父上</rt><rp>)</rp></ruby>、

青空文庫のルビフォーマット
|国王陛下《父上》

---------------------------------------------------------------------

 スクリプトでは<rb>、</rb>がある前提で検索しているので検索できなくなったわけです。とりあえず、有っても無くても動くようにしました。
 このスクリプトは、前回変更したときにドキュメントを記述してあったので分かりましたが、ドキュメントを記述してないスクリプトは困りそうだなと思った日でした。

 

|

« 危ない、忘れ物をした、、 | トップページ | 草は直ぐ伸びてくる »

携帯電話」カテゴリの記事

Python」カテゴリの記事

アプリケーション」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




« 危ない、忘れ物をした、、 | トップページ | 草は直ぐ伸びてくる »