Pythonスクリプト:久々にスクリプトを弄った(PyBookGet_115_0)
2024-09-26(木)晴れ/曇り、夕方から曇り
何日間か、久々にPythonスクリプトを弄りました。久々に動かしてみたら動かないので対策しようとしました。動かなくなっていたところを探して修正しようとしたのですが、すっかり忘れていました。忘れているのは、対象のPythonスクリプトの中の作りとPythonの仕様です。
WEB小説は、主に「小説家になろう」サイトのものを、Nokia携帯電話のPythonスクリプト「PyBookGet」でダウンロードして、「ChainLP」というアプリで縦書きPDFファイルにして、Sony Readerで読んでいます。
このダウンロード時に、HTMLテキストから必要な部分を検出して小説のテキストを取り出したり、必要な形に編集します。それにはHTMLタグを検出して行います。調べてみたら、この、前書き部分、小説本文、後書き部分などを示すタグ部分の記述が変更されていました。それで、動かなくなったわけです。Pythonスクリプトにトレース用のprint文を入れて調査しました。何とか調査して、対応させることができました。
このスクリプトは、前回変更したときにドキュメントを記述してなかったので、段々と分かりにくくなってきています。段々と困りそうだなと思った日でした。
最近のコメント