« WEB小説をブックリーダで読む:画面の見やすさって難しい その2 | トップページ | 屏風の出番の季節がやってきた »

2016年11月18日 (金)

Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V105_0

2016-11-18(金)晴れ
  WEB小説(今のターゲットは「小説家になろう」のサ イ トですが)をダウンロードして、テキストファイルで格納するPythonスクリプトを弄りました。今回の変更は、縦書きPDFへの変換をChainLPというアプリで実施するように変えたので、それに適したように変えたものです。もっとも、ChainLPで行うからといっても、変更しなければならない、という点はないのですが、この際だから使いやすいように、いくつか変更しました。相変わらず、いまさらなスクリプトを弄っています。

変更点: (面倒なのでテキストファイルの来歴を、、、)
(1)htmlタグを残したままのファイルを作成する処理を追加した。
(2)datファイルがないときのオプション指定手入力項目にいくつか追加した。
(3)改行のみの行(空白行)を全部削除する処理を追加した。
(4)表紙ページ(題名、作者部分)の最後に[#改ページ]を追加するようにした。
  (ChainLPで縦書きPDFに変換するときのため)

 (1)はルビ処理など、フォーマット指定の処理を完全に行えるように、html形式のまま出力できるようにしておくものです。これをChainLPに入力すると、普通の縦書き文書に変換されます。
 (3)はWEB小説では欲しくなるときがある機能です。WEB小説では、1行ごとに空白行を1行挟む書き方の方もいます。これは、ブックリーダで読むときには非常に読みにくい場合があります。1ページに表示される行数が少なくて、ページめくりばかりが忙しい場合があるのです。ただ、空白行が全くなくなると読みにくい小説もあるので、オプション化しました。(通常は、複数行続いていても1行に圧縮しています。)
 (4)は表紙ページから本文に移るときに改ページするためです。

 本当は要らない部分を削って簡単にしたいのですが、今まであった機能も、いつか使うかも、、と思って削れないんですね。一応、機能追加の形で変更しています。

今までのPyBookGet記事へのリンク一覧は「Pythonスクリプト雑記」に載せました。
  「Pythonスクリプト雑記」 の
   「43.1 WEB小説のデータ取得 PyBookGet

-------------------------------------------------------
 モジュール
  「PyBookGet_105_0.zip」   

-------------------------------------------------------

|

« WEB小説をブックリーダで読む:画面の見やすさって難しい その2 | トップページ | 屏風の出番の季節がやってきた »

Python」カテゴリの記事

アプリケーション」カテゴリの記事

携帯電話」カテゴリの記事

書籍・雑誌」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/513620/64510791

この記事へのトラックバック一覧です: Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V105_0:

« WEB小説をブックリーダで読む:画面の見やすさって難しい その2 | トップページ | 屏風の出番の季節がやってきた »