« 花粉は最盛期なのか | トップページ | Facebookについて勉強中 その2 »

2016年3月18日 (金)

Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V103_0

2016-03-18(金)晴れ、のち曇り

 相変わらず、Nokia携帯電話で使うPythonスクリプトを弄っています。このスクリプトは、WEB小説(今のターゲットは「小説家になろう」のサイ トですが)をダウンロードして、テキストファイルで格納するものです。今までのバージョンでも問題はありませんが、出力ファイルの中のフォーマットを、少し整えてから出力するようにしました。これは、青空文庫を縦書きPDFファイルにして 読むサイトを利用するときに便利なようにしたものです。

  前回の記事 「Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V102_0

主な変更は
 ・空行(改行のみ、またはスペースと改行のみの行)が3行以上続くときは2行に
  するようにした(無駄なページ送りを減らして読みやすくするため)。
 ・ライブラリ用出力2の場合、青空文庫形式にするため、マージしたファルの先頭に
  題名行、作者行、空行2行を入れるようにした。
 ・ライブラリ用出力2の場合、マージしたファルの最後に【本文終わり】を入れる
  ようにした。

 大体は、青空文庫を縦書きPDFファイルにして 読むサイトを利用するときに便利になります。一番便利なのは、ダウンロードした後に個別に編集してフォーマットを整える必要が無くなりました。文書容量の大きな小説は、ファイルを沢山のファイルに分ける必要がありますが、それらを一つ一つ編集する手間が無くなりました。ダウンロード指定ファイルから必要なデータを切り出して、ファイルのヘッダに挿入するようにしました。

たとえば
Pybookget10

 のような指定データにすると、

Pybookget11

 このように、先頭部分のフォーマットを整えて出力するようにしました。

 テストとして、色々とダウンロードしてみていますが、概ね、これで良いかなと思う動きになりました。

 ただ、個人的には、小説そのものは本になったものを読んだ方が良いかなと思う気持ちも、大分あります。それは、本にする段階での手入れで、まとまりが良くなったり、幹への枝葉付けが良くなっているように思うからです。まあ、読む方は、どういうメリット(連載中のものを早く読めるとか、、)を重視するかで選ぶべきかなと思います。 

-----------------------------------------------------------
モジュール
    「PyBookGet_103_0.zip」  

-----------------------------------------------------------
 

|

« 花粉は最盛期なのか | トップページ | Facebookについて勉強中 その2 »

Python」カテゴリの記事

アプリケーション」カテゴリの記事

携帯電話」カテゴリの記事

書籍・雑誌」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/513620/63363571

この記事へのトラックバック一覧です: Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V103_0:

« 花粉は最盛期なのか | トップページ | Facebookについて勉強中 その2 »