« 紫陽花の季節も過ぎたかな | トップページ | 地区の公民館主催 「カントリーとフォークの休日」 に行ってきた »

2016年7月 2日 (土)

Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V104_1

2016-07-02(土)曇り/晴れ

   また、Nokia携帯電話で使うPythonスクリプトを弄ってみました。このスクリプトは、WEB小説(今のターゲットは「小説家になろう」のサ イ トですが)をダウンロードして、テキストファイルで格納するものです。動作上は、今までのバージョンと変わらないのですが、少しだけ手直ししてみました。変更はチョビっとしたものですが、忘れないうちにしておくことにしました。
 最初の記事 「Python: WEB小説のデータ取得スクリプト PyBookGet
 前回の記事 「Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V104_0

 ダウンロードしたWEB小説のファイルは、PDF化前に、若干の編集を行います。記号の変換とか、改行のみの行が多いときは少なくするとか、、。以前は、ダウンロード後にテキストエディタで編集していましたが、毎回行う編集はダウンロード時に自動で行うように処理を入れ込んでいます。ただ、色々なWEB小説をダウンロードしていると、色々なケースが出てきます。その為、時々変更したくなったり、変更しないと動かなかったり、、というケースも出てきます。そんなケースでした。

変更内容
 ・「スペースのみの行」のスペース削除がうまくいかなかったため、検出の
  正規表現を修正した。
    旧: ("\n[  ]+\n")  #[ ]内は、全角と半角のスペース
    新: ("[  ]+?\n")   #[ ]内は、全角と半角のスペース

--------------------------------------------------------------
モジュール
     「PyBookGet_104_1.zip」  
--------------------------------------------------------------

 

|

« 紫陽花の季節も過ぎたかな | トップページ | 地区の公民館主催 「カントリーとフォークの休日」 に行ってきた »

Python」カテゴリの記事

アプリケーション」カテゴリの記事

パソコン・インターネット」カテゴリの記事

携帯電話」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/513620/63862336

この記事へのトラックバック一覧です: Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V104_1:

« 紫陽花の季節も過ぎたかな | トップページ | 地区の公民館主催 「カントリーとフォークの休日」 に行ってきた »