« ジェネリック医薬品を使うか悩む | トップページ | 文化会館前、8月15日に向けての催し »

2015年8月12日 (水)

Python: WEB小説のデータ取得スクリプト PyBookGet

  2015-08-12(水)晴れ/曇り

 先日、WEB小説の第一部が本で出版されたものを読んだ話を書きました。
  「WEB小説と本」 (本好きの下克上)

 まだ、第一部の3冊のうち、2冊しか読み終わっていません(図書館で借りて読んでいるが、予約者が多いので)。WEB上では、第四部まで進んでいます。それで、WEBで読もうかなと思ったときに、携帯電話で読むためのツールの作成(Pythonスクリプト)を思いつきました。もちろん、携帯電話のWEBブラウザで普通に読めますが、読み進みながらダウンロードしていると、人の多いところではダウンロード速度が遅かったりしますし、読むときには本文テキストだけ画面に表示したいのです。

 そこで、2つのアプリを考えました。
 (1)小説データをダウンロードし、余分な部分を削除するツール。
 (2)上記でダウンロードしてあるデータをリスト表示して、選択したファイルを
   オープンするアプリ
です。
 無くても困らないアプリですが、せっかく思いついたので作成してみました。もはや、小説を読む方ではなく、ツール作成が目的化しています。

------------------------------------------------------------------
 まずは PyBookGet.py です。これは、上記(1)のツールです。同梱テキストから抜粋を載せると下記のようになります。

1.概要
   この、「PyBookGet」というアプリは、web小説のサイトから、指定したページ
  のテキストを読み込んでファイルに格納するアプリです。即ち、指定したURLの
  ページから、そのページのテキストファイルを読み込んで、不要部分を削除して
  から個別ファイルに格納します。

   具体的には、このバージョンは「本好きの下克上」のサイトからテキストデータ
  を取得するためのアプリです。(他のサイトに適用するときには、内容を修正して
  使用するための元アプリにします。)

 即ち、このバージョンは「本好きの下克上」のサイト専用です。

 詳細(それほど詳細ではないが)は同梱テキストを見てください。(モジュールは一番下です。)

Ssce0645a  Ssce0646a

 上図左は起動したところで、使用するアクセスポイントをきいてきます。右は、ダウンロードを開始するテキストの番号の入力です。次の画面で最後の番号を入力します。

Ssce0647a

 指定した3つのテキスト(1~3)の読み込みが完了したところです。画面の表示がPythonの画面そのものなのは、「本好きの下克上」のサイト専用で、全部ダウンロードしたら使用しなくなるので手抜きです。

 とりあえず、動くようになりました。ただ、やはり携帯電話の画面で読むかどうかは不明です。

-----------------------------------------------------
 モジュール
    「PyBookGet_001_1.zip」   (注1)  若干変更したので追加しました。 

    詳細はこちらです。
    「Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V001_1

  注1:中のindex.htmのデータがおかしかったので、index.htmのみ差し替えました。
     2015-08-26

   「PyBookGet_001_0.zip」 

   「index.htm」をダウンロード  (追加、追記 2015-08-13)(新モジュールには同梱)

    index.htmは、各ファイルへのリンクを記入した目次ページです。
    小説データをダウンロードしたディレクトリ(E:\Library\honzuki\)へ
    入れてください。入れなくても問題有りませんが、入れておくと読むときに
    便利かもしれません。
------------------------------------------------------
 

|

« ジェネリック医薬品を使うか悩む | トップページ | 文化会館前、8月15日に向けての催し »

Python」カテゴリの記事

アプリケーション」カテゴリの記事

携帯電話」カテゴリの記事

書籍・雑誌」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/513620/62070037

この記事へのトラックバック一覧です: Python: WEB小説のデータ取得スクリプト PyBookGet:

« ジェネリック医薬品を使うか悩む | トップページ | 文化会館前、8月15日に向けての催し »