« 横浜駅で迷ってしまったぞ、、 | トップページ | ギターサークル、今年初の練習日 »

2016年1月30日 (土)

Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V003_1

2016-01-30(土)雨、寒い

 今更ながらの、Nokia携帯電話上のPythonスクリプトですが、ちまちまと弄っています。WEBサイトからWEB小説をダウンロードする、PyBookGetを更新しました。

 前回の記事「Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V003_0

 この、「PyBookGet」というアプリは、web小説のサイト(具体的な対象は、「小説家になろう」のサイトです)から、指定したWEBページのテキストを読み込んでファイルに格納するアプリです。即ち、指定したURLのページから、そのページのテキストファイルを読み込んで、不要部分を削除して小説の文章だけにして個別ファイルに格納します。

 で、当初に対象としていた「本好きの下剋上」以外の小説をダウンロードしようとしたら動きませんでした。上記動作で、小説部分のみの切り出しが動かないようです。WEBのページには、広告やら色々な文章も含まれているので、小説データだけを取り出そうとしています。
 この、小説部分の先頭、終了部分を検出する検索文字列が、別の小説のページでは存在していませんでした。
 そこで、どの小説のページでも存在していそうな共通の検索文字列を検討して、変更しました。

変更内容:
 「本好きの下剋上」以外の小説ページだと、動作しない場合があったので修正しました。

 本当は、書籍化されたものを読むのが良いのですが、全部が全部、本で買いたいほどでもない場合があります(結構な出費になりますし)。そこで少し、このスクリプトを活用してみようかと思っています。まず目を通してみようかなとおもう小説は、これでダウンロードして、ブックリーダに転送すれば、とりあえず読むことは出来ます。
 ということで、更に改造を検討中です。

------------------------------------------------------
 モジュール  「PyBookGet_003_1.zip」  
                  (2016-02-01差し替え実施
                    ダウンロード先ディレクトリ名をテスト用
                    にしていたため、元に戻しました。) 

-------------------------------------------------------

|

« 横浜駅で迷ってしまったぞ、、 | トップページ | ギターサークル、今年初の練習日 »

Python」カテゴリの記事

アプリケーション」カテゴリの記事

携帯電話」カテゴリの記事

書籍・雑誌」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/513620/63145157

この記事へのトラックバック一覧です: Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V003_1:

« 横浜駅で迷ってしまったぞ、、 | トップページ | ギターサークル、今年初の練習日 »