« 今日、明日は ハムフェア(2016) だが、、 | トップページ | 台風9号 »

2016年8月21日 (日)

WEB小説を縦書きPDF化して読む、、、ときの悩み その1

2016-08-21(日)曇り/晴れ

 暫く前から書いていますが、WEB小説をブックリーダで読んでいます。PyBookGetスクリプトでダウンロードしてファイルに纏め、若干の処理を加えたファイルを縦書きPDFに変換して読んでいます。その辺については、色々と書いてきました。さて、ここで文字の問題、特に漢字や記号の問題が出てきました。これは、一部の漢字や記号などが、うまく縦書きPDF化されないという点で、以前の記事でも書きました。
   以前の記事 「漢字って難しい、、似て非なる文字
           「Python: WEB小説のデータ取得スクリプト PyBookGet 更新 V104_2

 現在、縦書きPDFに変換してくれるサイトについては、下記の2サイトを把握しています。いずれも、個人的に読むもの程度の変換については、使用に問題はないと書かれていますので、有り難く利用させていただいています。

(1)青空キンドル[Beta]

(2)株式会社シメケン 小説用縦書きPDFジェネレーター

上記(1)は、青空文庫を縦書きPDF化してキンドルで読むため、、ということで運用されている個人サイトです。
(2)は同人誌や個人の書籍化等を行う会社のようですが、そのときの入稿原稿作成用らしいです。ただし、それ以外にも、個人が読むためのファイル変換程度は許可されています。

 さて、上記はそれぞれの目的、対象が違いますので、私の目的(WEB小説をブックリーダで読む)からすると、一長一短があります。その一長一短と、現状の対応についてメモしてみました。

1.青空キンドル
 このサイトは、前記のごとく青空文庫をキンドルで読むのが目的です。従って、1ページがブックリーダの画面に収まると共に、文字の大きさもブックリーダで読むのに都合の良い大きさです。
 しかし、(青空文庫が対象だから)ベースとなる文字コードがShift-JISなどのファイルが対象らしく、WEB小説(UTF-8コード)に時々ある、UTF-8からShift-JISに変換できない文字などは、PDFファイルでは文字そのものが無くなってしまいます。一文字くらい抜けても意味は通じますが、何となくすっきりしない思いはあります。その他にも、うまく変換できない文字があるようです。
 一例を挙げると

Webtxtpdf01

 上記を変換すると、下のようになります。空白になったり、縦書きにならなくなったり、文字が無くなったりします。2グループ目の上の行の都(JIS第3水準)は、「者」の中に点がある文字です。

Webtxtpdf03

 ということで、現在は、PyBookGetでダウンロードしたUTF-8コードのファイルを、テキストエディタで開いてから、一度Shift-JISコードでセーブしてみます。このとき、変換できないコードは指摘されますので、JIS第1水準の漢字などに変更します。これでも、上記のようなJIS第3水準の文字などの件はでる可能性がありますが、気がついたときに直すしかにかなと思います。現状は概ね、これで使用しています。

次回は、(2)株式会社シメケン 小説用縦書きPDFジェネレーター の一長一短です。
 

|

« 今日、明日は ハムフェア(2016) だが、、 | トップページ | 台風9号 »

パソコン・インターネット」カテゴリの記事

書籍・雑誌」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/513620/64089941

この記事へのトラックバック一覧です: WEB小説を縦書きPDF化して読む、、、ときの悩み その1:

« 今日、明日は ハムフェア(2016) だが、、 | トップページ | 台風9号 »