フクの非日常

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Kindleの語数カウント

洋書のペーパーバックの語数を数えるにはおおよそのアプローチ方法がわかっている。1ページあたりのだいたいの語数を出して、ページ数を掛けると一冊の語数が計算できる。それをKindleでやろうとすると同じ手段が使えない。なぜか。。。?

Kindle上の本はページを持たず、location番号という概念を採用している。このため、本と同じように「ページ」を扱うアプローチではうまくいかない。なんでそんな面倒なことを・・・と思うのだがそれには理由があるそうだ。KindleはKindle FireやiPhone, iPadのように異なるプラットフォームの上で動作している。このため、1画面に表示できる文字数がそれぞれ異なり、同じ1ページを捲ってもプラットフォーム毎に異なる進み方をしてしまう。そもそも、1つのメディアの中でもフォントサイズを変えることができるから、1ページの文字数は可変になってしまい、何ページという表現ができない。このような理由でlocation番号を持っているようだ。

location番号がページに変わる概念であることは間違いない。では、なぜ同じように1ページ→1locationとして語数を数えることができないのか?理由は、locationの定義が良くわからないからである。byte数、文の数などなど諸説あるが、場合によっては挿絵1ページが1つのlocationに割当てられる場合などがあり、きっちり1location=xx wordとはいかないようだ。

それでもlocation番号をページを数えるのに使わない手はない。そこで1つ、試しに考えてみた方法がある。まだサンプル数が少なくて色んな種類の本で検証はできていないのだが、ペーパーバックにはなんとか使えそうな感触がある。その方法とは、次のようなものである。

(1) 最初に文字の大きさを固定する。例えば、最小の文字サイズにする。
(2) 1画面に表示される文字数の平均値を求める。
iPhone/iTouchの場合、文字を最小にすると120~140 wordになる。
これはやはり会話文が多いと改行が多く、文字数が少なくなるため複数ページでサンプリングをする。
(3) 1画面進めると、location番号が幾つ進むか計算する。
(1画面でlocationが1進むわけではないところが問題!)
計算の仕方として、10画面進めてlocation番号の進みを数え、10で割った数を1画面あたりのlocation数とする。
(4) 全体のlocation数を(3)で出したlocation数で割り、全体の画面数を出す。
全体の画面数に(2)で出した1画面の文字数を掛けて、全体の語数を出す。

精度のほうは検証できていないが、他の方法で調べた数字に比べると、10%程度の差がでている。大づかみの数は出せそうな感触がある。工夫のしかたとしては、(1)で固定する画面を、文字を大きくした方が精度が高いか、小さくした方が良いのか。(2)の画面内の文字数の数え方などがある。まだまだ試行が必要である。

コメント


管理者にだけ表示を許可する
 

 

トラックバック

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。