[掲示板: 〈過去ログ〉YL・語数・書評システム情報 -- 最新メッセージID: 1253 // 時刻: 2024/11/24(00:16)]
上へ | 前のメッセージへ | 次のメッセージへ | ここから後の返答を全表示 | 返答を書き込む | 訂正する | 削除する
お名前: たむ
投稿日: 2005/7/31(13:36)
------------------------------
こんにちは。たむ2です。 前回、14冊の本を選びましたので、それぞれについて 「単純比例計算」をしてみます。2頁、3頁…と語数を 積算して、それぞれの頁で比例計算して、本の総語数を 推測してみるわけです。10頁までやってみました。 その前に、…電子データというのでしょうか、出版社発表の 総語数とアマゾン・アメリカに出ている総語数が違うことが わかりました。確認したのはMatildaだけですが、ほかの 本でも違うものがありそうです。 それも結構差があるようで…。どうしたらいいのか分かりません。 仕方がないので、しらべたままの数字でで話しをすすめることに します。 以下、途中を省略して結果だけ、誤差だけをパーセントで 示します。 ◆(1) Cold Mountain PB, 挿絵なし -21.9, -5.7, 2.3, 5.1, 6.9, 5.0, 4.7, 5.1, 5.5, 5.6 ◆(2) The Blue Bedroom & Other Stories PB, 挿絵なし -31.4, -9.7, -4.3, -2.1, -1.2, -0.8, 1.8, 2.6, 1.2, 1.5 ◆(3) The Sky is Falling PB, 挿絵なし -72.8, -64.3, -53.3, -37.3, -27.5, -19.3, -14.3, -9.3, -6.1, -6.1 ◆(4) The Best Laid Plans PB, 挿絵なし -58.5, -27.0, -9.2, -6.3, -3.0, -0.2, 2.5, 3.7, 4.3, 5.9 ◆(5) These Happy Golden Years PB / 児童書, 挿絵あり -41.9, -13.7, -3.1, 3.7, 3.3, 6.5, 6.1, 7.0, 9.1, 7.0 ◆(6) Little House in the Big Woods PB / 児童書, 挿絵あり -45.4, -8.8, -1.9, 4.7, 8.5, 12.6, 12.7, 1.1, -3.3, -0.6 ◆(7) Lily’s Crossing 児童書、挿絵なし -57.4, -14.0, 1.0, 7.8, 8.6, 4.8, -3.9, 0.2, 2.4, 4.5 ◆(8) Holes 児童書、挿絵なし -21.6, -24.3, -33.8, -30.7, -19.1, -12.1, -5.8, -6.8, -8.6, -3.8 ◆(9) Afternoon on the Amazon 児童書、挿絵あり 5.2, 19.3, 5.2, 11.9, -5.3, 2.5, -0.4, 3.5, 7.0, -3.7 ◆(10) Matilda 児童書、挿絵あり -43.0, -33.5, -33.9, -15.0, -14.6, -12.0, -5.1, -17.0, -10.0, -5.2 ◆(11) Two Lives GR, 挿絵なし -34.7, -28.5, -10.1, -5.8, 0.6, -8.1, -7.0, -4.5, -4.3, -2.9 ◆(12) About a Boy GR, 挿絵なし -1.8, -1.3, -4.5, -3.9, 0.2, -0.1, 1.7, 1.8, 3.0, 2.8 ◆(13) The Canterville Ghost GR, 挿絵あり -39.0, 13.7, 35.7, 7.9, 20.9, 13.3, 5.2, 6.9, 4.3, 12.0 ◆(14) A Dubious Legacy GR, 挿絵あり -7.1, -4.1, 3.1, -22.7, -13.5, -6.7, -3.4, 0.3, 0.4, -1.3 なんだか見にくいので、おのおの3頁での誤差をみると、 ◆(1) Cold Mountain PB, 挿絵なし +2.3% ◆(2) The Blue Bedroom & Other Stories PB, 挿絵なし −4.3% ◆(3) The Sky is Falling PB, 挿絵なし −53.3% ◆(4) The Best Laid Plans PB, 挿絵なし −9.2% ◆(5) These Happy Golden Years PB / 児童書, 挿絵あり −3.1% ◆(6) Little House in the Big Woods PB / 児童書, 挿絵あり −1.9% ◆(7) Lily’s Crossing 児童書、挿絵なし +1.0% ◆(8) Holes 児童書、挿絵なし −33.8% ◆(9) Afternoon on the Amazon 児童書、挿絵あり +5.2% ◆(10) Matilda 児童書、挿絵あり −33.9% ◆(11) Two Lives GR, 挿絵なし −10.1% ◆(12) About a Boy GR, 挿絵なし −4.5% ◆(13) The Canterville Ghost GR, 挿絵あり +35.7% ◆(14) A Dubious Legacy GR, 挿絵あり +3.1% これを見ると、どうも大当たりと大はずれに二分されるようです。 (1), (2), (5), (6), (7), (9), (12), (14)の8冊は5%台に収まり、 10%台までだと、これらに (4), (11)が加わり10冊になります。 一方、(3)−53.3%, (8)−33.8%, (10)−33.9%, (13) 35.7%の 4冊は大はずれです。 挿絵があるかないかは関係ないようですね。大きくはずれた もの、(3)挿絵なし、(8)挿絵なし、(10)挿絵あり、(13)挿絵あり、 になっています。あたり(誤差5%台)も挿絵あり・なしはほぼ 半分ずつです。 それから、「最初の3頁」をすすめて、4頁、5頁…とすすんだら どうなるか(上の最初の表にでているわけですが)、見やすく してみると、 本 3頁 4頁 5頁 (1) 2.3 5.1 6.9 (2) -4.3 -2.1 -1.2 (3) -53.3 -37.3 -27.5 (4) -9.2 -6.3 -3 (5) -3.1 3.7 3.3 (6) -1.9 4.7 8.5 (7) 1.0 7.8 8.6 (8) -33.8 -30.7 -19.1 (9) 5.2 11.9 -5.3 (10) -33.9 -15.0 -14.6 (11) -10.1 -5.8 0.6 (12) -4.5 -3.9 0.2 (13) 35.7 7.9 20.9 (14) 3.1 -22.7 -13.5 誤差が直線的に少なくなっている例は、(2), (3), (4), (8), (10), (11), (12)の7例です。半分は誤差が改善しますが、残りの半分は誤差が少なく なるわけではない、といえます。 また、全体として、大はずれという観点(誤差11%以上)からみると、 3頁4例、4頁5例、5頁5例と、誤差が少なくなるわけではない。 さて、総語数計算法という点からみると、この単純比例計算は 使えません。10対4、70%くらいはあたる(誤差10%台以内)とは いえ、あらかじめその70%がどの本かわからなければ、一般的な方法 として使えないからです。 しかしまた、どうしてこんな簡単な計算でけっこう当たるのか、 というふうにも考えてみることはできます。 形式的なことをいえば、それは、サンプル部分(最初の3頁)の 語数が、本全体の、なんというか、「文字の散らばりぐあい」に 似ていた、ということになるでしょう。そうとしか言いようがない。 そこで、この「文字の散らばりぐあい」が、本をにらんで みたら分かるものなのかどうか。この点を次回、考えてみたい と思います。 長々と…読んでいただいてありがとうございます。
▲返答元
▼返答