総語数の計算(13)

[掲示板: 〈過去ログ〉YL・語数・書評システム情報 -- 最新メッセージID: 1253 // 時刻: 2024/6/24(21:41)]

管理用 HELP LOGIN    :    :


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

847. 総語数の計算(13)

お名前: たむ
投稿日: 2005/9/3(16:31)

------------------------------

以上の結果をまとめてみると、次のようになります。
◆(1) Cold Mountain  2.3 %
◆(2) The Blue Bedroom & Other Stories  −4.3 %
◆(3) The Sky is Falling  −53 % / −2.9 %
◆(4) The Best Laid Plans  −9.2 % / −3.9 %
◆(5) These Happy Golden Years  −3.1 %
◆(6) Little House in the Big Woods  −1.9 %
◆(7) Lily’s Crossing  1.0 %
◆(8) Holes  −33.8 % / −0.9 %
◆(9) Afternoon on the Amazon  5.2 % / 2.8 %
◆(10) Matilda  −33.9 % / 11.6 %
◆(11) Two Lives  −10.1 % / 3.8 %
◆(12) About a Boy  −4.5 %
◆(13) The Canterville Ghost  35.7 %
◆(14) A Dubious Legacy  3.1 %

これは単純比例計算による誤差で、誤差の二つ目は
「変形」単純比例計算によるものです。

こうして変形版の計算法のものまでふくめると、14冊のうち
12冊までが誤差5%以内におさまっていることになります。
これは14冊の86%にあたります。

「変形」単純比例計算とはどういうものだったか。もう一度
一つひとつみていきます。

本の本文のはじめの部分で、文字や行の並び方がどうなるか
をイメージしてみると、頁の上のほうに章の番号やタイトルが
あり、その下に本文の行が始まる、次の頁では頁いっぱいに
文字がつまっている…。これを「標準」としてみましょう。

すると、この ◆(3) The Sky is Fallingは標準からはずれて
いるところがあります。まず、最初の2頁がPrologueで、しかも
2頁目は途中で行が終わっている。2頁目は、文字のある部分は
少なく、空白のほうが多いくらいです。

そこで、単純比例計算の1頁目をpage 1としないで、page 3に
ずらし、3、4、5頁をサンプル部分としたわけです。これで−2.9 %
の誤差が得られたのでした。

◆(4) The Best Laid Plansについては、「総語数の計算(11)」
の投稿では、単純比例計算だけで−9.2 %の結果を得ました。

この本の第1頁は「標準」的にはじまるのですが、第1、2頁で
パラグラフの区切りが空白行になっています。その分、文字数は
少なくなっています。ところが、第3頁にはまったく空白行はなく、
べたに行が詰まっています。

そこで、サンプル部分として選ぶ1頁目をpage 1としますが、
これは文字数がかなり少ない。そこで、2頁目、3頁目として
は、空白行のない文字のつまった頁、page 3, page 10を
選んでみます。

サンプル部分は77+235+223 = 535
比例計算は 535×(372 / 3) = 66340
誤差は (66340 / 69066)×100 = 96.05 …
96.1−100= −3.9 (%)

こうして誤差5%以内の数字が得られたのですが、
しかし、この本については「微妙」なところがあります。
総語数をこれから計算しようとしてこの本をぱらぱら
めくってみたとき、単純比例計算で最初の3頁を
サンプル部分とするのではおかしい、誤差が大きくなる
と、思えるかどうか、です。

私自身、最初の単純計算で−9.2%の数字が出てきた
とき、うーんもうすこし何とかならないか、と思ったことを
告白しておきます(笑)。また、サンプル部分の1頁目を
みて、これは文字数が極端に少ないので、2頁目、3頁目
としては文字のぎっしり詰まった頁を選ぼう、と考えつくか
どうかも微妙なところです。

さて、ここまでで、「変形単純比例計算」の「変形」のしかた
は二つになりました。◆(3) The Sky is Fallingの場合は、
最初の2頁をはずして、サンプル部分として選ぶ最初の3頁
を、pp. 3, 4, 5としたのでした。つまり、「ずらし」技法とでも
いいましょうか。それに対し、この◆(4) The Best Laid Plans
では、サンプル部分をpp.1, 3, 10とピックアップしたわけです。
「ピックアップ」技法と命名します。

◆(8) Holesですが、これも「変形」のほうを選ぶことに問題は
ないと思います。頁ごとに文字数がばらばらに見えるからです。
最初のほうのpp.5, 7, 8を「ピックアップ」して誤差−0.9 % でした。

つぎは◆(9) Afternoon on the Amazonです。これは一見して
語数計算がむずかしい本とわかります。全体に挿絵が多く、文字も
すきすきの感じです。そこで、文字の少なそうなp.5と、文字の多そう
なpp.4, 6をサンプル部分として選んで2.8 %の誤差を得ました。

◆(10) Matildaは挿絵が生き生きと使われています。語数計算の
点ではやりにくい本です。最初の10頁のうちに、挿絵が9枚もあり、
文字だけの頁は3頁だけです。

ここで「ピックアップ」を使って、pp. 1, 7, 9を選んで
98+234+250 = 582
582×(232 / 3) = 45008
(45008 / 39919)×100 = 112.74 …
112.7−100 = −12.7 (%)

この本は挿絵がふんだんに使われている上に、
挿絵の大きさも自由自在です。前の述べたとおり
誤差も−43.0 /−33.5 /−33.9 /−15.0 /−14.6 /
−12.0 /−5.1 /−17.0 /−10.0 /−5.2とまったく
安定しません。

変形比例計算法もお手上げです。最初の10頁に
挿絵が9枚ある点に注目しておきます。

◆(11) Two Livesは、単純比例計算では−10.1%
の誤差でしたが、本文がはじまる最初の6頁は
Prologueです。これを避けて、7頁からの3頁を
サンプルに取ると誤差3.8 % が得られます。
これは「ずらし」技法になります。

◆(13) The Canterville Ghostも挿絵が多い、
しかもかなり大き目の挿絵が最初の10頁に
5枚あります。

この本もどうも比例計算には向かないようです。
誤差も10頁まで、安定していません。

以上、変形比例計算法の実際をみてきました。
これは二つの技法「ずらし」と「ピックアップ」が
ありました。

最初にPrologueや手紙などがある場合には「ずらし」技法を
使います。(例:◆(3) The Sky is Falling、◆(11) Two Lives)
それ以外の場合には、文字の並び方(多さ、少なさ)をみて、
文字の少なそうな頁、文字の多そうな頁2つを選ぶ「ピックアップ」
技法で、3頁のサンプル部分を選びます。

さて、この変形比例計算をもってしても攻略できない
◆(10) Matilda、◆(13) The Canterville Ghostが
ありました。これは挿絵が多い(挿絵がある、ではなくて)
という特徴がありました。最初の10頁のうち、◆(10)は
9枚、◆(13)では5枚ありました。

さて、以上から長々と続けてきました「単純比例計算法」と
その変形版についてまとめることができるようです。

一冊の本を前にしてその総語数を計算しようと
するとき、まず最初の10頁をはらはらめくり、挿絵が
あるかどうか確かめます。挿絵がある場合、その数を
数え、4枚以下であればよし、5枚以上の場合は除外して
しまいます。つまり、この計算法は使えないとあきらめます。

次に、本文の文字の並び方を見ます。始まりが文字数小、
次の頁、その次の頁に文字がいっぱい詰まっている場合は
単純比例計算を使います。
 (3頁の累計語数)×(本文頁数÷3)

最初の頁の始まり方が上のようではなく、最初にPrologueが
あったり、手紙などが置いてある場合は、これをパスして、本文が
始まるところからの3頁をサンプル部分とします。

さらに上記のやり方にあてはまらないが、どうも最初の10頁の
語数がばらばらだと思える場合は、「ピックアップ」技法が適当です。
最初の10頁のなかから、語数の少なそうな頁、多そうな頁を2頁
選び、これをサンプル部分とするのです。

以上で誤差5% 以内で総語数が計算できます!!

補足する点をいくつか。
上で「語数の少なそうな」とか「語数の多そうな」とかの表現を
使って、「語数が中くらいの」という表現は使いませんでした。
「中くらい」とか「標準的」とかの表現は、考え始めるとどうにも
むずかしくなるからです。

さらに、全体に、私が単純比例計算法に必要以上に
こだわっている印象をもたれた方もおられるかと思います。
しかしこれは、次の理由があるからなのです。

これ以外の総語数計算法はすべて「補正」の部分が
ありますが、これをきちんとやろうとするとかなり大変
なことが予想されるのです。つまり、補正なしのこの
単純法の適用範囲をなるべく拡大しておけば、実際の
語数計算はかなり楽になるのではと思っています。

実際のところ、この単純比例計算法+変形版で、PBの
全部、児童書とGRのうち、挿絵の多くない(最初の10頁
で4枚以下)はすべて5% 以下の誤差で計算できると
思われます。もちろん、話しはすべて取り上げた14冊での
ことですから、仮説的要素がかなり強いことはいなめません。
バラエティの点では、絵本 manga以外の本は取り上げ
ましたが、14冊はやはり少ないのかもしれません。

以上で、投稿「総語数の計算(8)」からつづいてきた話しを
終わります。次は、別の語数計算法をとりあげます。

長々と読んでいただき、ありがとうございます。
それでは皆様も
Happy Reading で、いきまっしょい。

▲返答元

▼返答


Maintenance: SSS 事務局
KINOBOARDS/1.0 R7.3: Copyright © 1995-2000 NAKAMURA, Hiroshi.