[掲示板: 〈過去ログ〉YL・語数・書評システム情報 -- 最新メッセージID: 1253 // 時刻: 2025/5/2(20:30)]
------------------------------
以上の結果をまとめてみると、次のようになります。 ◆(1) Cold Mountain 2.3 % ◆(2) The Blue Bedroom & Other Stories −4.3 % ◆(3) The Sky is Falling −53 % / −2.9 % ◆(4) The Best Laid Plans −9.2 % / −3.9 % ◆(5) These Happy Golden Years −3.1 % ◆(6) Little House in the Big Woods −1.9 % ◆(7) Lily’s Crossing 1.0 % ◆(8) Holes −33.8 % / −0.9 % ◆(9) Afternoon on the Amazon 5.2 % / 2.8 % ◆(10) Matilda −33.9 % / 11.6 % ◆(11) Two Lives −10.1 % / 3.8 % ◆(12) About a Boy −4.5 % ◆(13) The Canterville Ghost 35.7 % ◆(14) A Dubious Legacy 3.1 % これは単純比例計算による誤差で、誤差の二つ目は 「変形」単純比例計算によるものです。 こうして変形版の計算法のものまでふくめると、14冊のうち 12冊までが誤差5%以内におさまっていることになります。 これは14冊の86%にあたります。 「変形」単純比例計算とはどういうものだったか。もう一度 一つひとつみていきます。 本の本文のはじめの部分で、文字や行の並び方がどうなるか をイメージしてみると、頁の上のほうに章の番号やタイトルが あり、その下に本文の行が始まる、次の頁では頁いっぱいに 文字がつまっている…。これを「標準」としてみましょう。 すると、この ◆(3) The Sky is Fallingは標準からはずれて いるところがあります。まず、最初の2頁がPrologueで、しかも 2頁目は途中で行が終わっている。2頁目は、文字のある部分は 少なく、空白のほうが多いくらいです。 そこで、単純比例計算の1頁目をpage 1としないで、page 3に ずらし、3、4、5頁をサンプル部分としたわけです。これで−2.9 % の誤差が得られたのでした。 ◆(4) The Best Laid Plansについては、「総語数の計算(11)」 の投稿では、単純比例計算だけで−9.2 %の結果を得ました。 この本の第1頁は「標準」的にはじまるのですが、第1、2頁で パラグラフの区切りが空白行になっています。その分、文字数は 少なくなっています。ところが、第3頁にはまったく空白行はなく、 べたに行が詰まっています。 そこで、サンプル部分として選ぶ1頁目をpage 1としますが、 これは文字数がかなり少ない。そこで、2頁目、3頁目として は、空白行のない文字のつまった頁、page 3, page 10を 選んでみます。 サンプル部分は77+235+223 = 535 比例計算は 535×(372 / 3) = 66340 誤差は (66340 / 69066)×100 = 96.05 … 96.1−100= −3.9 (%) こうして誤差5%以内の数字が得られたのですが、 しかし、この本については「微妙」なところがあります。 総語数をこれから計算しようとしてこの本をぱらぱら めくってみたとき、単純比例計算で最初の3頁を サンプル部分とするのではおかしい、誤差が大きくなる と、思えるかどうか、です。 私自身、最初の単純計算で−9.2%の数字が出てきた とき、うーんもうすこし何とかならないか、と思ったことを 告白しておきます(笑)。また、サンプル部分の1頁目を みて、これは文字数が極端に少ないので、2頁目、3頁目 としては文字のぎっしり詰まった頁を選ぼう、と考えつくか どうかも微妙なところです。 さて、ここまでで、「変形単純比例計算」の「変形」のしかた は二つになりました。◆(3) The Sky is Fallingの場合は、 最初の2頁をはずして、サンプル部分として選ぶ最初の3頁 を、pp. 3, 4, 5としたのでした。つまり、「ずらし」技法とでも いいましょうか。それに対し、この◆(4) The Best Laid Plans では、サンプル部分をpp.1, 3, 10とピックアップしたわけです。 「ピックアップ」技法と命名します。 ◆(8) Holesですが、これも「変形」のほうを選ぶことに問題は ないと思います。頁ごとに文字数がばらばらに見えるからです。 最初のほうのpp.5, 7, 8を「ピックアップ」して誤差−0.9 % でした。 つぎは◆(9) Afternoon on the Amazonです。これは一見して 語数計算がむずかしい本とわかります。全体に挿絵が多く、文字も すきすきの感じです。そこで、文字の少なそうなp.5と、文字の多そう なpp.4, 6をサンプル部分として選んで2.8 %の誤差を得ました。 ◆(10) Matildaは挿絵が生き生きと使われています。語数計算の 点ではやりにくい本です。最初の10頁のうちに、挿絵が9枚もあり、 文字だけの頁は3頁だけです。 ここで「ピックアップ」を使って、pp. 1, 7, 9を選んで 98+234+250 = 582 582×(232 / 3) = 45008 (45008 / 39919)×100 = 112.74 … 112.7−100 = −12.7 (%) この本は挿絵がふんだんに使われている上に、 挿絵の大きさも自由自在です。前の述べたとおり 誤差も−43.0 /−33.5 /−33.9 /−15.0 /−14.6 / −12.0 /−5.1 /−17.0 /−10.0 /−5.2とまったく 安定しません。 変形比例計算法もお手上げです。最初の10頁に 挿絵が9枚ある点に注目しておきます。 ◆(11) Two Livesは、単純比例計算では−10.1% の誤差でしたが、本文がはじまる最初の6頁は Prologueです。これを避けて、7頁からの3頁を サンプルに取ると誤差3.8 % が得られます。 これは「ずらし」技法になります。 ◆(13) The Canterville Ghostも挿絵が多い、 しかもかなり大き目の挿絵が最初の10頁に 5枚あります。 この本もどうも比例計算には向かないようです。 誤差も10頁まで、安定していません。 以上、変形比例計算法の実際をみてきました。 これは二つの技法「ずらし」と「ピックアップ」が ありました。 最初にPrologueや手紙などがある場合には「ずらし」技法を 使います。(例:◆(3) The Sky is Falling、◆(11) Two Lives) それ以外の場合には、文字の並び方(多さ、少なさ)をみて、 文字の少なそうな頁、文字の多そうな頁2つを選ぶ「ピックアップ」 技法で、3頁のサンプル部分を選びます。 さて、この変形比例計算をもってしても攻略できない ◆(10) Matilda、◆(13) The Canterville Ghostが ありました。これは挿絵が多い(挿絵がある、ではなくて) という特徴がありました。最初の10頁のうち、◆(10)は 9枚、◆(13)では5枚ありました。 さて、以上から長々と続けてきました「単純比例計算法」と その変形版についてまとめることができるようです。 一冊の本を前にしてその総語数を計算しようと するとき、まず最初の10頁をはらはらめくり、挿絵が あるかどうか確かめます。挿絵がある場合、その数を 数え、4枚以下であればよし、5枚以上の場合は除外して しまいます。つまり、この計算法は使えないとあきらめます。 次に、本文の文字の並び方を見ます。始まりが文字数小、 次の頁、その次の頁に文字がいっぱい詰まっている場合は 単純比例計算を使います。 (3頁の累計語数)×(本文頁数÷3) 最初の頁の始まり方が上のようではなく、最初にPrologueが あったり、手紙などが置いてある場合は、これをパスして、本文が 始まるところからの3頁をサンプル部分とします。 さらに上記のやり方にあてはまらないが、どうも最初の10頁の 語数がばらばらだと思える場合は、「ピックアップ」技法が適当です。 最初の10頁のなかから、語数の少なそうな頁、多そうな頁を2頁 選び、これをサンプル部分とするのです。 以上で誤差5% 以内で総語数が計算できます!! 補足する点をいくつか。 上で「語数の少なそうな」とか「語数の多そうな」とかの表現を 使って、「語数が中くらいの」という表現は使いませんでした。 「中くらい」とか「標準的」とかの表現は、考え始めるとどうにも むずかしくなるからです。 さらに、全体に、私が単純比例計算法に必要以上に こだわっている印象をもたれた方もおられるかと思います。 しかしこれは、次の理由があるからなのです。 これ以外の総語数計算法はすべて「補正」の部分が ありますが、これをきちんとやろうとするとかなり大変 なことが予想されるのです。つまり、補正なしのこの 単純法の適用範囲をなるべく拡大しておけば、実際の 語数計算はかなり楽になるのではと思っています。 実際のところ、この単純比例計算法+変形版で、PBの 全部、児童書とGRのうち、挿絵の多くない(最初の10頁 で4枚以下)はすべて5% 以下の誤差で計算できると 思われます。もちろん、話しはすべて取り上げた14冊での ことですから、仮説的要素がかなり強いことはいなめません。 バラエティの点では、絵本 manga以外の本は取り上げ ましたが、14冊はやはり少ないのかもしれません。 以上で、投稿「総語数の計算(8)」からつづいてきた話しを 終わります。次は、別の語数計算法をとりあげます。 長々と読んでいただき、ありがとうございます。 それでは皆様も Happy Reading で、いきまっしょい。
▲返答元
▼返答