日本語の文庫本、1冊は、英語で何語?

[掲示板: 〈過去ログ〉本のこと何でも -- 最新メッセージID: 3237 // 時刻: 2024/11/24(02:22)]

管理用 HELP LOGIN    :    :



上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

2386. 日本語の文庫本、1冊は、英語で何語?

お名前: fiona
投稿日: 2007/10/10(23:06)

------------------------------

前々から、日本語の本1冊読んだら、英語では何語読んだのと同じくらいか、疑問に思っていたので、実際に数えて見ました。

Gutenbergにある作品で、文庫本で翻訳のあるもの(かつ手持ちのあるもの)について、調べてみました。

文庫本については、本文のみのページ数を調べ、
英語の語数については、Gutenbergでダウンロードしたtxtファイルの大きさ(KB)からその語数を計算。(語数=KB数×180−3000(オーストラリアのGutenbergのものは3000を引かない))

25冊について調べて、平均すると、5万語あたり文庫本206ページでした。
ただ、語数が概算であり、文庫本1ページの文字数にばらつきのあるため、大まかな計算です。

ただし、昔の文庫本なので、1ページが17行×43字から19行×44字。
今の文庫本は、字が大きくなり、(字の印刷してある面積は大きくなったものの)1ページあたりの行数、1行あたりの文字数は減っています。
最近の文庫本を何冊か見てみたら、行数は16〜18行(1ページ)、1行の文字数は37〜42字。これから考えて、同じ語数に昔の1.1〜1.2倍のページ数が必要になりそうなので、
5万語あたり、日本語の文庫本220〜240ページくらいかな?

平均的文庫本1冊あたり、大まかに5万語くらいか、と思っていたのですが、どうやら、1冊あたり6〜8万語くらいはありそうです(もちろん、ページ数が多ければ、それに対する語数も多い)。
1冊あたり5万語と言うのは、少し薄めのライトノベルくらいの感じのもののようです。

また、易しいものは、5万語あたりのページ数がやや多目、難しいものはページ数がやや少なめになるようです。これは、漢字の多い、少ないが原因かも知れません。
やさしいもの(児童書に入るようなもの)は、平かなが多いですから。

Gutenberugのtxtファイルの大きさから、その語数を計算する式については、実際の語数と比較検討中。
これも、実際にWordでカウントして計算すると、1KBあたりの語数が、易しいものは多目(180〜190)、難しいものは少なめ(180以下)になっているようです。このことから、難しいものほど、1語あたりの文字数が平均するとやや多目なのではないかと思われます。
今回調べた25作品については、まだ比較の途中なのですが、式による概算は、
実際の語数に比べると、今のところ、−4.5%〜+4.3%の誤差ありくらいです。

以下、調べた作品とその文庫本ページ数(本文のみ)や作品の英語の語数(式による概算)などの資料。(5万語あたりのページ数の少ない順)
( )内は、(文庫本ページ数(1ページの行数×1行の文字数)、英語語数(概算)、5万語あたりのページ数)です。
また、挿絵ありの本では、本文のページ数には挿絵のページも含みます。

緋文字 (305(19×43)、88080、173)…ホーソン
洞窟の女王 (388(19×43)、107520、180)…ハガード"She"、挿絵あり
二人の女王 (389(19×43)、104280、187)…ハガード"Allan Quatermain"、挿絵あり
ジェーン・エイア (700(19×43)、185280、189)
高慢と偏見 (469(19×43)、123180、190)…オースティン
嵐が丘 (450(19×44)、115800、194)
宝島 (261(19×43)、65940、198)
第四若草物語 (385(19×44)、97080、198)
ハックルベリイ・フィンの冒険 (405(19×43)、102120、198)
パレアナの青春 (296(18×43)、74040、200)
テス (618(19×43)、150900、205)…ハーディ
ソロモン王の洞窟 (326(18×43)、79080、206)…ハガード、挿絵あり
アンクル・トムの小屋 (755(19×44)、180960、209)
火星のプリンセス (282(17×43)、67560、209)…バローズ、挿絵あり
第三若草物語 (420(19×44)、100140、210)
トム・ソーヤーの冒険 (295(18×43)、70250、210)
可愛いエミリー (489(19×43)、112860、217)…モンゴメリ
火星の女神イサス (356(17×43)、81960、217)…バローズ、挿絵あり
ガリヴァー旅行記 (451(19×44)、103380、218)
若草物語 (385(19×44)、87500、220)
続若草物語 (414(19×44)、94000、220)
エミリーはのぼる (467(18×43)、105300、222)…モンゴメリ
エミリーの求めるもの (311(18×43)、69840、223)…モンゴメリ
火星の大元帥カーター (256(17×43)、55860、229)…バローズ
少女パレアナ (264(18×42)、55680、237)…または、「ポリアンナ」


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

2387. Re: 日本語の文庫本、1冊は、英語で何語?

お名前: 古川@SSS http://www.seg.co.jp
投稿日: 2007/10/10(23:44)

------------------------------

fiona さん、

面白いデータを提供していただき、ありがとうございます。

Amazon.com では、

Arthur and the Minimoys

Characters: 273,501
Words: 47,369
Sentences: 4,383
Words per Sentence: 10.8
Characters per Word: 5.77

などのデータがとれるので、易しめの本と難しめの本の
1語あたりの平均文字数 などがわかります。


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

2388. Re: 訂正 and 難易度と1KBあたりの語数

お名前: fiona
投稿日: 2007/10/11(18:59)

------------------------------

古川さん、今晩は。

一つ訂正があります。
資料の下から2番目、「火星の大元帥カーター」は、"挿絵あり"なのですが、記入が抜けていました。

そう言えば、Amazon.comで、Search Insideできるものは、いろんなデータが分かりましたね。また、利用したいと思います。
 
 
1KBあたりの語数は、おおむね、少ないほど難しく、多いほど易しいような感じです。
まだ途中で調べていないものもあるのですが、Gutenbergの本文のみ(ライセンスがどう、とか言う文章などを除いたもの)で、そのファイルの大きさとWordでカウントした語数から、1KBあたりの語数を計算すると次のようになりました。

( )内は、1KBあたりの語数。その語数の小さい順に、
緋文字 (174.4)
高慢と偏見 (178.0)
テス (179.3)
嵐が丘 (181.0)
少女パレアナ (181.3)
ガリヴァー旅行記 (181.4)
アンクル・トムの小屋 (181.4)
火星のプリンセス (182.4)
ジェーン・エイア (183.3)
火星の女神イサス (183.8)
可愛いエミリー (183.5)
火星の大元帥カーター (184.1)
ソロモン王の洞窟 (186.4)
第四若草物語 (186.7)
第三若草物語 (187.6)
宝島 (190.1)

難しいものほど1KBあたりの語数は少ない傾向にあるようですが、ずれている感じのものもあります。作家の文体と言うか、文のスタイルから決まってくる使用語彙なども、関係しているのかもしれません。
少女パレアナと宝島の数値が、難易度とはずれているような感じがします(読んでないので、あくまで「感じ」ですが)。
そう言えば、"Daddy-Long-Legs"は、緋文字よりも1KBあたりの語数が少ないのです。本文のみで、173.7words/KBなのです。この数字だけからなら、すごくYLの高い作品ということになるのですが、そうでもないようです(YL 6.0-7.0)。

たくさん調べて、作家ごとに比較したら面白いかも知れません。


タイトル一覧へ(返答順)(B)

タイトル一覧へ(日付順)


Maintenance: SSS 事務局
KINOBOARDS/1.0 R7.3: Copyright © 1995-2000 NAKAMURA, Hiroshi.