ペーバーバックの語彙数

[掲示板: 〈過去ログ〉本のこと何でも -- 最新メッセージID: 3237 // 時刻: 2024/11/24(15:47)]

管理用 HELP LOGIN    :    :



上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1755. ペーバーバックの語彙数

お名前: カリフォルニア・ガイ
投稿日: 2006/8/5(08:43)

------------------------------

ハリポタでもダビンチコードでもいいんですが、語彙数(語数ではない)はどのくらいなんでしょうか。

アメリカの高卒の平均運用語数が5000〜7000、大卒が10000〜13000という話を聞いたことがあります。ダビンチコードの語彙数がわかれば、例えば高卒のアメリカ人がダビンチコードを読むときにどのくらいの語彙を推測しているかということがある程度わかりますね。これって興味深い数字です。


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1758. Re: フリーのコンコーダンス・ソフト

お名前: ヨシオ
投稿日: 2006/8/5(17:16)

------------------------------

カリフォルニア・ガイさん、こんにちは、ヨシオです。

〉ハリポタでもダビンチコードでもいいんですが、語彙数(語数ではない)はどのくらいなんでしょうか。

テキスト・ファイルがあれば分かるのですが、Project Gutenbergなどに登録されている著作権が切れたものなら、フリーのコンコーダンス作成ソフトで語彙数を調べることができるようです。

[url:http://www.chs.nihon-u.ac.jp/eng_dpt/tukamoto/kwic.html]

〉アメリカの高卒の平均運用語数が5000〜7000、大卒が10000〜13000という話を聞いたことがあります。ダビンチコードの語彙数がわかれば、例えば高卒のアメリカ人がダビンチコードを読むときにどのくらいの語彙を推測しているかということがある程度わかりますね。これって興味深い数字です。

わたしは言語学には全然関係がないのですが、フリーのコンコーダンス・ソフトを使って、Project Gutenbergからダウンロードした、"ANNE OF GREEN GABLES / Lucy Maud Montgomery"の語彙数を見てみました。7448なんですね。高校生で十分、ということでしょうか(^^;

Total Tokens: 107147
Total Types: 7448
Type-Token Ratio: 0.069512
Average Word Length: 4.039777

Total Tokensが全単語数だと思います。Total Typesが語彙数で、平均の単語長は4文字なんですね。

また、単語の出現頻度も以下のように分かります。ANNEの名前が1213回なんですね。面白い。よく呼ばれるからかな?(^^;

the 3926
and 3397
i 3264
to 3045
a 2225
it 2099
of 1923
you 1701
she 1519
in 1479
that 1371
was 1364
her 1312
anne 1213

また、"happy"という単語のコンコーダンスを作成すると、以下のように、50の文章でヒットしたようです。

Keyword: happy
Keyword Position: 50

(673)
did? But just now I feel pretty nearly perfectly happy. I can't feel exactly perfectly happy
(674)
perfectly happy. I can't feel exactly perfectly happy because--well, what color would you call
(689)
"Now you see why I can't be perfectly happy. Nobody could who has red hair. I don't
(1744)

ハリーポッターやダビンチコードの電子ファイルがあれば、語彙数は分かるのでしょうが、著作権の問題で無理かな。

では〜。


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

[質問] 1762. Re: ペーバーバックの語彙数

お名前: 酒井@快読100万語!
投稿日: 2006/8/7(01:06)

------------------------------

カリフォルニア・ガイさん、ヨシオさん、こんばんは!

〉ハリポタでもダビンチコードでもいいんですが、語彙数(語数ではない)はどのくらいなんでしょうか。

〉アメリカの高卒の平均運用語数が5000〜7000、大卒が10000〜13000という話を聞いたことがあります。ダビンチコードの語彙数がわかれば、例えば高卒のアメリカ人がダビンチコードを読むときにどのくらいの語彙を推測しているかということがある程度わかりますね。これって興味深い数字です。

ぼくはなにしろSidney SheldonのMaster of the Gameを半分までOCRで
読み取って、語数を確かめようとした「強者」です。

で、そこであきらめたんですが、今はamazon.comかScholasticの
サイトで簡単にわかるのではなかったっけ?


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1763. Re: ペーバーバックの語彙数、Lexile Levelって?

お名前: ヨシオ
投稿日: 2006/8/7(21:50)

------------------------------

酒井先生、こんばんは!ヨシオです。

〉カリフォルニア・ガイさん、ヨシオさん、こんばんは!

〉〉ハリポタでもダビンチコードでもいいんですが、語彙数(語数ではない)はどのくらいなんでしょうか。
〉〉アメリカの高卒の平均運用語数が5000〜7000、大卒が10000〜13000という話を聞いたことがあります。ダビンチコードの語彙数がわかれば、例えば高卒のアメリカ人がダビンチコードを読むときにどのくらいの語彙を推測しているかということがある程度わかりますね。これって興味深い数字です。

〉ぼくはなにしろSidney SheldonのMaster of the Gameを半分までOCRで
〉読み取って、語数を確かめようとした「強者」です。

すごいですね(^^;そのうち、なんでもGoogleがLibraryにとりこんじゃうかもしれませんね。Web 2.0の世の中ですかね。

〉で、そこであきらめたんですが、今はamazon.comかScholasticの
〉サイトで簡単にわかるのではなかったっけ?

Scholasticのサイトを見ると、「語数」は分かるのですが、「語彙数」は分からないようです。ただ、Lexile Levelとありますが、これが「語彙」のMeasurementなんでしょうか?以下のサイトのLexile Frameworkで説明がありましたが…。もうひとつ分からない(^^;;;

[url:http://www.lexile.com/EntrancePageFlash.html?1]

では〜。


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

[汗] 1764. Re: ペーバーバックの語彙数、Lexile Levelって?

お名前: 酒井@快読100万語!
投稿日: 2006/8/7(22:08)

------------------------------

ヨシオさん、ありがとうございました!
カリフォルニア・ガイさん、ごめんなさい!!

〉Scholasticのサイトを見ると、「語数」は分かるのですが、「語彙数」は分からないようです。ただ、Lexile Levelとありますが、これが「語彙」のMeasurementなんでしょうか?以下のサイトのLexile Frameworkで説明がありましたが…。もうひとつ分からない(^^;;;

わざわざ「語数ではない」と書いてくださっているのにねえ・・・

[url:http://www.lexile.com/EntrancePageFlash.html?1]

Lexileは担当者の説明を聞いたことがあります。
とてもいい加減な指数ですが、語彙数の点だけはきちんと
はかっているはずです。なにしろ語彙レベルとセンテンスの平均の
長さだけで何度を決めているんですから。
だからScholasticのどこかにそれぞれの本の「語彙数」が
表示してあっても良さそうなものですが・・・


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1769. amazon.com の Text Stats

お名前: momiji
投稿日: 2006/8/9(12:32)

------------------------------

momijiです。

"酒井@快読100万語!"さんは[url:kb:1762]で書きました:
〉〉ハリポタでもダビンチコードでもいいんですが、語彙数(語数ではない)はどのくらいなんでしょうか。

〉で、そこであきらめたんですが、今はamazon.comかScholasticの
〉サイトで簡単にわかるのではなかったっけ?

語彙数が何語である、という具体的な数値ではありませんが、
amazon.comでは、と表紙画像の上に「SEARCH INSIDE!」なっているもの
については、「Text Stats」というリンクがあって、そこをたどると、
語彙の指標になりそうな数値がいくつかでてきます。
残念ながら、ハリーポッターシリーズにはないですが、
ダビンチコードや、シドニィ・シェルダンの作品などは
あるものが多いようです。

たとえば、ダビンチコードですと、
[url:http://www.amazon.com/gp/product/sitb-next/0385504209/ref=sbx_txt/102-8554882-3917709?ie=UTF8#textstats]

Readability
Fog Index: 9.1
Flesch Index: 63.5
Flesch-Kincaid Index: 7.2

Complexity
Complex Words: 12%
Syllables per Word: 1.6
Words per Sentence: 11.1

Number of
Characters: 821,310
Words: 137,100
Sentences: 12,354

Fun stats
Words per Dollar: 8,721
Words per Ounce: 5,100

こんな感じになっています。

これらの各値の横に、ほかの全ての作品との相対的な値を
あらわしたバーがあります。
比較する作品群は「Compared with books in ...」というところで、
ジャンルを指定することも可能です。

Complex Wordsについては
A word is considered "complex" if it has three or more syllables.
だそうなので、まあ、語彙数がどうのこうのというより、
音節が多い(→長い→難しい?)語がどれくらいの割合で使われているか
ということみたいですね。

参考になるとよいのですが・・・。

それでは。


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1765. Re: ペーバーバックの語彙数; ハリポタ

お名前: 摂津富田
投稿日: 2006/8/8(12:24)

------------------------------

カリフォルニア・ガイさん,ヨシオさん,はじめまして!
酒井センセ,こんにちは.
  セッツトンダです.

コスモピア(株)のハリポタのページ,ここ↓
http://www.e-teststation.com/hp/analyze.html
に,一部データがあります.
これによると,固有名詞や造語も含めて4000〜10,000語
が用いられているようです.

但しここでは,’everythin’, ‘comin’ や,’aaaaarrrgh’,’aaaaaaaaaaarrrrrgh’,
さらには ‘3’,’1637’ なんて数字もそれぞれ別の語彙としてカウントしています.
分析の中で,
「高校1年生レベルの語彙があれば、大ざっぱに見て、
90%くらいの単語がわかる、見当がつくと思われる。」
と述べられているのも,この辺を考慮してのことのようです.

GRでは,’tie’ と ‘untie’ は併せて1語,
また ‘news’ と ‘paper’ が既知語なら ‘newspaper’ も既知語といった
数え方になっているそうなので,単純比較は難しいようです.
 
 
それともうひとつ,これは個人の方のサイトなのですが,
「英語語彙増強と記憶に関するサイト」の管理人さんは
「英文学を読むのに必要な語彙水準の考察」と題して,
アンやホームズの分析結果から,40,000〜60,000語が必要と
結論付けてられます.
  
  
最後に,個人的な感想ですが,
1ページあたり200〜400語前後の本の中に、20〜40個も知らない単語があると
余程飛ばし読みが得意でないと,少しきついかなと感じます.
いまの富田の‘飛バシビリティ’だと1ページに5〜10個の未知語が上限で,
98%ぐらいの識語率は欲しいところです.
上記管理人さんの分析も,このあたりを目安にしているようです.
とはいえ,児童書の中に出てくる
‘Supergigando yuck!’ なんて台詞はちっとも苦にならないわけですから,
既知語,未知語の数え方は,藤田マコトに難しいという
あたり前田のクラッカーな結論で,お暇致します.


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1766. Re: ペーバーバックの語彙数; ハリポタ

お名前: カリフォルニア・ガイ
投稿日: 2006/8/8(16:56)

------------------------------

ヨシオさん、酒井先生、摂津富田さん、レスありがとうございます。

ベストセラーになるような本が大卒の語彙力を要求するはずがないので、なんとなく一万語くらいかな・・と思っていました。

アメリカ人の一般的な語彙数はネットで調べてみたところ、1万語弱から数万まで諸説があるようです。七千語というのは調べた中で一番低い数字です。アメリカの公立高校は決してレベルが高いとは言えないので個人的には1万語弱くらいと思っているんですがいかがでしょうか。

私自身は推測率うーん30%くらいかなぁ。推測しているという意識がほとんどなく何ページも夢中に読めるときもあるし、1ページ以上ほとんどわからない場合もあります。

ところで酒井先生、Sideny Sheldonを全部読破したんですが、それから足踏み状態です。何冊も途中で断念したり・・・。Sidney Sheldonを2回目読んだほうがいいですかね。同じ本でも時間を置くと変に?読めたりすることもあるので変ですよね。


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

[汗] 1767. Re: ペーバーバックの語彙数; ハリポタ

お名前: 酒井@快読100万語!
投稿日: 2006/8/8(22:42)

------------------------------

カリフォルニア・ガイさん、ヨシオさん、摂津富田さん、こんばんは!
酒井@快読100万語!です。

〉ヨシオさん、酒井先生、摂津富田さん、レスありがとうございます。

〉ベストセラーになるような本が大卒の語彙力を要求するはずがないので、なんとなく一万語くらいかな・・と思っていました。

〉アメリカ人の一般的な語彙数はネットで調べてみたところ、1万語弱から数万まで諸説があるようです。七千語というのは調べた中で一番低い数字です。アメリカの公立高校は決してレベルが高いとは言えないので個人的には1万語弱くらいと思っているんですがいかがでしょうか。

これについては、Paul NationとRob Waringという人たちの論文で、
20歳くらいまでに約2万語くらいではないかという推測を見たことが
あります。根拠ははなはだ貧弱で、生まれてから1年間に1000語ずつ
身につけていくのではないかという推測からです。

〉私自身は推測率うーん30%くらいかなぁ。推測しているという意識がほとんどなく何ページも夢中に読めるときもあるし、1ページ以上ほとんどわからない場合もあります。

〉ところで酒井先生、Sideny Sheldonを全部読破したんですが、それから足踏み状態です。何冊も途中で断念したり・・・。Sidney Sheldonを2回目読んだほうがいいですかね。同じ本でも時間を置くと変に?読めたりすることもあるので変ですよね。

で、この質問ですが、答えは例によって、2回目を読むのが
楽しければ、大いに再読をすすめます! ということですね。
楽しく読めるなら、同じ本を何度も読むのは非常に効果が高いと
見ています。これには貧弱も何も、根拠はほとんどありません。
ただの勘です・・・ 楽しくもないのに再読しても頭が内容と
英文を拒否するばかりで逆効果です・・・というのも・・・,
you guessed it, ただの勘ですが・・・


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1771. Re: ペーバーバックの語彙数; ハリポタ

お名前: カリフォルニア・ガイ
投稿日: 2006/8/10(08:24)

------------------------------

酒井先生、

ありがとうございます。もともと再読、三読は好きで気に入った本ならそれこそ5回でも10回でも読むたちなんでそうします。読んでみたい本は机の上に置いておいて、ふと読めそうな気がしたら即チャレンジするということで。
英語だからといって特別な読み方があるわけでなく、日本語の本のように読むというのが眼目でしょうから。


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

[脱帽] 1772. Re: ペーバーバックの語彙数; ハリポタ

お名前: 酒井@快読100万語!
投稿日: 2006/8/10(22:34)

------------------------------

カリフォルニア・ガイさん、こんばんは!

〉酒井先生、

〉ありがとうございます。もともと再読、三読は好きで気に入った本ならそれこそ5回でも10回でも読むたちなんでそうします。読んでみたい本は机の上に置いておいて、ふと読めそうな気がしたら即チャレンジするということで。
〉英語だからといって特別な読み方があるわけでなく、日本語の本のように読むというのが眼目でしょうから。

うらやましい!
ぼくはほとんど再読はしない人・・・だったんですが、
今回原稿書きに専念するために新しい本は買わないと決めたら、
なんのことはない、すでに買ってある本の再読をはじめまして、
これがまるではじめてのように、おもしろい!
Michael Connellyなんですが、まもなく全巻再読完了といった勢いです!

5回も10回も読むなんて、とっても質のよい吸収になるでしょうね。

ではね、カリフォルニア・ガイさん、再読、三読で、Happy reading!


上へ上へ | 前のメッセージへ前のメッセージへ | 次のメッセージへ次のメッセージへ | ここから後の返答を全表示ここから後の返答を全表示 | 返答を書き込む返答を書き込む | 訂正する訂正する | 削除する削除する

1955. Re: ペーバーバックの語彙数; ハリポタ

お名前: カリフォルニア・ガイ
投稿日: 2006/11/21(15:46)

------------------------------

こんにちは。

結局全冊読破したSidney Sheldonの中で audible で購入できるものを選んで再読しています。読み聞きを平行しているので聞くだけより大分楽ですね。読み飛ばしと同じように聞き飛ばしができるようになるのが目標です。

〉5回も10回も読むなんて、とっても質のよい吸収になるでしょうね。
〉ではね、カリフォルニア・ガイさん、再読、三読で、Happy reading!


タイトル一覧へ(返答順)(B)

タイトル一覧へ(日付順)


Maintenance: SSS 事務局
KINOBOARDS/1.0 R7.3: Copyright © 1995-2000 NAKAMURA, Hiroshi.