著者
荒牧 英治 増川 佐知子 森田 瑞樹 保田 祥
雑誌
研究報告自然言語処理(NL)
巻号頁・発行日
vol.2012-NL-208, no.9, pp.1-8, 2012-08-26

これまで言語学で高い関心を集めている問題の1つに人間の語彙数がある.数々の調査がなされてきたが,その多くは,理解できる語彙(理解語彙)の調査にとどまり,実際に使用する語彙(使用語彙)についてはどのくらいのものか,いっこうにわからないとされてきた.本研究では,ウェブ上の発言データを利用し,10万人という大規模な人数で使用語彙調査を行った.調査の結果,使用語彙は平均8,000語であることが明らかになった.さらに,同データを用いて,語のユーザ数の調査を行った.この結果,ユーザに偏りがある語や偏りがない語のリストが得られた.このようなユーザ数にもとづいたリストは本研究で初めて得られたものである.

言及状況

はてなブックマーク (1 users, 2 posts)

[+言葉][視覚][+交通][website] 「日本人のオンライン・コミュニケーション上での平均使用語彙数は8,000語である/Average Japanese Vocabulary for Online Communication is 8,000 words」昨日から急に、職場でこの報文がしきりと話題にのぼっている、世の中は狭い (苦笑)
[+言葉][視覚][+交通][website] 「日本人のオンライン・コミュニケーション上での平均使用語彙数は8,000語である」昨日から急に、職場でこの報文がしきりと話題にのぼっている、世の中は狭い (苦笑)

Twitter (19 users, 19 posts, 51 favorites)

日本人のオンライン・コミュニケーション上での平均使用語彙数は8,000語である https://t.co/futqKGF2oy という論文がありまして…… Twitterなら8,000語あればやりとりできるのに、国語辞典は小学生向けで3万超、一般向けは7万とか8万とか25万とか。 なぜそんなに収録しているかというと…… (Og)

収集済み URL リスト