著者
荻野 綱男
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.33, no.1, pp.28-39, 2021 (Released:2022-06-20)

データには質的データと量的データがあるが,それとは異なる視点として,計量的な見方と非計量的な見方がある.本稿では,計量的な見方による日本語研究がどんなものであるか,用例調査,コーパス,多人数質問調査などを例にして,その概略を述べた.また,計量的な研究が現代日本語学で多く行われていること,そのような研究は,幅広い学問領域に共通の研究のしかたであることを述べた.統計学とはどんなものか,記述統計学,推測統計学,探索統計学に分類してそれぞれについて解説した.さらに,統計学的な見方と計量的な見方の関係について,統計学が理論的,基礎的なデータ分析方法を追及するのに対し,計量的な研究は応用的,実践的なデータ分析を志向するという立場から述べた.計量的な言語研究を目指す上では,調査が重視されるが,その際のポイントとして,調査計画の重要性と調査結果の解釈の重要性を述べた.
著者
前川 喜久雄 山崎 誠 松本 裕治 傳 康晴 田野村 忠温 砂川 有里子 田中 牧郎 荻野 綱男 奥村 学 斎藤 博昭 柴崎 秀子 新納 浩幸 仁科 喜久子 宇津呂 武仁 関 洋平 小原 京子 木戸 冬子
出版者
大学共同利用機関法人人間文化研究機構国立国語研究所
雑誌
特定領域研究
巻号頁・発行日
2006

当初の予定どおりに、5000万語規模の現代日本語書籍均衡コーパスを構築して2011年に公開した。同時に構築途上のコーパスを利用しながら、コーパス日本語学の確立にむけた研究を多方面で推進し、若手研究所の育成にも努めた。現在、約200名規模の研究コミュニティーが成立しており、本領域終了後も定期的にワークショップを開催するなど活発に活動を続けている。
著者
荻野 綱男
出版者
日本大学
雑誌
基盤研究(C)
巻号頁・発行日
2005

日本語研究のための資料として、WWWを用いるためのいくつかの手法を開発した。その中の一つは、ブログを利用して日本語の男女差を見ようというものである。「あたし」はほぼ女性が使用し、「おれ、ぼく」はほぼ男性が使用することを利用して、男女差がありそうな単語多数と「あたし、ぼく、おれ」が共起する程度を、WWWを検索して求め、その頻度の偏りに基づいて、それぞれの単語の「男女度」を明らかにした。すでに、男女差があるといわれる単語(つまり、男性あるいは女性に偏って使われる単語)を対象にして調べた限りでは、比較的うまくいくことがわかった。しかし、小さな男女差しかなく、判定が微妙な場合では、WWW資料として調べても、いい結果にならなかった。一方、今まで気づかれなかったような男女差を新たに発見したこともある。いずれも使要頻度の偏りがあり、それは男女別の話題の選択に関連しているのだが、今までは一般に男女差として意識されなかったような単語であった。この結果から、WWWは、男女差を調べるような、社会言語学的な研究にも利用可能であることが明らかとなった。
著者
荻野 綱男
出版者
筑波大学
雑誌
一般研究(C)
巻号頁・発行日
1990

現代日本語の名詞シソーラスを作成しながら、語彙の意味分類の多様性についての研究を行った。現在までに、シソーラスを通して現代日本語の名詞の意味分類ができあがりつつあるが、こうして似た意味の単語をまとめてみると、全体が不整号になる現象が発生する。そこで、ある単語のグループを取り出して、そのグループが確かにグループになっているかどうかを検討することにした。シソーラスに関するさまざまな処理はパソコンを用いて行っているが、プログラムなどの整備が進み、シソーラスの効率的な検索を行うプログラムができあがった。このプログラムの完成によって、パソコン上でわかりやすい形でシソーラスが検索でき、またそれを利用してシソーラスのチャックができるというような態勢ができあがった。また、シソーラス全体を圧縮してフロッピーに格納するコマンド、およびフロッピーからハードディスクに圧縮を解除しながら格納するコマンドも作成した。以上の結果、シソーラスをフロッピー版で公開する用意が整った。