著者
中東 靖恵
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.31, no.6, pp.461-476, 2018-09-20 (Released:2019-09-20)
参考文献数
72
被引用文献数
1

本稿では,社会言語学研究が発展する中で,言語研究が直面してきた多人数質問調査法における調査対象者の選定方法をめぐり,有意サンプリングの問題点と有効性について,主にランダムサンプリングと比較しながら述べた.言語研究における多人数調査は有意サンプリングによるものが最も多く,有意サンプルの調査は母集団の代表性に問題があるとされる一方,方言研究などそもそもランダムサンプリングが適用できない場合もあり,有意サンプリングによる多人数調査は事例研究として意義あるものと考える.また,近年の社会情勢の変化や法改正に伴い,個人情報保護の問題,外国人住民の増加,エスニシティ,ジェンダーとの関わりなど,今後の言語調査において検討すべき課題についても触れた.
著者
樋口 耕一
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.31, no.1, pp.36-45, 2017-06-20 (Released:2018-08-01)
参考文献数
2
被引用文献数
6

本稿では筆者が開発・公開しているテキストデータの計量分析用ソフトウェア「KH Coder」について,言語研究の分野で活用するための手順を紹介する.第一に,KH Coderの主な機能と開発の狙いを紹介することで,このソフトウェアの全体像を示す.KH Coderはもともと言語研究の分野ではなく,社会学・社会調査分野という異なる背景の中で開発されているので,活用のためには全体像を把握しておくことが有用であろう.第二に,KH Coderを言語研究の分野で用いるためのカスタマイズについて紹介する.たとえば,そのままの設定では,KH Coderは助詞・助動詞のような機能語を無視して内容語だけを分析に用いる.この設定を変更して機能語を分析の対象にする方法や,ソフトウェアが自動的に行なった形態素解析の結果を人手で修正する方法などを紹介する.
著者
松田 映二
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.31, no.4, pp.299-314, 2018-03-20 (Released:2019-07-31)
参考文献数
19

電話調査は,公的な名簿や電話帳を利用して調査対象者を選ぶ方法で始まった.電話帳に番号を掲載しない人を捕捉できなければ,調査ができず調査結果が偏るから,電話番号を乱数発生(RDD)させる方法に移行した.携帯電話番号も対象にして調査をすれば,携帯電話だけ所持する若年,中年層の多くも捕捉できる.ただし,携帯電話への調査は,回収率がとても低く,日本においては番号に地理情報が付加されていないという欠点がある.本稿は,電話法の利用に資する判断材料を提供する.
著者
大川 孔明
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.31, no.8, pp.555-571, 2019-03-20 (Released:2020-03-20)
参考文献数
19
被引用文献数
3

本論では,作品の文体を構成するさまざまな指標に基づいて分類を行ったとき,平安鎌倉時代の文学作品がどのような特徴を持つ文体類型に分けられるのかという点を,MVR-名詞率,文の長さ,会話文率,語種率(和語率,混種語率,漢語率),引用の「と/など」比率を指標にクラスター分析を用い考察した.その結果,平安鎌倉時代の文学作品には,和漢混淆文型,典型的和文型,初期和文型,日記文学型①,日記文学型②の5類型があることが明らかになった.さらに,和漢の対立やジャンルに基づく文体がどのような文体的特徴として表れるのかという点についても示し,複数の視点から文体を位置づけることの有効性を示した.
著者
中俣 尚己
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.33, no.3, pp.205-213, 2021-12-20 (Released:2022-12-20)
参考文献数
2

数値データを比率を用いて表すことは広く行われているが,それゆえに不適切な利用も目立つ.本稿では比率をパーセントで表示する意義とその際の注意点についてまとめた. まず,パーセントを内訳として使用する際には,100を超えるデータの情報を圧縮して示しているということに留意が必要である.非常に少ないデータをパーセントで表示したり,小数点以下の値を細かく記述することは不適切な利用である.また,比率を用いて異なる母数のデータを比較するときは何に対する比率であるかを意識することが重要である.パーセント表示された値の差はパーセントポイントという単位を使って示さなければならない.また,パーセント以外の比率の単位も存在する.コーパス言語学で用いられるpmwという単位についても紹介した.
著者
麻 子軒
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.32, no.2, pp.103-116, 2019-06-20 (Released:2020-09-20)
参考文献数
15

役割語をテレビゲームという新しい言語資料を用いて,計量的アプローチで分類・抽出した.『ドラゴンクエスト3』のキャラクターの発話における代名詞や助詞などの特徴量をクラスター分析と特化係数で解析した結果,①格助詞「が/を」,副助詞「は」があまり用いられない「異人ことば」,②代名詞「あたし」,助動詞「ちゃう」,副助詞「ったら/なんて」,接続助詞「けれど」,終助詞「かしら/もの/わ/の/ね」,感動詞「きゃー/まあ/あら」が多用された「女ことば」,③特徴語が観察されない「中立ことば」,④代名詞「そなた/わし」,助動詞「じゃ/とる/である/まい」,副助詞「なぞ」,終助詞「のう/ぞい/ぞ」,感動詞「やれやれ」が多く見られる「老人ことば」,⑤代名詞「おめえ/オレ/あんた」,助動詞「やがる/ちまう/てやる」,副助詞「なんか」,終助詞「ぜ/い/さ」,感動詞「へい/おい」が特徴的な「男ことば」,⑥代名詞「ボク」,終助詞「よう/さ/や/なあ」,準体助詞「ん」,感動詞「わーい/ねえ」が多用された「少年ことば」の6つの分類を得た上,従来では注目されていない副助詞と接続助詞も役割語的要素である可能性を示した.
著者
本多 由美子
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.31, no.1, pp.1-19, 2017-06-20 (Released:2018-08-01)
参考文献数
13

本稿では,二字漢語における語の透明性の量的な傾向を明らかにし,日本語教育に活用できる情報を得る目的で,書き言葉において頻度の高い語について,調査,分析を行った.語の透明性は「透明」,「片透明(かたとうめい)」,「不透明」に3分類し,調査の際には,客観性を考慮し,辞書に書かれている語義の説明を用いた.分析の結果,以下の3点の結果が得られた.(1)書き言葉において,頻度の高い語には,3分類がそれぞれ一定の割合で存在する.(2)日本語能力試験の初級よりも中級以上の語のほうが「透明」の割合が高く,「不透明」の割合は,初級のほうが高い.(3)日本人大学生を対象にした調査と辞書の説明を利用した調査は,結果の傾向が類似する.これらの結果から,透明性の傾向は日本語教師が教育の内容を検討する際に利用できる情報であることを述べた.
著者
和田 英一
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.20, no.3, pp.p123-127, 1995-12
著者
小林 雄一郎 岡﨑 友子
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.33, no.7, pp.451-465, 2022-12-20 (Released:2023-12-20)
参考文献数
19

本研究は,日本語歴史コーパスに収録された奈良時代から大正時代までのテキストを用いて,指示代名詞の通時的分析を行うものである.指示代名詞の形態は時代によって若干異なるため,系列別(コ系列,ソ系列,カ系列,ア系列),型別(ゼロ型,ノ型,レ型,コ型,ナタ型,チ型)の分類に基づく分析を行った.具体的には,系列別・型別に集計された頻度に対してLOESS平滑化を実行することで,指示代名詞の使用傾向の経年変化を調査した.そして,(1)指示代名詞の総数が増加していくこと,(2)ソ系列は増加傾向を示し,コ系列とア系列は1700〜1800年代に多く,カ系列は緩やかに減少したあとで再び増加すること,(3)ゼロ型は減少傾向,レ型は増加傾向を示し,ノ型は1700年以降に増加し,他の3つの型はいったん増加したあとで減少すること,などを明らかにした.
著者
岩崎 拓也
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.31, no.6, pp.426-442, 2018-09-20 (Released:2019-09-20)
参考文献数
18

正書法が一般に浸透していない日本語の文において,読点を打つ・打たないということは恣意性の高い選択である.本研究では,接続詞の直後に読点が打たれる要因を探ることで,日本語の文における読点使用の理由の一端を明らかにすることを試みた.分析データには,BCCWJ のコアデータを使用し,モデル構築にはElastic Netを用いた正則化付きの一般化線形モデルを作成した.この手法をとることで,過学習を防ぐことと,従来では扱うことができなかった情報量の多い変数を取り扱うことができる.モデル評価には,10分割サンプルによる交差検証を実施した.今回構築したモデルを用いて元データの再分類を行った結果,再現率は78.99%であった.また,係数を確認したところ,語彙素「で」,接続詞が文頭にあるとき,語彙素「が」,レジスター「白書」,語彙素「然しながら(しかしながら)」といった指標が接続詞の直後に読点が打たれる強い指標であった.
著者
野村 雅昭 伊藤 菊子
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.11, no.7, pp.p306-311, 1978
被引用文献数
1
著者
麻 子軒
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.32, no.2, pp.103-116, 2019

役割語をテレビゲームという新しい言語資料を用いて,計量的アプローチで分類・抽出した.『ドラゴンクエスト3』のキャラクターの発話における代名詞や助詞などの特徴量をクラスター分析と特化係数で解析した結果,①格助詞「が/を」,副助詞「は」があまり用いられない「異人ことば」,②代名詞「あたし」,助動詞「ちゃう」,副助詞「ったら/なんて」,接続助詞「けれど」,終助詞「かしら/もの/わ/の/ね」,感動詞「きゃー/まあ/あら」が多用された「女ことば」,③特徴語が観察されない「中立ことば」,④代名詞「そなた/わし」,助動詞「じゃ/とる/である/まい」,副助詞「なぞ」,終助詞「のう/ぞい/ぞ」,感動詞「やれやれ」が多く見られる「老人ことば」,⑤代名詞「おめえ/オレ/あんた」,助動詞「やがる/ちまう/てやる」,副助詞「なんか」,終助詞「ぜ/い/さ」,感動詞「へい/おい」が特徴的な「男ことば」,⑥代名詞「ボク」,終助詞「よう/さ/や/なあ」,準体助詞「ん」,感動詞「わーい/ねえ」が多用された「少年ことば」の6つの分類を得た上,従来では注目されていない副助詞と接続助詞も役割語的要素である可能性を示した.
著者
水谷 静夫
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.16, no.7, pp.p281-312, 1988-12
著者
松田 謙次郎
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.32, no.2, pp.66-81, 2019

国立国語研究所が実施した岡崎敬語調査の反応文から,「足りない」~「足らない」(タリタラ)の変異を抽出し,実時間分析を試みた.東西分布を示すタリタラの接触地帯にある岡崎市では,タリ率は1次調査から2次調査にかけて低下し,2次調査から3次調査にかけて大きく上昇するV字型パターンを示す.同一話者の変化パターンを見ると,調査回次を重ねるにつれて異なる形式を選択しにくくなるが,変化は初回調査の年齢とは相関しない.つまり習得の臨界期を越えても異なる形式が採用されうることから,語彙の習得と考えられる.男女差,共通語における分布などから判断すると,1次調査から2次調査へのタリ率の下降はタラ地域である名古屋方言への志向,2次調査から3次調査に向けての上昇は岡崎方言への回帰として捉えられるべきであることを主張した.
著者
入江 さやか 金 明哲
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.32, no.1, pp.1-18, 2019-06-20 (Released:2020-06-20)
参考文献数
59

日本の方言は,これまで多くの先行研究によって,語彙・文法・音韻などの違いから,種々に分類されてきた.構造言語学的な体系的基準による分析は当然行われるべきことであるが,現実の言語行動において,実際に使用された頻度を考慮した分類も重要であると考える.そこで,本研究では,自然談話における拍のbigramの頻度データを使用し,近隣結合法を用いた系統樹を作成して,各地方言の分類を行った.その結果,北アルプスを境として,東西に分かれ,岐阜と愛知は共に西に分類できた.次に,東西の方言における拍bigramの特徴を見るために,比率差の検定を行ったところ,東では「ンダ・ネー・ダカ・ッテ・ダッ・ダヨ・ガラ」,西では「ナー・モー・(u)ーテ・ホイ・ンヤ・ンジャ・ソヤ」が,有意な差が見られる拍bigramとして上位に抽出された.