著者
松田 謙次郎 Kenjiro MATSUDA
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.11, pp.63-81, 2016-07

大正~昭和戦前期のSP盤演説レコードを収めた岡田コレクションでは,「場合」の読みとして「ばやい」という発音が多数を占めている。これに対して辞書記述,コーパス,国会審議の会議録・映像音声などを調査すると,現代語における読みでは「ばあい」が圧倒的多数を占めており,「場合」の発音が岡田コレクションの時代から現代にかけて大きく変化したことが窺われる。「ばやい」は寛政期の複数方言を記した洒落本に登場する形式であり,明治中期に発表された『音韻調査報告書』は「ばやい」という発音が全国的に分布する方言形であったことを示す。本論文では岡田コレクションにおける「ばやい」という発音が,講演者達の母語方言形であり,その後標準語教育が浸透するなかで「ばやい」が方言形,さらに卑語的表現として認知され,最終的に「場合」の読みとして「ばあい」が一般化したことを主張する。A survey of the recordings in the Okada Collection, a collection of speeches from the Taisho era to the early Showa era (from the 1910s to 1940s), shows that the most popular pronunciation of the word baai (場合) was bayai, and not baai. This is in stark contrast to contemporary Japanese, where, if we follow the distribution of dictionary entries, statistics based on the corpora, and actual pronunciations employed in Diet meetings, the word is pronounced as baai by an overwhelming majority. This paper attempts to account for the difference through examining corpus data, historical documents, and dialectological survey results. The form bayai appears in Sharebon, a late Edo-period novelette, from multiple dialectal areas; further, the On-in Chosa Hokokusho, the first official nationwide dialectological survey by the government published in 1905, indicates that bayai was a rather common dialectal form used in a number of dialects across the country. This paper claims that speakers from the Okada Collection simply used their native dialectal forms. With the spread of Standard Japanese after World War II, bayai has come to be recognized as a dialectal form, and in fact, even as a vulgarism. Baai, in contrast, emerged as the standard form that is widely used in contemporary Japanese. Although further research is required to trace the word's exact development in the post-WWII era, this paper demonstrates the historical value of the Okada Collection for the study of the development of contemporary Japanese.
著者
福永 由佳
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.8, pp.33-50, 2014-11

在日パキスタン人は人口規模こそ小さいものの,中古車輸出業をはじめとするエスニック・ビジネスの展開,宗教施設の設立など,自立的な社会活動を展開する活力の高いエスニック集団である。また,彼らは生活のなかで複数の言語を使用する多言語使用者でもある。彼らの多言語使用の実態と言語使用に関わる社会文化的要因をEthnolinguistic Vitality Theoryにもとづき明らかにすることを目指して,本稿では(1)多言語使用に関する諸理論を検討するとともに,(2)参与観察と言語意識調査で得られた定性的データを用いて,Ethnolinguistic Vitality Theoryの適応可能性を検討した。分析の結果,彼らは母国の言語事情や社会構造および日本における社会文化的文脈から形成された言語意識をもとに,複数の言語(日本語,英語,ウルドゥー語,アラビア語,民族語)を使い分けている様相が明らかになった。また,データに見られた言語意識はEthnolinguistic Vitality Theoryの枠組みで説明しうることが示唆された。
著者
阿部 新
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.8, pp.1-13, 2014-11

本研究では,日本語学習者の文法学習と語彙学習に対するビリーフについて,世界各地の学習者を対象とした先行研究結果を取り出して地域的特徴を考察した。さらに,先行研究で明らかになっているノンネイティブ日本語教師のビリーフの傾向,日本人大学生や日本人教師のビリーフ調査の結果とも比較した。その結果,文法学習も語彙学習も大切だというビリーフに学生が強く賛成し,現地のノンネイティブ日本語教師と同じ傾向を示す地域(南アジア,東南アジア),そのようなビリーフに学生は賛成するが,それほど強く賛成するわけではなく,現地のノンネイティブ日本語教師の傾向とも近い地域(西欧,大洋州),前2者の中間程度の強さで学生がビリーフに賛成し,教師のビリーフとはやや異なる傾向の地域(中南米,東南アジア・東アジアや大洋州の一部)など,地域による違いが見られた。さらに,日本人の結果を見てみると,日本人大学生や教師歴がごく短い日本人教師は,文法学習も語彙学習も大切ではないというビリーフを持ち,世界各地の学習者とは異なる傾向を示す。一方,経験豊富な教師は世界各地の学習者と同じような傾向であることも分かった。最後に,こういった傾向を把握したうえで,文法・語彙のシラバス・教材作成と普及を行う必要があることを指摘した。
著者
バンス ティモシー・J
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.9, pp.207-214, 2015-07

長年にわたる日本語の連濁研究の結果,制約は色々見出されているが,すべて傾向に過ぎず,包括的な規則はないということが明らかになっている。しかし,21世紀に入り,ローゼンが連濁現象を新鮮な目で見て,独創的な成果を上げた(Rosen 2001, 2003)。「ローゼンの法則」とは,複合語の前部要素と後部要素が両方とも和語名詞の単一形態素であれば,どちらか(または両方)が3モーラ以上の場合は,連濁の有無が予測できるという旨の仮説である。具体的に言うと,これらの条件を満たす連濁可能な複合語は,後部要素が連濁に免疫がない限り,必ず連濁するという主張である。反例がまったくないわけではないが,きわめて強い傾向であることは否定できない。本稿の目的は,以下の三つである。まず,第1〜2節でローゼンの研究を簡潔に紹介する。次に,第3〜5節で和語名詞単一形態素以外の要素を含む複合語に考察を広げ,要素の制限を緩和しても,ローゼンの法則がある程度当てはまることを示す。最後に,第6節でローゼンが提案した理論的説明に着目し,残念ながらこの説明は説得力が乏しく,法則の根本原因は依然として謎であることを指摘する。
著者
柳村 裕 Yu YANAGIMURA
出版者
国立国語研究所
雑誌
国立国語研究所論集 = NINJAL research papers (ISSN:2186134X)
巻号頁・発行日
no.12, pp.205-225, 2017-01

東京外国語大学 特別研究員本研究では,岡崎敬語調査資料の分析に基づき,「敬語の使用」と「話者の職業」がどのような関係にあるかを探る。敬語使用の特徴に関わる指標として発話の「丁寧さ」と「長さ」を集計し,話者の職業は「事務系」「接客系」「労務系」の三つを区別した。これらの敬語使用の特徴が話者の職業によってどう異なるかを調べた。また,岡崎敬語調査資料の複数の調査時点での多様な生年・年齢の話者を比較することにより,職業による敬語使用特徴の差異のパターンがどのように変化してきたか,また,個人内でどのように変化するかを調べた。結果の概要は以下の通り。まず,事務系,接客系,労務系のうち,労務系が最も短くぞんざいに話す。事務系と接客系では,発話の長さは同程度であり,丁寧さは事務系のほうがわずかに高い。また,経年変化パターンに関して,接客系の話者は年齢が高くなるほど長く丁寧に話すようになる。つまり,言語形成期以降の加齢に伴う言語変化である「成人後採用」のパターンが観察される。事務系と労務系では,成人後採用は観察されないか,あるいは観察されたとしてもその変化幅が接客系のものより小さい。以上の分析結果に基づき以下のような解釈を行った。まず,敬語使用特徴の職業差は,職務の中での敬語使用の違いによるものとして説明できる。つまり,職務の中での敬語使用は,職務以外の私的な場面での敬語使用に影響を与えると解釈できる。また,職務の中での敬語使用の違いは,敬語の習得・変化のパターンにも影響すると解釈できる。以上より,職業という話者属性は,敬語の使用・習得・変化と,それらの社会的変異を理解する上で重要な話者属性の一つであるといえる。
著者
舩橋 瑞貴 Mizuki FUNAHASHI
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.12, pp.13-27, 2017-01

日本語と韓国語の口頭発表における修復(注釈挿入と言い直し)を取り上げ,修復を実現する際の言語的手段が異なることをみる。助詞の言い直しにおいては,選択される言語的手段が助詞と名詞の膠着度の異なりとかかわっている可能性を示す。さらに,助詞と名詞の膠着度が低い日本語に関しては,言い直しの開始位置と関係があることを示す。従来の対照研究では,言語体系内の要素を対照単位とするアプローチが多くとられるが,日本語教育のための対照研究においては,ある言語行為を行う際の言語的手段の選択というアプローチも必要であることを主張する。This paper examines the language in repair (annotation insertion and self-repair) in Japanese and Korean oral presentations and confirms different verbal measures used to realize these repairs. The self-repair of particles, which is one of the representative self-repairs, implies the possibility that the selected verbal measures are associated with differences in the agglutination degree of the particles and nouns. Further, it is shown that in Japanese, in which the agglutination degree of the particles and nouns is low, these are connected with the start position of the self-repair. In most approaches used in conventional contrastive analysis, the elements in the language system are assumed as units for comparison; however, I believe that approaches involving the selection of verbal measures for specific language actions are also needed in contrastive analysis for Japanese language education.
著者
加藤 祥 柏野 和佳子 立花 幸子 丸山 岳彦
出版者
国立国語研究所
雑誌
国立国語研究所論集 = NINJAL research papers (ISSN:2186134X)
巻号頁・発行日
no.8, pp.85-108, 2014-11

国立国語研究所 コーパス開発センター プロジェクト研究員国立国語研究所 言語資源研究系国立国語研究所 コーパス開発センター 技術補佐員国立国語研究所 言語資源研究系書籍テキストに見られる「語りかける」という文体の特徴を報告する。調査対象には,『現代日本語書き言葉均衡コーパス』(BCCWJ)に収録されている図書館サブコーパスを使用した。コーパスを用いた文体分析を行うにあたっては,語や文脈的な語の結びつきなどの頻度情報のほか,コーパスに付与された書誌情報やアノテーターによる作業コメントなどを用いた。「語りかける」という文体は,エッセイやブログなどのくだけたテキストにのみ出現しやすく,直接的に読み手へ呼びかけや問いかけを行うなどの表現を有すると考えられてきた。しかし,書籍においては,いわゆるハウツー本をはじめとするような教示的な態度を示すテキストに出現しやすい傾向があり,必ずしも直感的に「語りかける」ととらえられる表現が多く含まれるばかりではないことがわかった。本稿は,テキストが「語りかける」と読み手が判断した際に,文脈に依存した表現や,テキストに向かう読み手の前提的態度などが影響していたことを示す。
著者
大滝 靖司
出版者
国立国語研究所
雑誌
国立国語研究所論集 = NINJAL research papers (ISSN:2186134X)
巻号頁・発行日
no.6, pp.111-133, 2013-11

中央大学高等学校本研究は,日本語における英語からの借用語で起こる促音化の辞書データを分析し,生起要因を考察する。その結果から,借用語の促音化には「語末の促音化」と「語中の促音化」の2タイプがあることを指摘する。前者は原語の語末子音を借用語でも音節末子音として保持するための現象である一方,後者は原語の音配列および重子音つづり字の影響を受けた現象であることから,借用語音韻論で扱うべき音韻論的な借用語の促音化は,語末の促音化であることを主張する。また,両者の中間的な環境における促音化パタンを細かく観察し,それらが語末の促音化が起こる「語末」の環境であるのか,あるいは,語中の促音化を引き起こす「語中」とみなされているのかを論じることで,借用語の促音化の全体像を捉える。
著者
儀利古 幹雄
出版者
国立国語研究
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.1, pp.1-19, 2011-05
被引用文献数
1

国立国語研究所 理論・構造研究系 プロジェクト研究員本研究では,現在の東京方言における外来語複合名詞のアクセントを記述し,そこに観察されるアクセントの平板化現象に関わる言語内的要因を考察する。本研究で実施した,2世代の東京方言話者に対するアクセント調査の結果,(i)従来の記述と異なり,若年グループにおいて平板型複合名詞アクセントが観察されること,(ii)話者が若年グループであっても,アクセントの平板化は,後部要素が重音節(1音節2モーラ)であり語末特殊拍が撥音である場合においてのみ観察されること,以上の2点が主に明らかになった。
著者
上野 善道 Zendo UWANO
出版者
国立国語研究所
雑誌
国立国語研究所論集 = NINJAL Research Papers (ISSN:2186134X)
巻号頁・発行日
no.20, pp.115-147, 2021-01

東京大学名誉教授岩手県沿岸北部に位置する田野畑村方言について,体言および用言活用形を対象とした調査の報告を行なう。そこには3モーラ名詞の第6・7類や活用形のいくつかに北奥方言の中で最も古いと推定される特徴が見られ,それらが北奥アクセント祖体系の拙案とほぼ一致することを述べたあと,その資料に基づいて祖体系案の微修正をする。
著者
島田 泰子 芝原 暁彦 Yasuko SHIMADA Akihiko SHIBAHARA
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.12, pp.111-124, 2017-01

二松学舎大学国立研究開発法人 産業技術総合研究所 地質標本館室/産総研技術移転ベンチャー 地球科学可視化技術研究所方言分布形成の解明にとって重要な参照事項である地形情報ならびに各種地理情報を,正確かつ直感的に参照できる方法として,精密立体投影(HiRP = Highly Realistic Projection Mapping)という手法の導入を提言する。DEM(数値標高モデル)に基づく三次元造形物である精密立体地形模型を作成し,その表面に,プロジェクターによる光学投影(プロジェクションマッピング)を行い各種の地理情報を重ね合わせることで,地形・河川の流路・交通網などといった複数の地理情報を,同時に照合することが可能となる。言語地図における言語外地理情報の照合作業は,従来,特殊な鍛錬なしには困難を伴うものであったが,この精密立体投影(HiRP)により,その精度が飛躍的に向上する。本稿では,精密立体投影(HiRP)の技術や装置の詳細を紹介するとともに,具体的な分析事例として,長野県伊那諏訪地方における「ぬすびとはぎ(ひっつき虫)」の分布データにおける経年変化を取り上げ,これを検証する。
著者
上野 善道
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.2, pp.135-164, 2011-11

琉球与那国方言の動詞活用形のアクセントを調査し,150項目について26の活用形の資料を提示した。体言と同様,動詞も3つのアクセント型に分かれるが,そのパターンは大きく6つに分類される。終止形がA型の動詞はすべての活用形がA型のまま一貫する。今のところ1例しか見つかっていない終止形C型もC型でほぼ一貫するが,一部にB型が主に併用で出る。それに対してB型は,すべてB型で一貫するタイプの他に,その中で段階的にC型の数が増える3つのタイプに分かれる。
著者
上野 善道 Zendo UWANO
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.12, pp.139-161, 2017-01

五十嵐陽介(2016)が提案した「日琉語類別語彙リスト」にある2拍名詞641語について,アクセント比較研究の推進を目的として,奄美徳之島浅間方言のアクセント資料を提示する。With a view to promoting comparative study of Japanese and Ryukyuan, this paper presents the accent data from the Asama dialect in Ryukyuan Tokunoshima with particular reference to 641 two-mora nouns in the accent-class list of Proto-Japanese-Ryukyuan proposed by Igarashi (2016).
著者
フォキル レザウル・カリム
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.8, pp.15-31, 2014-11

本研究の目的は,四つのパラメータ,即ちi)関係節における名詞化の作用,ii)主節と関係節の連携性,iii)参照的一貫性,iv)名詞句の接近可能性階層,に沿って,関係節における日本語対ベンガル語の対照分析を行い,日本語の関係節に見られる言語固有の特性を明らかにすることである。関係節における日本語固有の特性は,名詞句形成に必要な二つの条件:i)過程的条件として行われる名詞化の処理基準と,ii)実質的条件として満たし得る形態統語論的基準に基づくものである。そのためこの二つの条件は,名詞句の関係節としての解釈を導くものである。また,この条件を軸にした分析から,定形節から二段階の過程を経て名詞化され,定形節の何れかの項からなる名詞句が形成される,そのような名詞句のみが,関係節としての形態統語論的基準を満たすことを示す。つまり,このプロセスを経て形成された名詞句は,関係節としての解釈を受ける。なぜなら関係節の述語動詞が示すギャップの位置に生じ得る要素と主要部名詞が参照的一貫性を共有するからである。
著者
松井 真雪 ホワン ヒョンギョン Mayuki MATSUI Hyun Kyung HWANG
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.14, pp.89-97, 2018-01

置換反復発話とは,直前の発話の分節音を別の分節音に置き換えてプロソディー特徴を反復する発話である。置換反復発話はプロソディー研究の方法論として注目されているが,その性質については未解明の問題が多い。この小論では,疑問文の文脈(句末境界音調の1つである上昇音調がアクセントと共起する条件)で,通常発話と置換反復発話の音声特徴を比較した結果を報告する。とりわけ,アクセントの弁別にとって主要であると考えられる基本周波数(F0)特徴は,上昇音調が共起する場合でも,置換反復発話に遜色なく反映されることを示す。この結果から,置換反復発話は,アクセントパタン,即ち,語のプロソディーの研究において有用であるという先行研究の見解が支持・補強される。その一方で,イントネーション,即ち,文のプロソディーに関わるF0特徴の一部は置換反復発話に正確に反映されないことが明らかになった。"Reiterant speech" (Larkey 1983) refers to a particular kind of speech, in which the prosody of the preceding utterance is reiterated but segments are substituted with others to minimize micro prosody. The current paper reports on a complementary study designed to examine the replicability of lexical and post-lexical pitch patterns in the reiterant speech. Acoustic patterns of the reiterant speech were compared with those of the normal speech in an interrogative context with rising boundary tone. The results demonstrate that the F0 height and fall timing attested in normal speech, which are related to the lexical pitch contrast, were replicated in the reiterant speech even in the interrogative context, extending the finding of the previous study. On the other hand, the results suggest that some post-lexical F0 properties, such as the degree of the rise of the boundary rising tone, were not completely replicated in the reiterant speech.
著者
上野 善道 Zendo UWANO
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.14, pp.293-322, 2018-01

奄美徳之島浅間方言のアクセント資料の続きを提示する。今回は,上野(1983, 1985)の5~8モーラ語,および上野(1987b)の4モーラ語の2種類の語彙リストを用いて調査をした結果を掲げる。本稿で扱う調査項目は1400語あまりとなる。In this paper, accent data from the Asama dialect in Tokunoshima are presented. The data are based on two word lists: (1) the list of nouns of five to eight morae (Uwano 1983, 1985), and (2) the list of four-mora nouns (Uwano 1987b). The total inventory includes more than 1,400 words.
著者
加藤 祥 Sachi KATO
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.14, pp.55-72, 2018-01

コーパスの頻度情報は有用なデータであり,COBUILDやウィズダム英和辞典などの辞書に語や意味の重要度の指標として活用されている。ある対象物に関する様々な要素のうち重要なものは,テキストにおいて高頻度で言及されている可能性が高い。動物の身体部位語の頻度を調査したところ,ある動物において特徴的と考えられる角のような要素の頻度が高い傾向が見られた。また,対象物の有する要素とその頻度分布情報から,対象物を認識することも可能という実験結果も得られた。我々は対照する他物との差異となり得る特徴的な要素に着目し,それらが高頻度であることを期待する。しかし,高頻度であると期待される要素が,必ずしも高頻度で言及されていない場合がある。たとえば,それぞれ馬と人との差異として角を有するユニコーンと鬼を見ると,ユニコーンの角は期待通りの高頻度で言及されるが,鬼の角は頻度が低い。期待される頻度と実頻度に差の生じる一因は,用例において比喩表現に現れていた。外観上特徴的な要素は,形状を表す喩辞として用いられる傾向がある。ゆえに,固定的なイメージがない場合には比喩表現として用いられにくい。また,対照されやすい他動物が被喩辞となる比喩表現では,差異となる要素こそあえて言及する必要がない。このように,特徴的な要素と用例頻度の関係には,比喩表現のような表現形式が関わるため,頻度情報を用いる際には考慮が必要である。Many dictionaries, such as the Collins COBUILD English language dictionary and WISDOM English-Japanese Dictionary, use corpus frequency data as the basis for determining the importance of words or word meanings. Based on the corpus frequency data, we assume that the most characteristic elements of an object tend to be mentioned frequently in corpora. In this study, we investigated the use of words that describe animal body parts and their frequencies. If the characteristic attribute of a target animal has a high frequency in the corpora, we would be able to guess the target animal. For example, we expected tsuno 'horn,' a word that distinguishes one animal type from another, to be used frequently. In the case of unicorns, we found that its horn was mentioned frequently, as it distinguishes a unicorn from a horse. However, the horns of oni 'devil' were mentioned less frequently, even though it is a feature that distinguishes oni from human beings. Upon analysis of the corpora, it was revealed that oni are often used as metaphors for human beings. By contrast, unicorns are not used as metaphors for horses. Moreover, oni horns do not have the fixed image that unicorn horns do as a metaphor for its form. Our results lead to the conclusion that the tendency for the most characteristic feature of an object not to be mentioned is the effect of metaphors.
著者
竹田 晃子 三井 はるみ
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.4, pp.77-108, 2012-11

国立国語研究所における「全国方言文法の対比的研究」に関わる調査資料群のうち,調査I・調査IIIという未発表の調査資料について,調査の概要をまとめ,具体的な言語分析を行った。調査I・調査IIIは,統一的な方法で方言文法の全国調査を行うことによって,方言および標準語の文法研究に必要な基礎的資料を得ることを目的とし,1966-1973(昭和41-48)年度に地方研究員53名・所員4名によって行われ,全国94地点の整理票が現存する。具体的なデータとして原因・理由表現を取り上げ,データ分析を試みることによって資料の特徴を明らかにした。3節では,異なり語数の比較や形式の重複数から,『方言文法全国地図』が対象としなかった意味・用法を含む幅広い形式が報告された可能性があることを指摘し,意味・用法については主節の文のタイプ,推量形への接続の可否,終助詞的用法の観点から回答結果を概観した。4節では,調査時期の異なる他の調査資料との比較によって,ハンテ類の衰退とサカイ類の語形変化を指摘した。「対比的研究」の調査結果は興味深く,現代では得がたい資料である。今後,この調査報告の活用が期待される。
著者
窪田 悠介 Yusuke KUBOTA
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.13, pp.107-125, 2017-07

本稿では,統語構造アノテーション支援ツールEmacsけやきモードの解説をする。けやきモードは,国立国語研究所「統語・意味解析コーパスの開発と言語研究」プロジェクトのために開発された。本ツールを開発する過程で,Emacsをテキストアノテーション作業用インターフェイス構築の土台として利用する手法の有効性と,この手法を採用する際に注意すべき点がいろいろと明らかになった。主な利点は,Emacsエディタに備わっているEmacs Lispと呼ばれるLispの方言を用いることで,強力なテキストアノテーション支援環境を素早く開発できることである。同時に,当初開発者側に盲点となっていたがツールを現場で運用する際に徐々に明らかになった落とし穴として,Emacsのデフォルトのインターフェイスの使いにくさがあることが分かった。本稿では,けやきモードの主な特徴と実装を簡単に説明したあと,Emacsをアノテーション支援ツール開発の基盤として用いることの利点と落とし穴を議論する。This paper describes an extension of the Emacs editor for the annotation of syntactic structures in parsed corpora: "Emacs Keyaki Mode." Keyaki Mode was developed for the purpose of aiding manual correction of syntactic annotation in the construction of the NINJAL Parsed Corpus of Modern Japanese. In the course of developing this software, we learned that the extensibility of Emacs via Emacs Lisp (which is a full-fledged programming language rather than an impoverished macro language for editor customization) is very useful and makes Emacs a potentially attractive environment for developing text annotation tools in general. At the same time, we encountered several challenges mainly due to the fact that the default interface of Emacs is somewhat idiosyncratic and unintuitive from a modern perspective. After explaining the main features of Keyaki Mode and sketching its implementation, the paper discusses potential advantages and pitfalls when Emacs is viewed as a platform for annotation tool development.
著者
渡辺 美知子 外山 翔平 Michiko WATANABE Shohei TOYAMA
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
no.12, pp.181-203, 2017-01

筆者らは,言い淀み分布の日英語対照研究のために,『日本語話し言葉コーパス(CSJ)』中の模擬講演データに類似した『英語話し言葉コーパス(COPE)』を構築している。本稿では,まず,アメリカ英語話者20名のスピーチからなるこのコーパスの概要を紹介した。次に,その中でのフィラーの分布を日本語のフィラーの分布と比較した予備的考察について述べた。100語あたりのフィラーの頻度は,英語が4回/100語,日本語が6回/100語だった。しかし,単位時間あたりの頻度に有意差はなかった。また,日本語の方が英語よりも,頻度に男女差が大きかった。さらに,文境界と節境界におけるフィラーの出現率を両言語で比較し,それに関係する要因を調べたところ,日本語では性別の影響が最も大きいのに対し,英語では,文頭か非文頭かの要因の影響が最も大きかった。今後も,個人差を考慮して,対照研究を進める予定である。"The Corpus of Oral Presentations in English (COPE)" is under construction to conduct contrastive studies of speech disfluencies in English and Japanese. COPE is composed of 20 speeches by native speakers of American English. In the present paper, we first described the corpus followed by a report of some preliminary findings about filled pause (FP). Frequencies of FPs were 4/100 words in English and 6/100 words in Japanese. However, the frequencies per second did not significantly differ between the two languages. Gender specific difference was obvious in Japanese but hardly observed in English. Male speakers used more FPs than female speakers did in Japanese. Possible factors related with FP rates at sentence and clause boundaries were also investigated and discussed.