著者
小林 雄一郎 天笠 美咲 鈴木 崇史
雑誌
じんもんこん2015論文集
巻号頁・発行日
vol.2015, pp.23-30, 2015-12-12

本研究の目的は,計量文体論の技法を用いて,日本の流行歌の時系列変化を明らかにすることであ る。具体的には,1977 年から 2012 年までに発表された 773 曲の歌詞における 26 種類の語彙指標(品 詞,語種,文字種,語彙レベル)を比較した。その結果,1990 年頃を境に,語種と文字種の頻度が大 きく変化していることが分かった。特に,外来語とカタカナの頻度が著しく減少し,漢語と漢字の頻 度が増加した。本研究は,計量文献学に新たな知見をもたらし,日本の現代文化を対象とする社会学 研究に客観的な資料を与えるものである。
著者
小林 雄一郎
雑誌
じんもんこん2012論文集
巻号頁・発行日
vol.2012, no.7, pp.33-38, 2012-11-10

本研究の目的は,アソシエーション分析とクラスター分析を用いて,学習者による誤りの共起関係を明らかにすることである。具体的には,「ある誤りを犯す学習者は,他にどのような誤りを一緒に犯す可能性があるのか」という情報を大量に蓄積し,それらをいくつかの典型的なタイプへと統計的に分類する。
著者
小林 雄一郎 金丸 敏幸
雑誌
じんもんこん2012論文集
巻号頁・発行日
vol.2012, no.7, pp.259-266, 2012-11-10

本研究は,Coh-Metrix とパターン認識の技術を用いて,英語学習者による課題英作文の自動評価を試みるものである。自動評価の基準は,既存の評価システムによる分類結果とし,出力結果を比較,検討することによって,よりよい採点システムの可能性を模索する。
著者
小林 雄一郎
出版者
東洋大学
雑誌
若手研究(B)
巻号頁・発行日
2014-04-01

本研究は、自動採点の技術を用いて、第二言語としての英語学習者(外国語としての英語学習者を含む)の話し言葉の習熟度を自動評価するものである。本研究では、NICT JLE Corpusを主な分析データとし、Biber (1988) で用いられている言語項目に関する情報をデータに付与した。そして、分析に用いた手法は、他の手法よりも比較的高い分類精度が得られると報告されているランダムフォレスト法である。その結果、9段階の習熟度を61.28%の精度で正しく分類できた。これは、ベースラインの精度よりも37.63ポイント高いものである。また、分類に大きく寄与した言語項目は、前置詞、人称代名詞などであった。
著者
小林 雄一郎 岡﨑 友子
出版者
計量国語学会
雑誌
計量国語学 (ISSN:04534611)
巻号頁・発行日
vol.33, no.7, pp.451-465, 2022-12-20 (Released:2023-12-20)
参考文献数
19

本研究は,日本語歴史コーパスに収録された奈良時代から大正時代までのテキストを用いて,指示代名詞の通時的分析を行うものである.指示代名詞の形態は時代によって若干異なるため,系列別(コ系列,ソ系列,カ系列,ア系列),型別(ゼロ型,ノ型,レ型,コ型,ナタ型,チ型)の分類に基づく分析を行った.具体的には,系列別・型別に集計された頻度に対してLOESS平滑化を実行することで,指示代名詞の使用傾向の経年変化を調査した.そして,(1)指示代名詞の総数が増加していくこと,(2)ソ系列は増加傾向を示し,コ系列とア系列は1700〜1800年代に多く,カ系列は緩やかに減少したあとで再び増加すること,(3)ゼロ型は減少傾向,レ型は増加傾向を示し,ノ型は1700年以降に増加し,他の3つの型はいったん増加したあとで減少すること,などを明らかにした.
著者
小林 雄一郎 阿部 真理子
雑誌
研究報告人文科学とコンピュータ(CH)
巻号頁・発行日
vol.2014-CH-101, no.2, pp.1-8, 2014-01-18

本研究の目的は,多変量アプローチを用いて,ライティング・タスクにおけるトピックと課題文の影響を調査することである。分析データは,International Corpus Network of Asian Learners of English (ICNALE) を用いる。そして,英語学習者のライティングがトピックと課題文の影響を強く受けていることを明らかにする。
著者
小林 雄一郎
出版者
日本大学
雑誌
若手研究(B)
巻号頁・発行日
2017-04-01

2017年度は、申請書に記した研究計画に則り、ライティングおよび自動採点および自動フィードバックに関する先行研究の調査と整理にあたった。その作業の結果、本研究課題と関連し、学術的にも有用であるものを選定し、2018年度中にliterature review論文を投稿・発表する予定である。また、ライティングの自動評価に向けて、語彙や文法に関する項目だけでなく、談話に関する項目に関する研究を行った。具体的には、母語と習熟度の異なる学習者のデータを定量的に分析することで、ライティングにおける談話能力の発達と、発達過程における母語の影響を調査した。この調査に関しては、Corpus Linguistics 2017で研究発表をしたのち、Journal of Pan-Pacific Association of Applied Linguisticsに論文として発表した(Developmental patterns of metadiscourse in second language writing)。そして、自動評価に関する技術的な研究として、Conference of the International Federation of Classification Societies 2017において、機械学習を用いたテキスト分類に関する発表を行った(Automated speech scoring: A text classification approach)。統計学・情報科学のオーディエンスが多く来場し、言語学・言語教育の学会とは異なる議論や情報交換ができ、有益な示唆を得た。
著者
徳見 道夫 冨浦 洋一 田中 省作 宮崎 佳典 小林 雄一郎
出版者
九州大学
雑誌
基盤研究(C)
巻号頁・発行日
2012-04-01

科学論文の執筆や論文の読解において求められる重要な英語語彙は,分野や組織によって異なるため,分野や部局等の組織別に選定されることが望ましい.本研究は,近年,大学などの主要な研究機関で整備されている機関リポジトリ(自機関の著作物を電子アーカイブし公開するオンラインデータベース)を活用し,大学・部局別の重要語彙リストを効率的に作成する方法を提案した.実際に,九州大学を対象として,提案手法による部局別重要語彙リストを作成し,その有用性を確認した.
著者
小林 雄一郎 北尾 謙治
出版者
同志社大学
雑誌
文化情報学 (ISSN:18808603)
巻号頁・発行日
vol.5, no.1, pp.1-14, 2010-06

研究論文語彙と読みやすさは、英文における重要な難易度の指標である。非母語話者であれば、母語話者よりも使用できる語彙が少なく、複雑な文章を読むにも困難がともなう。そのような場合の解決策の一つがレベル別多読教材 (Graded Readers, GR) である。GRでは、複数の難易度レベルが設定されており、読者は自分の英語力に合った教材を選ぶことができる。しかしながら、日本の中学校・高等学校でそれらを補助教材として用いる場合、どの学年の学生にどのレベルが適しているかは必ずしも明確ではない。そこで、本研究の目的は、語彙と読みやすさの観点から、日本の中学校と高等学校の英語検定教科書とレベル別多読教材 (Graded Readers, GR) を計量的に比較するものである。その結果から、(1) 語彙の難易度に関して、教科書は同じレベルのGRよりも難しい、(2) 語彙のカバー率に関して、GRはかならずしも十分ではない、(3) 教科書とGRを識別する語の多くは固有名詞であり、逆に言えば、両者の語彙分布に大きな差は見られない、(4) 読みやすさに関して、GRはそれほど統制されている訳ではない、(5) 教科書で学んだ生徒達は、同じレベルのGRを十分に読める可能性があることなどを議論する。Non-native speakers of English have a much smaller vocabulary in English than native speakers do, and they also have difficulty of understanding complex sentences. For non-native speakers of English, readability and variety and levels of vocabulary are good indices for predicting difficulty levels of English passages. Therefore authorized English language textbooks in Japanese junior and senior high schools are controlled for vocabulary and readability. Graded readers, which are reading materials for non-native speakers of English from the beginners to the advanced learners, are also controlled with vocabulary and readability. This study measures readability and vocabulary levels of authorized English language textbooks and graded readers, level 1-6. From the results of their analyses, authors argue 1) English language textbooks are more difficult than the same level of graded readers. 2) In some cases, not enough of the vocabulary in graded readers is covered by the authorized textbooks. 3) Textbooks and graded readers share much of the same vocabulary. 4) Graded readers are well controlled for vocabulary but not for readability. 5) Though junior high students who have studied with English language textbooks may not be able to read the same level graded readers, high school students should be able to. These conclusions, based on a pilot study, are preliminary need further research.
著者
阿部 真理子 小林 雄一郎 藤原 康弘
出版者
中央大学
雑誌
基盤研究(B)
巻号頁・発行日
2016-04-01

本研究の目的は、高校生の英語スピーキング力を 3 年間にわたり縦断的に追跡し、その発達過程を明らかにすることである。具体的には、(1)個人レベルでの経年変化のモデル化、(2)内的・外的な学習者要因が発達に及ぼす影響の解明を行う。そのためには研究の共同基盤となるコーパスの整備が不可欠である。「Longitudinal Corpus of L2 Spoken English (LOCSE)プロジェクト」において収集している縦断的英語スピーキング力データ(約120名×8回)をもとに、今年度は学習者コーパスの構築を推進させた。またコーパスの概要を示す特徴量算出(前半3回分)と、個々人の発話に関する数値的な情報(前半3回分)を算出した。個々人の情報に関しては、学習者ごとにフィードバックも行った。さらには、書き起こしの精度と速度を向上させるために、自動書き起こしツールを用いた作業の検討を繰り返し行った。そして、自動書き起こしツールの効果を検証するためのデータ収集を開始した。高校生の英語運用能力および学習意欲の変動に影響する要因を探るためのアンケートも実施し、内的・外的な学習者要因がスピーキング力の発達にどのような影響を及ぼしているかについて論文をまとめた。国内・国外において一件ずつの研究発表を行った。そのことで、次年度(2018年夏)に共同シンポジウムを二件行うことが決定した。また国外における人的ネットワークの構築を行うのみならず、海外の大学との共同研究の開始が決定した。
著者
中條 清美 松下 達彦 小林 雄一郎 Anthony Laurence 濱田 彰 西垣 知佳子 水本 篤
出版者
日本大学
雑誌
基盤研究(B)
巻号頁・発行日
2017-04-01

本研究は,いつでもどこでもだれでも,教育用例文コーパスを使って,DDL(Data-Driven Learning,データ駆動型学習)が実施可能なように,教育用コーパス・検索ツール・教材を搭載したDDLオープンプラットフォームを開発し,その活用と普及を図ることを目的とする。具体的には,平成25‐28年度科研において開発した第Ⅰ期開発版のデータ駆動型英語学習支援サイトSCoRE(Sentence Corpus of Remedial English)に基づき,1)教育用例文コーパスの増強,2)検索ツールの高度化・軽量化,3)DDL実践・効果検証・DDL普及活動の3項目の研究を行い,成果を逐次,国内外に発信することである。平成29年度の研究実績について述べる。1) 教育用例文パラレルコーパスの増強:第Ⅰ期開発版の英語例文・日本語訳データの見直しを行い,例文の増補・改訂,および,インターフェースの改良を加えた第4次開発版SCoREを公開した。2) 検索ツールの高度化・軽量化:SCoREツールのひとつ,「適語補充問題」ツールのログ機能を強化し,教育利用の促進を図った。さらに,ユーザの利便性を考慮し,新たに携帯端末用検索ツール「m-SCoRE」を開発・公開した。3) DDL教材の開発・実践・効果検証:上記1),2)の教育現場への応用研究として,外国語学習者がDDLに取り組むための教材や効果検証テストを開発し,データ駆動型英語学習支援サイトSCoRE(http://www.score-corpus.org/)に収録した。当該サイトは,オープンプラットフォームであり,教師・研究者が自由に収録データをダウンロードできる。大学生および高専生を対象としたDDL指導実践授業の評価と教育効果の検証を行った。研究成果として,雑誌論文を5件公刊し,6件の学会発表を行った。
著者
小林 雄一郎 小木曽 智信
出版者
国立国語研究所
雑誌
国立国語研究所論集 (ISSN:2186134X)
巻号頁・発行日
vol.6, pp.29-43, 2013-11

本研究の目的は,中古和文コーパスを分析対象とし,個人文体とジャンル文体の関係を明らかにすることである。具体的には,紫式部の『源氏物語』と『紫式部日記』,そして『更級日記』における助詞・助動詞の使用傾向を調査し,テクスト間の相互関係,言語項目間の相互関係,テクストと言語項目の結びつきのパターンを定量的に分析する。そして,多変量解析の手法を援用し,中古和文のテクストにおいて,書き手による文体差よりもジャンルによる文体差の影響が大きいことを示す。さらに,個々のテクストにおける語彙使用を詳細に分析するために,対数尤度比による特徴語抽出を行い,多変量解析の結果を補完する。
著者
田中省作 冨浦洋一 宮崎佳典 小林雄一郎 徳見道夫
雑誌
第75回全国大会講演論文集
巻号頁・発行日
vol.2013, no.1, pp.83-85, 2013-03-06

科学論文などの英語(EAP)には,EGPとよばれるような一般的な英語とは異なる表現や構成が求められる.さらに,それらは分野によっても大きく異なることが知られており,分野ごとの学術表現リストの作成はEAPにおける重要な課題の一つである.本研究では,近年,多くの研究機関で整備されつつある自組織の研究者が執筆した著作物を電子的に蓄積・公開しているデータベース・機関リポジトリに着目する.それらのデータを活用することで,当該機関が扱う研究分野に依拠したような,従来よりも粒度の細かい部局別の英語学術表現リストの効率的な作成支援を試みる.
著者
小林 雄一郎 阿部 真理子 成田 真澄
雑誌
じんもんこん2013論文集
巻号頁・発行日
vol.2013, no.4, pp.89-96, 2013-12-05

本研究の目的は,英語学習者のライティングにおける書き手の習熟度と母語が第2 言語ライティングに与える影響を調査することである。具体的には,東アジア圏(香港,韓国,台湾,日本)の大学生によって書かれた英作文コーパスにおける58 種類の言語項目(語彙,品詞,統語,談話など)を分析対象とした。その結果,香港人学習者と日本人学習者に関しては,習熟度による影響よりも母語による影響の方が大きいことが示唆された。また,韓国人学習者と台湾人学習者に関しては,母語による影響よりも習熟度による影響の方が大きいことが分かった。
著者
小林 雄一郎
出版者
立命館大学
雑誌
特別研究員奨励費
巻号頁・発行日
2012-04-01

最終年度では、これまでの研究を総括し、今後の研究方向に繋がる分析を行った。まず、異なるトピックで書かれたライティングを対象として、語彙、品詞、統語、談話などに関する言語使用の差を調査した。そして、t検定、決定木、ランダムフォレストなどの結果から、異なるトピックで書かれたライティングでは、言語使用が大きく異なることが明らかにされた。このことは、習熟度の自動判定をする場合に、タスクの影響の有無に注意しなければならないということを示している。また、これまでは「学習者が何をできるか」という点に注目してきたが、今年度はそれに加えて、「学習者が何をできないか」というエラーの情報を分析に加えた。その結果、冠詞、前置詞、動詞の時制などに関するエラーが習熟度と高い相関関係にあることが明らかにされた。