著者
新井 紀子 影浦 峡 菅原 真悟 松崎 拓也 犬塚 美輪 尾崎 幸謙 登藤 直弥 藤田 彬
出版者
国立情報学研究所
雑誌
基盤研究(A)
巻号頁・発行日
2016-04-01

科目や分野によらない汎用的な読解力を短時間かつ高い精度で推定するリーディングスキルテストについて引き続き研究開発を続けている。リーディングスキルテストβ版については、そのアイデア等を論文や口頭発表、書籍等で公開した上で、一般社団法人「教育のための科学研究所」に移転し、リーディングスキルテストとして社会実装された。令和元年度末までで(リーディングスキルテストβ版と合わせて)のべ20万人以上が本テストを受検した。これまでの知見を2冊の書籍として出版した。少ないサンプルで問題の難易度を推定する方法や、より少ない問題数で高い精度で汎用的読解力を推定する方法等について、テスト理論の観点から尾崎・登藤らが検討を行った。板橋区および戸田市と連携し、汎用的読解力を児童・生徒に身に着けさせるための授業や学習支援についての検討を行っている。特に板橋区においては、「読み解く力の育成」として、板橋第一中学校に入学する小学校を含めた「学びのエリア」を指定し、その中で、学年進行に応じて、どのような汎用的読解力をどのような授業や支援で身に着けさせるかについての検討を行っている。板橋区と連携して行った研究授業および研究会は計5回である。加えて、検定教科書に関する計量国語学的観点からの分析を進め、小学校と中学校の教科書において記述方法にこれまで発見されていなかった量的なギャップがあることを発見し、査読付き論文および国際会議プロシーディングスで発表した。
著者
登藤 直弥 小林 哲郎 稲増 一憲
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.43, no.2, pp.129-141, 2016 (Released:2017-06-30)
参考文献数
24
被引用文献数
2

In this paper, we introduced a method of causal inference for arbitrary treatment regimes. We first expounded the generalized propensity score (Imai & Van Dyk, 2004) that extended the propensity score for binary treatments, and then causal inference with this generalized propensity score. Furthermore, we reanalyzed the data of relations between mass media and politics from a previous study, and discussed the usefulness of causal inference using generalized propensity scores.
著者
新井紀子# 菅原真悟# 尾崎幸謙# 犬塚美輪 新井庭子# 分寺杏介# 野口裕之 登藤直弥
雑誌
日本教育心理学会第59回総会
巻号頁・発行日
2017-09-27

企画主旨登藤直弥 本自主企画シンポジウムで取り上げるリーディングスキルテスト(Reading Skill Tests,RST)においては,いわゆる国語の文章読解問題のように,「文意が正しく読み取れるか」などといった大まかな能力が測定されているわけではない。RSTではより細かな認知能力,具体的には,「文の中における係り受け構造が正しく理解できるか」だとか「文間での照応関係が正しく認識できるか」などといった,より基礎的な読解能力が測定されるように設計されている。 このRSTに関しては,一昨年度よりその開発を始め,現在では,様々な学校・企業・自治体の協力を得て,データの収集や分析を進めているところである。その結果,以下に記載されているように,RST,さらには,「読解」という行為に関する様々な知見が蓄積されてきた。 そこで,本自主企画シンポジウムでは,RSTの開発を始めた経緯,RSTの仕様,RSTの教育測定学的性質,そして,RSTを用いて行われたいくつかの研究の結果について,以下に示す通り,計6名の先生方から話題提供をしていただく。基盤となる読解力を測る新井紀子 21世紀の知識基盤社会においては,人生を通じて必要となる知識やスキルが確立されたカリキュラムの枠組みだけでは十分には獲得できず,人が生涯にわたり学び・学習の活動を続けていく「生涯学習」が必要となる。その形態が,アナログかデジタルか,直接か遠隔かに関わらず,学習コンテンツの多くが書記言語の「読解」を前提として構成されている。そのため,知識基盤社会においては,書記言語の運用能力の如何が,労働市場での価値を大きく左右する。一方,学習者間で看過できない読解力の差が生じていることは動かしがたい事実である。読解力が知識基盤社会を生き抜くための核心的スキルであるならば,すべての学習者がそれを一定程度身に着ける教育プログラムがあることが,格差の少ない民主的な社会の形成の上で強く望まれる。 我々は,近年の深い言語処理の研究成果と対比させつつ,従来の読解の認知プロセスモデルを精緻化した上で,項目応答理論と認知診断モデルを用いた適応型テストを用いることにより,従来の学習到達度テストや読解力調査では測定することのできなかった読解に関わる認知プロセスにかかわる能力(認知能力)を高い精度で診断することを目的とするRSTの研究開発に着手した。その成果について発表を行う。RSTの各問題タイプの目的と作問方法菅原真悟 RSTでは6つの問題タイプを設定し,それぞれ異なる能力を測ることを目的としている。各問題タイプの概要は,以下の通りである。(1)「係り受け認識(DEP:Dependency Analysis)」:係り受け関係を正しく認識できているかを測る。(2)「照応解決(ANA:Anaphora Resolution)」:指示照応やゼロ照応を理解できているかを測る。(3)「同義文判定(PARA:Paraphrasing)」:2つの文を比較し,それらが同義かあるか否かを理解できるかを測る。(4)「推論(INF:Logical Inference)」:提示された文から論理推論することで,新しい知識を獲得できるかを測る。(5)「イメージ同定(REP:Representation)」:提示された文を読んで,それがどのようなことを表しているかイメージできるかを測る。(6)「具体例認識(INST:Instantiation)」:概念または用語の定義を読み,それがどのような状況に当てはまるか,具体的に認識できるかを測る。 各問題は,主に中学校及び高等学校で用いられている検定済教科書に載っている文を基に作問している。なお,RSTで教科書等に掲載された文を使用するにあたっては,各著作権者と協議のうえ,著作権許諾契約を結び実施している。本発表では,各問題タイプが,どのような目的で作問されているかを,具体例をあげて説明する。RSTの信頼性と妥当性および質問紙調査項目との相関尾崎幸謙・登藤直弥 本発表では,1)RSTの信頼性と妥当性,2)質問紙調査項目との相関について報告する。 RSTの各項目が適切に読解にかかわる認知能力を測定していることを調べるために,まず項目特性図を描き,その形状によって適切な項目であるか否かを判断した。通常の項目特性図は,合計得点のグループごとの各選択肢の選択割合を示したものである。しかし,現在のRSTは,受験者に対してランダムに項目提示を行っているため,受験者によって解いた問題が異なる。そのため,受験者に対する評価は項目応答理論を用いて行った。項目応答理論における受験者特性値θをすべての受験者について求め,これを合計得点の代わりとして項目特性図を描いた。 その結果,いくつかの問題については,問題文や選択肢の修正の必要があることが分かった。なお,RSTでは修正の必要の有無の判断・修正・再データ収集のループを回して実施し,適切な項目内容となるためのフローを作っている。 また,RSTの信頼性と妥当性については,項目特性図によってスクリーニングされた適切な項目のみを使って問題タイプ毎に検討を行った。具体的には,信頼性であれば,たとえばω係数(McDonald,1999)を用いて検討を行い,妥当性であれば,受験者特性値θ間の相関係数や「各受験者特性値や正答率と年齢との関係」などを用いて検討を行った。その結果,現状では,全ての問題タイプにおいて,十分な信頼性と妥当性が示唆される結果が得られている。なお,問題タイプ毎に,項目応答理論を適用する際の前提が満たされているかどうかについても確認を行ったが,この点についても,適用するにあたっての前提は満たされているであろうことが示唆されている。 さらに,信頼性と妥当性が確認された項目群を用いて,質問紙調査項目との相関を求めた。なお,これらの分析についても問題タイプ毎に行っている。この質問紙調査項目には,読書習慣,読書の好き嫌い,得意な科目などについて尋ねるものが含まれている。したがって,読解力という漠然とした構成概念ではなく,読解力を構成するより細かな認知能力について,読書習慣等に関する質問紙調査項目との相関を調べることができた。なぜ読むのが難しいのか:眼球運動の特徴から犬塚美輪 RSTの実施結果からは,教科書という基本的な学習リソースにおいて文理解が困難な学習者が少なくないことが示されたと言える。こうした困難の要因の一つは,教科書の文章の構造の複雑さにあると推測できる。一方で,学習者が十分な読解スキルを有していないことも要因であろう。読解スキル育成のためには,優れた(あるいは困難を持つ)読み手の特徴に基づいた介入案の検討が必要であるが,青年期の読み手の読解プロセスについては基礎的データが十分ではない。 そこで,本発表では,大学生を対象に,原文と構造を明確化した修正文における読解プロセスを検討する。予備的な研究からは,原文と修正文で読解時間は大きく異ならないものの,修正文では低成績者の理解を底上げすることが示唆された。本発表では,眼球運動のデータを用いて,原文と修正文で学習者の読解プロセスがどのように異なるか,そこからどのような教育的提言が可能かを論じる。小・中ギャップにつながる教科書テキストの特徴新井庭子・分寺杏介 教科書の文章は正しく読めることが前提とされてきたが,RSTの実施結果からは,学習者が正しく教科書を読めていない実態が示された。本発表では,学習者の読みを困難にしている教科書の具体的な特徴について検討を行った結果を報告する。 近年,教育現場でいわゆる小・中ギャップ,すなわち,小学校から中学校への進学において,新たな環境での学習や生活に対応できず不登校等に繋がる状況が問題視されている(中央教育審議会初等中等教育分科会,2012)。小・中ギャップは学習者の学習面と生活面から検討が進められており,学習面では,担任制の相違や授業形態の違いなどの指導法の面からの研究はあるが(中央教育審議会初等中等教育分科会,2012;伊藤,2014),学習者が抱える困難がどのようなものか,例えば教科書を読んで理解し知識を獲得できているか等を具体的に分析した研究は少ない。 そこで,小学校と中学校の理科教科書を題材として,そこにどのような量的・質的なギャップがあるかを分析した。また,読みを困難にするテキストのパラメータを予測し,小・中教科書テキストの間にそのパラメータで表現できるギャップがあることを示した上で, RSTの結果を用いてそのギャップが実際に人にとっての困難につながるかどうかを確認した。 「人にとってのテキストの難しさ」を扱う関連研究で伝統的に採用されてきたパラメータのうち,単語親密度・係り受けの数・距離の平均・ツリー構造の深さを採用し,特に係り受けの複雑さについて小・中間で明確な差があることを確認した。その他にも,これまでの研究では考慮されていなかった新規パラメータとして定義表現の数・分類表現の数について,小・中間で大きなギャップがあることを示した。
著者
登藤 直弥
出版者
一般社団法人 日本教育心理学会
雑誌
教育心理学年報 (ISSN:04529650)
巻号頁・発行日
vol.58, pp.119-130, 2019-03-30 (Released:2019-09-09)
参考文献数
70
被引用文献数
2

本稿ではまず,この1年間に『教育心理学研究』で発表された29編の論文を対象に,利用された研究法について概観して,『教育心理学研究』に掲載された研究の典型を導き出した。次に,これを踏まえたうえで,これらの研究で実施された測定・評価についても概観し,『教育心理学年報』の「測定・評価・研究法」部門の論文においてなされた提言がそれらに活かされているとは必ずしもいえないことを明らかにした。加えて,日本教育心理学会第60回総会において「測定・評価・研究法」部門の研究として発表されたものに関しても,測定・評価・研究法という観点から現状を概観し,その特徴について,『教育心理学研究』に掲載された論文との違いを明らかにした。最後に,これらの検証結果をふまえて,日本の教育心理学の研究実践に,今後,測定・評価・研究法に関する提言を取り入れていくための方策について,筆者なりの提言を行った。
著者
登藤 直弥 孫 媛 井上 俊哉
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.25, no.2, pp.180-185, 2015-05-23 (Released:2015-07-11)
参考文献数
11
被引用文献数
1 1

本研究では,教育成果に対する学習環境と教育プログラムの効果について検討するため,医学部を対象に,ロジスティック回帰分析による検討を行った.その結果,教育成果に対して学習環境がほとんど影響を与えておらず,教育プログラムが教育成果に対し正の影響を与えているという,学校効果研究と同様の知見が得られた.
著者
藤田 彬 松崎 拓也 登藤 直弥 新井 紀子
出版者
一般社団法人電子情報通信学会
雑誌
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 (ISSN:09135685)
巻号頁・発行日
vol.114, no.366, pp.17-21, 2014-12-16

機械翻訳器の日常会話翻訳に対する性能を評価する試みについて紹介する.前もって日本語に機械翻訳された英語の対話文完成問題を被験者が解き,その得点を用いて翻訳器の外的な評価を行った.300名超の被験者を集めた大規模な調査により,評価対象とした翻訳器のうち一つが「人間が文脈を考慮せずに行った翻訳」と同等の性能を有することが明らかになった.本発表では,この調査の内容及び結果を詳述するに加え,一般的に用いられる内的な評価(自動・手動)との比較結果を紹介する.また,人間の対話理解において重大な障害をもたらす翻訳誤りとそうでない誤りを分類し,定量的に分析した結果を報告する.
著者
孫 媛 登藤 直弥 井上 俊哉
出版者
情報知識学会
雑誌
情報知識学会誌 (ISSN:09171436)
巻号頁・発行日
vol.24, no.2, pp.112-117, 2014-05-24 (Released:2014-12-01)
参考文献数
7
被引用文献数
2 1

近年,大学の各種活動を評価あるいは公表することへの要請が強まっている. また,種々の教育 改革に着手する大学も増えており,その必要性や成果を確認するうえでも,大学の教育活動を評 価・診断する方法について検討することが求められている. 本論文では,大学ポートレート(仮称)準 備委員会が公表している平成24年度の国公立大学基本情報等を利用し,大学の教育活動の指標と なり得る変数の探索を行った. その結果,学生一人当たりの教員数や貸し出し冊数などが就職率に 正の影響を及ぼすことが示された一方で,大学教育の質を表すと考えられてきた変数の中に負の影 響を及ぼすものも確認された. 大学の教育活動を正確にとらえるためには,データの信頼性を確保 することが重要であろうことが示唆された.