著者
岡田 謙介 星野 崇宏 繁桝 算男
出版者
一般社団法人 日本教育心理学会
雑誌
教育心理学研究 (ISSN:00215015)
巻号頁・発行日
vol.55, no.3, pp.382-392, 2007-09-30 (Released:2013-02-19)
参考文献数
34
被引用文献数
3 3

構造方程式モデリング (SEM) では柔軟なモデル構成が可能であるために, モデルの評価・選択が重要になる。統計的モデル選択において基本となる統計量に尤度比検定統計量Tがあり, SEMでもこれが漸近的にx2分布にしたがう性質を利用した検定が可能である。しかし, 標本サイズが小さいとき検定統計量Tの標本分布はx2分布から正方向に逸脱する。逸脱の度合いは1因子あたりの観測変数数が大きいとき, とくに大きくなる。通常得られる教育心理学データの標本数程度では, この逸脱のため, 適切なモデル選択が行えなくなってしまう。また, 適合度指標の大部分はx2分布にしたがうTの関数として構成されるので, Tの分布のゆがみが直接的に波及する。そこで, 我々は今回TにBartlett補正を適用し, そのx2分布への近似精度を向上させる方法を提案する。モンテカルロ実験により, 提案した方法がTの標本分布のx2分布に対する近似精度を大幅に改善していることを確認する。
著者
北條 大樹 岡田 謙介
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.45, no.1, pp.13-25, 2018 (Released:2018-11-03)
参考文献数
34
被引用文献数
1

This study conducts a data-driven classification of the response styles for the 2,131 respondents of the SHARE (Survey of Health, Ageing and Retirement in Europe) survey. In the standard Likert scale measurement, item responses reflect not only the latent traits of respondents but also their response style biases which are irrelevant for the purpose of the original measurement. The anchoring vignettes is an effective method to measure and correct for such biases. In this study, we first modeled the anchoring vignettes variables in the SHARE dataset using the Bayesian multidimensional item response model. Then, we classified the estimated individual response style parameters using the divisive analysis clustering. As a result, seven different clusters of response styles were obtained. While some of them correspond to the well-documented response styles, many of the clusters of respondents exhibit unique response styles which are both interpretable and relevant. Thus, bottom-up classification approach of response styles would undertake a key role in revealing the empirical analysis of item response behavior.
著者
波田野 結花 吉田 弘道 岡田 謙介
出版者
The Japanese Association of Educational Psychology
雑誌
教育心理学研究 (ISSN:00215015)
巻号頁・発行日
vol.63, no.2, pp.151-161, 2015
被引用文献数
5

これまでの心理学データ分析では, 概して統計的仮説検定の結果は報告されるが, 効果量の報告や議論は軽視されがちであった。しかし近年の統計改革の中で, 効果量を活用することの重要性が再認識されている。そこで本研究では, 過去4年間に 『教育心理学研究』誌に掲載された論文中で報告された仮説検定について, 論文中の情報から対応する効果量の値を算出し, 検定における<i>p</i>値と効果量との間の関係を網羅的に調べた。分析対象は, 独立な2群の<i>t</i>検定, 対応のある2群の<i>t</i>検定, 1要因および2要因の被験者間分散分析における<i>F</i>検定であった。分析の結果, いずれの場合においても報告された<i>p</i>値と効果量の相関係数は-0.6~-0.4であり, 両者の間には大まかな対応関係が見られた。一方で, 検定結果が有意であるにもかかわらず小さな効果量しか得られていない研究も決して少なくないことが確認された。こうした研究は概ね標本サイズが大きいため, 仮説検定の枠組みの中では検定力分析の必要性が考えられる。また仮説検定の枠組みに留まらず, メタ分析によって関心下の変数ごとに効果量の知見を蓄積することや, ベイズ統計学に基づく新たな方法論などが今後の方向性として考えられる。
著者
福島 健太郎 内田 奈緒 岡田 謙介
出版者
日本テスト学会
雑誌
日本テスト学会誌 (ISSN:18809618)
巻号頁・発行日
vol.17, no.1, pp.45-59, 2021 (Released:2021-12-01)
参考文献数
26
被引用文献数
1

テスト解答データから解答者の学習要素の修得状態に関する情報を引き出す方法として,認知診断モデル(Cognitive Diagnostic Models, CDM)が注目されている.特に,多枝選択型のCDMは誤答時の情報も有効活用できると考えられ,実際にいくつかのモデルが提案されてきた.一方で,多枝選択型CDM をテストへ応用するためには,項目の各選択枝に対して,要求される学習要素を規定したQ行列を事前に設定する必要がある.その作成コストの問題と公開データの欠如から,先行研究でも数値シミュレーション研究にとどまっている例が多く,テスト開発にあたっての実証分析上の知見は乏しいのが現状である.そこで本研究では,Q 行列を付与した英語の多枝選択形式のテスト開発を行い,収集した実データに対してCDM を適用して,どのような診断結果が得られるのかを調べた.結果として,モデルがデータに対する一定の予測力を持つことが確認されたものの,今回検討した倹約的なモデルでは多枝選択形式特有の解答行動を十分反映できていない可能性が示され,さらなるモデル開発への示唆が得られた.
著者
丹 亮人 岡田 謙介
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.47, no.2, pp.211-225, 2020 (Released:2021-04-21)
参考文献数
26
被引用文献数
1

Cognitive diagnostic models (CDMs) are a class of statistical models that diagnose the mastery of respondents' cognitive traits, which are called attributes or skills. In the typical applications of CDMs, the Q-matrix, which represents which attributes are measured by each item, is specified by domain experts. In the case of dichotomous attributes, the impacts of Q-matrix misspecification on the classification accuracy have recently been studied; however, the case of polytomous attributes has not been reported. Therefore, in the present study, we examined how the difference between true and misspecified Q-matrix elements affects classification accuracy under four forms of attribute hierarchies. It was revealed that, in most conditions, larger difference between true and misspecified values resulted in lower classification accuracy. The impact of misspecification was the largest under the linear form of attribute hierarchy, which could be due to its smaller number of items that measure attribute levels. These results suggest that the number of items assigned to each attribute levels can be a key factor that affects the classification accuracy, especially when the degree of misspecification is large.
著者
山森光陽 岡田涼 納富涼子 山田剛史 亘理陽一# 熊井将太# 岡田謙介 澤田英輔# 石井英真#
出版者
日本教育心理学会
雑誌
日本教育心理学会第61回総会
巻号頁・発行日
2019-08-29

企画趣旨 2010年代に入って,教育心理学の分野でもメタ分析に対する関心が高まっている。日本では深谷 (2010),岡田 (2010),小塩他 (2014)によって,メタ分析による研究知見の統合が行われている。海外の教育心理学関係主要雑誌(Br. J. Educ. Psychol., Child Dev., Contemp. Educ. Psychol., Educational Psychologist, Educ. Psychol. Rev., J. Educ. Psychol., Learning and Individual Differences, Learning and Instruction)でも,2010年以降メタ分析を用いた論文数が急増しており,2018年では10月時点で28本にのぼっている。メタ分析による知見の統合には,ある介入の平均的な効果の提示が可能であることや,研究間差異を検討することで対象や条件による効果の違いを検討できることといった利点が認められる。 系統的レビューと呼ばれるメタ分析による知見の統合は,記述的レビューと異なり,統合対象とする研究文献探索の方法と分類基準を明示することが求められるなど,その手続きが精緻であることも関係し,レベルの高いエビデンスと捉えられ,その知見が流通することが多い。What works (U.S. Department of Education, 1986) に代表される,研究知見に基づく推奨される教育的介入のガイドラインは,1980-90年代は記述的レビューに基づいた内容であるのに対して,2000年代以降は系統的レビューの結果が反映されるようになってきた。さらに,2010年代には複数の系統的レビューのメタ分析(メタ・メタ分析,スーパーシンセシス)によるガイドラインが示されるようになってきている。 教育研究における複数の系統的レビューのメタ分析として広く知られているものに,Visible learning (Hattie, 2009)がある。学習者,家庭,学校,教師,教育課程,指導方法の各要因の下位138項目について,学力に与える影響のメタ分析の結果のスーパーシンセシスを行い,各々が学力に与える平均的な効果を効果量dによって示し,その効果の大小に対して理論的説明を行った。このスーパーシンセシスの対象一次研究数は延べ52,450本,延べ対象者数は8,800万人以上である。そして,スーパーシンセシスの方法やその内容は,イギリスやドイツをはじめとした諸国で,社会的な影響が大きいことが報告されている。 メタ分析による研究知見の統合の影響は,教育心理学をはじめとした教育研究の分野内に対してのみならず,教育政策,学校経営にまで及ぶと考えられる。国内では最近,平明に読めるメタ分析の入門書が複数出版されたことも契機となり,メタ分析による知見の統合を行う研究の本数が今後増加することが見込まれる。そして,研究知見の統合に取り組むに当たっては,研究分野内への影響のみならず,研究分野外への波及効果にも関心を払う必要があるだろう。このような現況を踏まえ,研究分野の内外に対して,「知見の統合は何をもたらすのか」を議論する。教育心理学におけるメタ分析研究の概況岡田 涼 教育心理学では,学力や動機づけ等の学習成果に影響を及ぼす要因やその先行要因を明らかにすることを目指すことが多い。得られた知見を教育実践や教育政策に反映させようとする場合,研究知見の信頼性や一般化可能性が重要となる。従来,研究知見の一般化を図るために行われてきた記述的レビューに比して,メタ分析は,複数の研究知見をもとに効果の程度を推定することで,より精度の高いエビデンスを得ることができる。同時に,個々の研究知見がもつ特徴を分析対象とすることで,平均的な効果だけでなく,効果の程度に影響する要因を検討することも可能となる。 このような特徴に鑑み,様々な研究テーマに関するメタ分析研究が増えてきている。国内でも,その報告数は増えてきており,注目度が高まっているといえる。学会によっては,執筆要項にメタ分析研究に特化した記載方法の指示が加えられたり,投稿の手引きでメタ分析研究の引用を推奨する記載をしている例もあり,メタ分析を受け入れる素地ができつつある。 一方で,メタ分析には,公表バイアスや一般化の水準の問題など,伝統的に指摘されてきた課題もある。また,メタ分析を行うためには,一次研究のレベルで必要な情報が報告されていることや,データベースが整備されていることなど,いくつかの前提条件もある。国内においてメタ分析研究が増えるに伴って,メタ分析研究の質が問われるようになることが予想される。 本発表では,まずメタ分析の考え方について簡単に触れ,メタ分析を用いた近年の教育心理学研究の動向を紹介する。その後,メタ分析の利点と限界を提示し,以降の発表につなげていきたい。一事例実験のためのメタ分析 山田剛史 様々な学会誌で特集号が組まれるなど(例えば, Developmental Neurorehabilitation, Vol.21(4), 2018; Research in Developmental Disabilities, Vol.79,2018; Journal of School Psychology, Vol.52(2),2014),近年,一事例実験(single-case experimental design)のメタ分析に注目が集まっている。一事例実験のメタ分析では,研究結果の統合の手続きとして,1)データの重なりの程度に基づく効果量(PND, NAP, Tau-Uなど)を利用する方法,2)平均値差に基づく効果量を利用する方法,3)ノンパラメトリック手法を利用する方法(randomization testsなど),4)マルチレベルモデルを利用する方法,など様々な方法が提案されている。こうした様々な提案がなされているが,メタ分析の手続きとしてスタンダードとなるものは未だ確立されていないのが現状である。 本報告では,平均値差に基づく効果量として,Hedges, Pustejovsky, & Shadish(2012)により提案され,Pustejovsky, Hedges, & Shadish(2014)で拡張された,ケース間標準化平均値差BC-SMD(Between-Case Standardized Mean Difference Effect Size,PHS-dとも呼ばれる)に注目する。 近年,BC-SMDを効果量として用いた一事例実験のメタ分析が数多く報告されるようになってきた。BC-SMDは,一事例実験研究の結果と群比較実験研究の結果を比較できる効果量として注目されている。Remedial and Special Education, Vol.38(2017年)の特集号を紹介しながら,BC-SMDを用いた一事例実験のメタ分析の実際について紹介する。教育研究的含意のある調整変数を推しはかる—外国語学習における明示的文法指導の効果—亘理陽一 言語形式に焦点を当てた文法指導の効果は,習得のメカニズムを研究する立場のみならず,教室での実践的課題としても長く議論が交わされてきた。Norris & Ortega (2000)は,1980年から98年までに出版された250超の論文の内,基準を満たす40研究の明示的指導(k = 71)の効果量の平均(d = 1.13)が,19研究の暗示的指導(k = 29, d = 0.54)を上回ることを示し,第二言語習得・外国語教育研究におけるメタ分析研究の嚆矢となった。 一方この研究では「明示的」と定義される範囲が漠然としており,その中身に関する意味のある調整変数は,後継のメタ分析においても明らかになっているとは言い難い。Watari & Mizushima (2016)は,Norris and Ortega (2000)を含む4メタ分析研究および日本の主要学会誌を対象とするメタ分析研究2本の182論文を対象とする再分析を行い,直後テストの結果において,暗示的指導との直接比較を行った45研究の明示的指導(k = 79)の効果量がg = 0.43 [0.28, 0.57]であり,形態論的・統語論的側面よりも,音韻論的側面や語用論的側面をターゲットとし(Q(3) = 8.68, p < .05),意味論的・機能的側面までを解説内容とする方が効果が大きいこと(Q(2) = 6.36, p < .05),さらに総括的な規則提示が高い効果をもたらしうる可能性などを示した。 しかし因果推論という観点で見れば,ここには説明変数・結果変数の関係や共変量の調整に問題の多い一次研究が多数含まれている。実験デザイン・測定法の異なる研究が混在し,メタ分析に必要な記述統計の報告不備すら依然指摘される現状(Plonsky, 2014)にあっては,知見の統合のメリットは限定的にならざるを得ない。今後は,関連他分野の研究者の協力も得て,共通尺度の開発も含め,統合に耐えうる一次研究の蓄積が求められることになると考えられる。エビデンスに基づく教育研究の社会的・学術的影響熊井将太 「エビデンス」という言葉が教育研究の領域でも存在感を高めてきている。実証的な知見に依拠した「授業の科学化」という要求は何も目新しいものではないが,今日の「エビデンス」運動の特殊性は,一方ではRCTやそのメタ分析といった特定の研究方法を頂点として学問的知見を階層化しようとする方向性に,他方では事象のあり方を客観的に明らかにする「説明科学」を超えて,そこで得られた因果的な知見をより直接的に利用可能なものにしようとする方向性に見出すことができる。このような「エビデンス」運動の特質は,必然的に従来の教育実践研究を担ってきたアクターと競合関係を作り,相互批判を生み出すこととなる。その中では,教育研究におけるメタ分析の有効性や課題とは何か,あるいはメタ分析から得られた知見の活用可能性と危険性とはいかなるものかが問われている(例えば,杉田・熊井(印刷中)など)。 本発表では,世界的に大きな反響を巻き起こしたJohn HattieによるVisible learning (Hattie, 2009)およびVisible learning for teachers (Hattie, 2012)を素材に上記の問題を考えてみたい。Hattieの研究をめぐる議論で興味深いのは,元来規範的なアプローチを主流としてきたドイツ語圏の国々において英語圏以上に議論が活性化していることである。加えて,Hattieの研究は,例えばバイエルン州のように,学校の質保障や外部評価の基準として政策的に受容されているところもある(熊井, 2016)。ドイツ語圏の議論と日本における教育実践研究の動向を見渡しながら,教育実践の複雑性の軽視や教育目標・内容論の欠如といった課題を指摘しつつ,他方で批判者側の「閉じこもり」の問題に言及したい。付 記このシンポジウムはJSPS科研費(基盤研究A:17H01012)の助成を受けた。
著者
岡田 謙介
出版者
東京大学
雑誌
基盤研究(C)
巻号頁・発行日
2014-07-18

本研究は、熱帯半乾燥地域の中でも近年稲生産国として着目されているタンザニアを例に、圃場試験・モデリングおよび経済分析の各手法を統合することにより、灌漑水田・天水低湿地・天水畑地間の最適資源配分の導出方法を開発し、延いては安定的な米供給の実現に資することを目的とするものである。平成29年度には現地への訪問は行わなかったが、タンザニアにおける天水ネリカ普及JICAプロジェクトであるTANRICEの長期専門家から、まず2017年8月にスカイプで研修内容に関する詳細な聞き取りを行った。次に解析に必要なデータについては、2017年8月と2018年3月にメールを通して情報を入手しモデル解析を実施した。すなわちタンザニアにおける同プロジェクトの2013以降5年間に渡るタンザニア全土の各地におけるのべ29回のネリカ栽培研修会における詳細なデータを入手した。その中には各研修会に参加したのべ1179名の参加者の農地における収量等の栽培データが集積されている。現在、それらのデータを統計的に解析を行うとともに、これを用いて各地・各年にAPSIM-Ozyzaを完全天水畑地と仮定して走らせ収量解析を実施している。一方でタンザニア各地においてネリカ導入を、農民における既存栽培作物のネリカへの置換ととらえた場合の、ネリカの収量だけではなく、既存作物の種類および収量、およびそれらの各作物の販売収入についても考察の対象として、本当にネリカ導入に対する農民の意欲を測定する手法について、文献調査も含めて検討を行いつつある。