著者
吉田寿夫 村井潤一郎 宇佐美慧 荘島宏二郎 小塩真司 鈴木雅之 椎名乾平
出版者
日本教育心理学会
雑誌
日本教育心理学会第61回総会
巻号頁・発行日
2019-08-29

現状に対する憂いと企画趣旨吉田寿夫 SEM(structural equation modeling:構造方程式モデリング)ないし共分散構造分析と呼ばれる統計手法は,この30年ほどの間,心理学を始めとする多くの研究領域において多用されてきた。それは,既存の多くの分析法を包括する大規模なものであるとともに,コンピュータなしでは行うことができない,ほとんどのユーザーにとって「計算過程がブラックボックス化している」と言えるであろうものである。 筆者は,論文の審査などを行うなかでSEMを用いている論文を多々読んできたが,率直に言って,「へえー」とか「なるほど」といった感覚を生じさせてくれる脱常識性が高いと判断されるものや,著書などで引用したり授業で紹介したりしようと思うものに遭遇したことがない。そして,そればかりか,おそらくはSEMの数学的な高度さに惑わされて,その力を過大視し,不当な結論を一人歩きさせていると言えるであろう状態が蔓延っているように感じている。 主たる問題は,多くの専門家が「SEMは基本的に因果関係を立証する力を有するものではない」ことについて警鐘を鳴らしてきたにもかかわらず,ユーザーの側がこのことをきちんと踏まえていないことにあると考えられる。そして,このことに関連して「予測と因果の混同」と言えるであろう事態が散見されるとともに,「適合度への過度の注目」,「適合度の評価における論理的必然性がないであろう基準の無批判な受け入れ」,「(重回帰分析におけるR2に相当する)説明力の非重視」,「パス係数の評価における統計的検定への過度の依拠」,「潜在変数間の関係の検討における希薄化の不適切な修正」,「測定の妥当性に関わる問題の軽視」,「個々人における心理過程の究明であることを踏まえない,個人間変動に基づく検討」などといった問題が指摘されてきた。 本シンポジウムでは,以上のような現状を踏まえ,SEMの有効性の過大視・不適切な適用や弊害の発生の抑制,適切な適用の促進といったことを目的として,現実の適用において散見される種々の問題事象を提示して,それらについて議論するとともに,SEMならではだと考えられる優れた適用例を提示して,SEMを用いることのメリットについて議論する。そして,そのうえで,適切な適用を促進し,不適切な適用を抑制するための方策について提言することができればと考えている。SEMの営為の根本を見つめなおす荘島宏二郎 SEMの最大の魅力は,何と言っても分析結果の視覚的了解性の高さである。端的に言って,パス図(path diagram)を用いたデータの要約結果,すなわち「情報の可視化(information visualization)」に優れている。SEM以前は,t検定・分散分析・回帰分析・因子分析が主な分析手法であったが,それらは,大抵,表によって結果が表示されていたため,パス図による現象の描写力の高さに多くの研究者が魅力を感じた。 また,計算機の高度化が手伝い,従来,理論的には考えられていたが,エンドユーザの計算機ではなかなか実現することが難しかったカテゴリカルデータ解析・多母集団分析・潜在クラス分析・マルチレベル分析・欠測データ分析などの「重たい」分析手法が,SEMというプラットフォームで花開いた。 今や,単なる「共分散構造」分析ではなく,それらの諸分析も含めての構造方程式モデリング(SEM)である。SEMに万能感を抱く研究者・分析者も多いのではないだろうか。 ほかにも,SEMの普及により,科学的意思決定がほとんどp値一辺倒だった時代から,適合度指標や自由度を総合的に見ていくという科学的態度を養うことに貢献したことも大きい。 反面,SEMの普及に伴い,肥大したSEMに対する信頼に基づく「因果に関する誤った言及(限定的に言及できる場合があるが)」や,SEMに関する不識・不案内に基づく「誤差間共分散の乱用」,「甘い適合度指標への過度の依存」,「パス図におけるトポロジカルな配置と印象操作」など,様々な改善すべき問題点がある。 さらに,SEMもまた方法論であることを考えると,本質的に複雑であり,超高次元多様体であるかのような現象のある一面を切り取ってくるものでしかない。当然,SEMの分析だけで現象を理解することはできず,他の方法と組み合わせて(方法論的多次元主義),現象を立体化しなくてはいけないが,SEMを過信する者ほど,往々にしてそういう態度は希薄である。 本報告では,心理統計学の専門家の観点から,統計分析という営為の本質に踏み込みつつ,「SEMが何をしているものか」ということについて試論(私論)を述べたい。SEMを使って論文を書くことについて小塩真司 正直なことを言うと,SEMや共分散構造分析を使って論文を書くことはそれほど多いわけではない。おそらく,自分がかかわる研究においてもっとも使う頻度が多い使用方法は,確認的因子分析であろう。その他の手法は,その研究の文脈に応じて使うことはあっても,無理に使ったという印象は少ない。また,おそらく探索的な検討が多いこともあるように思われる。 これまでSEMを用いた論文の査読などをしていて,いくつか気になることがあった。たとえば探索的な研究過程でSEMを用いること,それほど必然性が感じられないような場面で用いること,強固な目的があるわけではなく単にエクスキューズのためではないかと思わせる場面で使われていること,ここで使わないよりも使ったほうが採択率の上昇が見込めると考えているのだろうなという著者の意図が見えてしまうこと,などである。これらは決して糾弾されるような用いられ方ではない。現実として,特定の研究領域において新たな統計手法を用いることは,方法論上のアドバンテージと考えられて論文の採択率を高めるであろうし,研究者もそのことを念頭に分析をする可能性はある。 では,多くはない私自身の経験の中で,どのようにSEMを用いたのかを例示してみたい。第1に,確認的因子分析である。特に,複数の国を対象とした調査において,国をまたいでおおよそ同じ因子構造が見られるかどうかを多母集団解析で検討したことがある。この場合,測定不変性(measurement invariance)について検討することになる。そこには,因子と観測変数の配置が群間で等しいこと(configural invariance),因子負荷量が群間で等しいこと(metric invariance),観測変数の切片が群間で等しいこと(scalar invariance),観測変数の誤差分散が群間で等しいこと(residual invariance)という複数のレベルがあり,どのレベルまで満たされるかを検討することになる。第2に,縦断データの分析である。その中の1つは交差遅延効果モデル,もう1つは潜在成長曲線モデルである。縦断的なデータを分析する際に,SEMはその有用性を発揮するように思われる。 本報告では,査読経験と論文執筆経験の両面から,SEMの使用方法について考えてみたい。自身の研究におけるSEMの適用を振り返って鈴木雅之 発表者がSEMを適用した研究の多くは,大学院生時代に行われたものである。発表者が修士課程に入学した2008年の前後には,SEMを用いた研究が多くみられ,学部の授業ではSEMについて詳しく学ぶ機会がなかったことから,当時の発表者にとってSEMは最先端の分析手法であり,その可視性の高さから非常に魅力的なものにみえた。当時の自身の研究を振り返ってみると,「SEMを使ってみたい」という気持ちが先行しており,SEMのメリットを十分に活かした研究はできていなかったというのが,正直なところである。 発表者は大学院生時代,テストが学習動機づけや学習方略の使用に与える影響に関心を寄せていた。テストについては,内発的動機づけの低下や,目先のテストを乗り越えることだけを目的とした低次の学習が助長されるなど,その否定的な側面が強調されることが多い(e.g., Gipps, 1994)。一方で,テストが一種のペースメーカーとなることで計画的な学習が促進されたり,テストによる達成度の把握や学習改善が促進されたりするなど,テストには肯定的な側面もあることが示されてきた(e.g., Hong & Peng, 2008)。このように,テストの影響というのは一様ではなく,個人差がある。 テストの影響の個人差を説明する要因の1つとして,テストに対する学習者の認識(テスト観)に焦点が当てられてきた(e.g., Struyven et al., 2005)。つまり,あるテストが実施されることで学習者が受ける影響は,学習者がそのテストをどう捉えたかによって異なることが示唆されてきた。発表者は,テスト観が学習動機づけや学習方略の使用とどのような関連を持つかについて,質問紙調査や実験授業を行い,分析手法の1つとしてSEMを適用することで検討してきた。たとえば鈴木(2011)は,評価基準と学習改善のための指針を明確にしたフィードバックが学習動機づけと学習方略の使用に与える影響を,テスト観が媒介している可能性について検討した。また鈴木他(2015)は,縦断調査を行い,学習動機づけの変化とテスト観の関係について検討した。 本発表では,自戒の意味も込めて,これら一連の研究におけるSEMの適用を振り返りながら,SEMの適用方法について議論していきたい。
著者
荘島 宏二郎
出版者
一般社団法人 日本教育心理学会
雑誌
教育心理学年報 (ISSN:04529650)
巻号頁・発行日
vol.53, pp.147-155, 2014 (Released:2014-12-24)
参考文献数
20

これまで統計学を用いた意思決定は, 仮説検定においてp値のみを参考にして仮説の採否を決定してきた。しかし, p値は, 標本サイズが大きいほど小さくなり, 標本サイズが極めて大きいときには効果の大小にかかわらず帰無仮説が棄却されるという欠点がある。近年, 統計的意思決定の過程において効果量を利用することが重要視されてきている。効果量は, 介入によってどれくらいの効果があるのかを定量的に示し, 標本サイズの大きさによらない統計量である。しかし, 一方で, 構造方程式モデリングでは, モデルのデータに対する当てはまり具合を多数の適合度指標によって診断するということをすでにやっている。そして, 仮説検定においてよく用いるt検定や分散分析は構造方程式モデリングの下位モデルである。したがって, t検定や分散分析においても多数の適合度指標を参照することで意思決定を行うことができる。本稿では, 被検者内1要因分散分析を例にとって, 適合度指標を用いたモデル選択について解説する。
著者
木村 哲夫 荘島 宏二郎 永岡 慶三
出版者
新潟青陵大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

小規模であってもコンピュータ適応型テスト(CAT:受験者の解答が正解か不正解かによって、次の設問の難易度をコンピュータが調整して出題するテスト)を,複数の教員や学校が協働作業をすることによって、開発し実施できることを示すとともに、その結果を能力記述文と対応付けることを目指した。あわせて、学習管理システム(LMS:コンピュータ上で行われる学習を管理するシステム)で簡単にCATを実施可能にするプログラムの開発を行い公開した。
著者
荘島 宏二郎 大津 起夫
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.31, no.2, pp.89-106, 2004-09-30
参考文献数
38
被引用文献数
1

1. 目的 項目反応理論(item response theory, IRT;Lord, 1980;Hambleton & Swaminathan, 1985;芝, 1991;池田, 1994)は, テストを運営する上で非常に強力な理論体系であり, 前川(2003)が報告しているように, 我が国でも医師国家試験(厚生労働省), 情報処理技術者試験(通商産業省), 日本留学試験(日本国際教育協会)などの実際の大規模テストでも実用化が達成されている. IRTモデルの1つに連続反応モデル(continuous response model, CRM;Samejima, 1973, 1974)がある. CRMは連続得点のためのIRTモデルとして応用上重要なモデルである(Shojima, 2003). CRMの項目母数の推定法はWang & Zeng(2000), あるいはShojima(2004)で提案された. また, Shojima(2003)がCRMの共通項目計画(common item design;e. g., Haebara, 1980;Stocking & Lord, 1983)と共通被験者計画(common examinees design;e. g., 野口, 1986;Ogasawara, 2001)におけるテスト等化法を論じている. Shojima(2003)の共通被験者計画における等化法は, 野口(1986), Ogasawara(2001)に準ずるものである.
著者
大津 起夫 橋本 貴充 荘島 宏二郎 石塚 智一
出版者
日本行動計量学会
雑誌
日本行動計量学会大会発表論文抄録集
巻号頁・発行日
vol.34, pp.174-177, 2006-08

大学入試センター試験は約50万人の受験者を有する大規模な試験である.センター試験を採用する大学には、利用する受験科目の裁量が可能である.また同一時間に同一教科に属する複数科目の試験が実施されるため、受験者ごとに様々な科目パターンが発生し、一貫した基準による受験者の比較が難しい.ここでは、欠測値に対応した、非線形因子分析を用いることにより、これら受験者の学力比較のひとつの基準を提案し、またこれを用いてセンター試験における受験者の科目選択の状況の概要を把握する。
著者
柳井 晴夫 亀井 智子 中山 和弘 松谷 美和子 岩本 幹子 佐伯 圭一郎 副島 和彦 中野 正孝 中山 洋子 西田 みゆき 藤本 栄子 安ヶ平 伸枝 井上 智子 麻原 きよみ 井部 俊子 及川 郁子 大久保 暢子 小口 江美子 片岡 弥恵子 萱間 真美 鶴若 麻理 林 直子 廣瀬 清人 森 明子 奥 裕美 外崎 明子 伊藤 圭 荘島 宏二郎 植田 喜久子 太田 喜久子 中村 洋一 菅田 勝也 島津 明人 金城 芳秀 小林 康江 小山 眞理子 鶴田 恵子 佐藤 千史 志自岐 康子 鈴木 美和 高木 廣文 西川 浩昭 西山 悦子 野嶋 佐由美 水野 敏子 山本 武志 大熊 恵子 留目 宏美 石井 秀宗 大久保 智也 加納 尚美 工藤 真由美 佐々木 幾美 本田 彰子 隆 朋也 中村 知靖 吉田 千史 西出 りつ子 宮武 陽子 西崎 祐史 山野 泰彦 牛山 杏子 小泉 麗 大西 淳子 松本 文奈 鶴見 紘子
出版者
聖路加看護大学
雑誌
基盤研究(A)
巻号頁・発行日
2008

近年、看護系大学の急増と医療の高度化に伴い、卒業までに取得すべき看護実践能力の評価の重要性が増加している。その一環として、臨地実習に入る直前の段階までに看護学生が取得すべき知識・能力を正しく評価しておくことは看護実習の適正化のための急務の課題である。このような状況に鑑み、申請者は、2008~2010年に科学研究費補助金を受け、看護系大学の学生が臨地実習以前に必要とされる知識・能力の有無を検証することを目的として、看護学18領域から約1500の多肢選択式形式の設問を作成し、730名の学生に紙筆形式のモニター試験、および、220名の学生に対するコンピュータ試験(CBT:Computer Based Testing)を実施し、その結果を比較し、全国看護系大学共用のコンピュータ試験の有用性を確認した。