著者
秋山隆 久保沙織 豊田秀樹 楠見孝 向後千春
出版者
日本教育心理学会
雑誌
日本教育心理学会第58回総会
巻号頁・発行日
2016-09-22

統計的方法を学ぶことは,これまで,すなわち有意性検定を学ぶことでした。長期に渡りこの大前提はゆるぎなく盤石で,無条件に当たり前で,無意識的ですらありました。しかし,ときは移り,有意性検定やp値の時代的使命は終わりました。アメリカ統計学会ASAは,2016年3月7日に,p値の誤解や誤用に対処する6つの原則に関する声明をだしました (Wasserstein & Lazar, 2016)。この声明は「『ポストp < 0.05 時代』へ向けて研究方法の舵を切らせることを意図している」(R. Wasserstein (ASA News Releases, 2016)) ものだと言明されています。2016年現在,統計学における著名な学術雑誌バイオメトリカ (Biometrika) の過半数の論文が,ベイズ統計学を利用しています。多くの著名な学術雑誌も同様の傾向です。スパムメールをゴミ箱に捨て,日々,私たちの勉強・仕事を助けてくれるのは,ベイズ統計学を利用したメールフィルタです。ベイズ的画像処理によってデジタルリマスターされ,劇的に美しくよみがえった名作映画を私たちは日常的に楽しんでいます。ベイズ理論が様々な分野で爆発的に活用されています。ベイズ的アプローチなしには,もう統計学は語れません。 有意性検定にはどこに問題があったのでしょう。3点あげます。 Ⅰ.p値とは「帰無仮説が正しいと仮定したときに,手元のデータから計算した検定統計量が,今以上に甚だしい値をとる確率」です。この確率が小さい場合に「帰無仮説が正しくかつ確率的に起きにくいことが起きたと考えるのではなく,帰無仮説は間違っていた」と判定します。これが帰無仮説の棄却です。しかし帰無仮説は,偽であることが初めから明白です。それを無理に真と仮定することによって,検定の論理は複雑で抽象的になります。例えば2群の平均値の差の検定における帰無仮説は「2群の母平均が等しい (μ1=μ2)」というものです。しかし異なる2つの群の母平均が,小数点以下を正確に評価して,それでもなお等しいということは科学的にありえません。帰無仮説は偽であることが出発点から明らかであり,これから検討しようとすることが既に明らかであるような論理構成は自然な思考にはなじみません。p値は土台ありえないことを前提として導いた確率なので,確率なのに抽象的で実感が持てません。このことがp値の一番の弊害です。以上の諸事情を引きずり,「有意にならないからといって,差がないとは積極的にいえない」とか「有意になっても,nが大きい場合には意味のある差とは限らない」とか,いろいろな言い訳をしながら有意性検定をこれまで使用してきたのです。しかし,これらの問題点はベイズ的アプローチによって完全に解消されます。ベイズ的アプローチでは研究仮説が正しい確率を直接計算するからです。 Ⅱ.nを増加させるとp値は平均的にいくらでも0に近づきます。これはたいへん奇妙な性質です。nの増加にともなって,いずれは「棄却」という結果になることが,データを取る前に分かっているからです。有意性検定とは「帰無仮説が偽であるという結論の下で,棄却だったらnが大きかった,採択だったらnが小さかったということを判定する方法」と言い換えることすらできます。ナンセンスなのです。これでは何のために分析しているのか分かりません。nを増加させると,p値は平均的にいくらでも0に近づくのですから,BIGデータに対しては,あらゆる意味で有意性検定は無力です。どのデータを分析しても「高度に有意」という無情報な判定を返すのみです。そこで有意性検定ではnの制限をします。これを検定力分析の事前の分析といいます。事前の分析では有意になる確率と学術的な対象の性質から逆算してnを決めます。しかし検定力分析によるサンプルサイズnの制限・設計は纏足 と同じです。統計手法は,本来,データを分析するための手段ですから,たくさんのデータを歓迎すべきです。有意性検定の制度を守るために,それに合わせてnを制限・設計することは本末転倒です。ベイズ推論ではnが大きすぎるなどという事態は決して生じません。 Ⅲ.伝統的な統計学における平均値の差・分散の比・クロス表の適合などの初等的な統計量の標本分布を導くためには,理系学部の2年生程度の解析学の知識が必要になります。すこし複雑な統計量の標本分布を導くためには,統計学のために発達させた分布論という特別な数学が必要になります。それでも,どの統計量の標本分布でも求められるという訳ではなく,導出はとても複雑です。検定統計量の標本分布を導けないと,(教わる側にとっては)統計学が暗記科目になってしまいます。この検定統計量の確率分布は何々で,あちらの検定統計量の確率分布は何々で,のように,まるで歴史の年号のように,いろいろと覚えておかないと使えません。暗記科目なので,自分で工夫するという姿勢が育つはずもなく,紋切り型の形式的な使用に堕す傾向が生じます。でもベイズ統計学は違います。マルコフ連鎖モンテカルロ (MCMC) 法の本質は,数学Ⅱまでの微積分の知識で完全に理解することが可能です。標本分布の理論が必要とする数学と比較すると,それは極めて初等的です。生成量を定義すれば,直ちに事後分布が求まり,統計的推測が可能になります。文科系の心理学者にとっても,統計学は暗記科目ではなくなります。 学問の進歩を木の成長にたとえるならば,平行に成長した幾つかの枝は1本を残して冷酷に枯れ落ちる運命にあります。枯れ果て地面に落ちた定理・理論・知識は肥やしとなり,時代的使命を終えます。選ばれた1本の枝が幹になり,その学問は再構築されます。教授法が研究され,若い世代は労せず易々と古い世代を超えていく。そうでなくてはいけません。 統計学におけるベイズ的アプローチは,当初,高度なモデリング領域において急成長しました。有意性検定では,まったく太刀打ちできない領域だったからです。議論の余地なくベイズ的アプローチは勢力を拡大し,今やその地位はゆるぎない太い枝となりました。 しかし統計学の初歩の領域では少々事情が異なっています。有意性検定による手続き化が完成しており,いろいろと問題はあるけれども,ツールとして使えないわけではありません。なにより,現在,社会で活躍している人材は,教える側も含めて例外なく有意性検定と頻度論で統計教育を受けています。この世代のスイッチングコストは無視できないほどに大きいのです。このままでは有意性検定と頻度論から入門し,ベイズモデリングを中級から学ぶというねじれた統計教育が標準となりかねません。それでは若い世代が無駄な学習努力を強いられることとなります。教科教育学とか教授学習法と呼ばれるメタ学問の使命は,不必要な枝が自然に枯れ落ちるのを待つのではなく,枝ぶりを整え,適切な枝打ちをすることにあります。ではどうしたらいいのでしょう。どのみち枝打ちをするのなら,R.A.フィッシャー卿の手による偉大な「研究者のための統計的方法」にまで戻るべきです。「研究者のための統計的方法」の範囲とは,「データの記述」「正規分布の推測」「独立した2群の差の推測」「対応ある2群の差の推測」「実験計画法」「比率・クロス表の推測」です。これが統計学の入門的教材の初等的定番です。文 献Wasserstein, R. L. & Lazar, N. A. (2016). The ASA's statement on p-values: context, process, and purpose, The American Statistician, DOI:10.1080/00031305.2016.1154108ASA News Releases (2016). American Statistical Association releases statement on statistical significance and p-Values. (http://www.amstat.org/newsroom/pressreleases/P-ValueStatement.pdf)R.A.フィッシャー(著) 遠藤健児・鍋谷清治(訳) (1970). 研究者のための統計的方法 森北出版 (Fisher, R. A. (1925). Statistical Methods for Research Workers, Oliver and Boyd: Edinburgh.)1 纏足(てんそく)とは,幼児期から足に布を巻き,足が大きくならないようにして小さい靴を履けるようにした,かつて女性に対して行われていた非人道的風習です。靴は,本来,足を保護するための手段ですから,大きくなった足のサイズに靴を合わせるべきです。靴に合わせて足のサイズを制限・整形することは本末転倒であり,愚かな行為です。他の靴を履けばよいのです。
著者
久保 沙織
出版者
一般社団法人 日本教育心理学会
雑誌
教育心理学年報 (ISSN:04529650)
巻号頁・発行日
vol.61, pp.133-150, 2022-03-30 (Released:2022-11-11)
参考文献数
103

直近の1年間に『教育心理学研究』に掲載された論文で,量的研究法を用いていた24編中9編でパス解析・共分散構造分析(SEM)が利用されていた。本稿ではまず,SEMに焦点を当てて,『教育心理学研究』におけるその利用の現状を報告し,SEMの理論の正しい理解と適切な適用に資する論考を紹介した。近年は,多母集団同時分析や,縦断データ及び階層データを対象としたモデルなど,より複雑かつ高度なSEMのモデルが利用される傾向が見られた。今後は,項目反応理論やベイズ統計モデリングなどさらに数学的に高度な方法論への理解も求められるだろう。高度な手法を利用する研究者には,それ相応の説明責任が伴う。心理統計・測定評価の専門家は,応用研究者が手法を正しく使いこなせるように,ユーザーの視点に立った教育・啓発活動を継続する必要がある。学会には,査読を経た掲載論文の質保証と,執筆マニュアルの充実が望まれる。SEMに限らず,数学的に高度な統計的手法が正しい理解に基づき適切に利用されるためには,「ユーザーとしての応用研究者」,「心理統計・測定評価の専門家」そして「学会」の三者協働による不断の努力が必要不可欠である。
著者
豊田 秀樹 拜殿 怜奈 久保 沙織 池原 一哉 磯部 友莉恵
出版者
公益社団法人 日本心理学会
雑誌
心理学研究 (ISSN:00215236)
巻号頁・発行日
vol.86, no.6, pp.535-544, 2016 (Released:2016-02-25)
参考文献数
30
被引用文献数
1

The purpose of this study is to propose a method of factor analysis for analyzing contingency tables developed from the data of unlimited multiple-choice questions. This method assumes that the element of each cell of the contingency table has a binominal distribution and a factor analysis model is applied to the logit of the selection probability. Scree plot and WAIC are used to decide the number of factors, and the standardized residual, the standardized difference between the sample, and the proportion ratio, is used to select items. The proposed method was applied to real product impression research data on advertised chips and energy drinks. Since the results of the analysis showed that this method could be used in conjunction with conventional factor analysis model, and extracted factors were fully interpretable, and suggests the usefulness of the proposed method in the study of psychology using unlimited multiple-choice questions.
著者
久保 沙織 豊田 秀樹
出版者
日本パーソナリティ心理学会
雑誌
パーソナリティ研究 (ISSN:13488406)
巻号頁・発行日
vol.22, no.2, pp.93-107, 2013-11-30 (Released:2013-12-04)
参考文献数
23

多特性多方法行列を扱う確認的因子分析モデルにおいて,CT-CMモデルは信頼性と収束的・弁別的妥当性の解釈が一通りに定まるというメリットがあるが,識別されない場合が多い。一方で,CT-C (M-1)モデル(Eid, 2000)は,識別は保証されるものの,基準となる方法の選択に依存して,同一データに対して信頼性と妥当性の解釈が変わってしまうという欠点がある。そこで本論文では,CT-CMモデルを基に,方法因子の因子得点の和が0という制約(Kenny & Kashy, 1992)を導入することで,基準となる方法を決める必要がなく,信頼性や妥当性の解釈が一通りに定まるモデルを提案する。主要文献より引用した12の相関行列に3種類のモデルを適用した結果と,シミュレーション研究の結果から,提案モデルは信頼性と妥当性に関する解釈が一通りに定まり,識別の可能性も高く,有望なモデルであることが示唆された。
著者
久保 沙織
出版者
日本医学教育学会
雑誌
医学教育 (ISSN:03869644)
巻号頁・発行日
vol.53, no.3, pp.215-220, 2022-06-25 (Released:2022-11-04)
参考文献数
9

教育測定学の専門家としての立場から, 現状の医師国家試験の問題点を明確にした上で, item response theory (IRT) に基づくcomputer-based testing (CBT) 導入の利点と課題について検討した. CBTにより, 多様な問題形式を利用することで, 構成概念の代表性という側面から測定の妥当性向上に貢献することが期待できる. さらに, IRTの枠組みで等化された項目プールを用いてテストを運用することにより, 難易度や測定精度を制御して一定の質を満たす問題セットを継続的に作成し, 実施日程や会場, 受験者集団が異なる場合でも, 共通尺度上のスコアとして表現することが可能となる. 一方で, 事前の綿密なテスト計画と, 大規模な項目プールの構築・維持が最大の課題となる.
著者
豊田 秀樹 拜殿 怜奈 久保 沙織 池原 一哉 磯部 友莉恵
出版者
公益社団法人 日本心理学会
雑誌
心理学研究 (ISSN:00215236)
巻号頁・発行日
pp.86.14055, (Released:2016-01-15)
参考文献数
30
被引用文献数
1

The purpose of this study is to propose a method of factor analysis for analyzing contingency tables developed from the data of unlimited multiple-choice questions. This method assumes that the element of each cell of the contingency table has a binominal distribution and a factor analysis model is applied to the logit of the selection probability. Scree plot and WAIC are used to decide the number of factors, and the standardized residual, the standardized difference between the sample, and the proportion ratio, is used to select items. The proposed method was applied to real product impression research data on advertised chips and energy drinks. Since the results of the analysis showed that this method could be used in conjunction with conventional factor analysis model, and extracted factors were fully interpretable, and suggests the usefulness of the proposed method in the study of psychology using unlimited multiple-choice questions.
著者
豊田 秀樹 拜殿 怜奈 久保 沙織 池原 一哉 磯部 友莉恵
出版者
公益社団法人 日本心理学会
雑誌
心理学研究 (ISSN:00215236)
巻号頁・発行日
vol.86, no.6, pp.535-544, 2016
被引用文献数
1

The purpose of this study is to propose a method of factor analysis for analyzing contingency tables developed from the data of unlimited multiple-choice questions.<b> </b>This method assumes that the element of each cell of the contingency table has a binominal distribution and a factor analysis model is applied to the logit of the selection probability. Scree plot and WAIC are used to decide the number of factors, and the standardized residual, the standardized difference between the sample, and the proportion ratio, is used to select items.<b> </b>The proposed method was applied to real product impression research data on advertised chips and energy drinks. Since the results of the analysis showed that this method could be used in conjunction with conventional factor analysis model, and extracted factors were fully interpretable, and suggests the usefulness of the proposed method in the study of psychology using unlimited multiple-choice questions.