著者
椎名 乾平
出版者
心理学評論刊行会
雑誌
心理学評論 (ISSN:03861058)
巻号頁・発行日
vol.59, no.4, pp.415-444, 2016 (Released:2018-03-21)
参考文献数
146

Pearson’s correlation coefficient is an important statistic. For over a century, the index has been used in various branches of science. This paper introduces both its creation and initial developments that are often forgotten or ignored. Because no theory is independent of the original setting and the research plan of its creators, knowledge about the context of pioneering ideas helps researchers better understand the meaning of the coefficient. The paper highlights the work of Bravais, Galton, Pearson, artillery scientists, Spearman, and many other early contributors, and describes their original intentions, achievements, and faults. Key comments on the present statistical theories and practices are also presented in several pivotal comments.
著者
吉田寿夫 村井潤一郎 宇佐美慧 荘島宏二郎 小塩真司 鈴木雅之 椎名乾平
出版者
日本教育心理学会
雑誌
日本教育心理学会第61回総会
巻号頁・発行日
2019-08-29

現状に対する憂いと企画趣旨吉田寿夫 SEM(structural equation modeling:構造方程式モデリング)ないし共分散構造分析と呼ばれる統計手法は,この30年ほどの間,心理学を始めとする多くの研究領域において多用されてきた。それは,既存の多くの分析法を包括する大規模なものであるとともに,コンピュータなしでは行うことができない,ほとんどのユーザーにとって「計算過程がブラックボックス化している」と言えるであろうものである。 筆者は,論文の審査などを行うなかでSEMを用いている論文を多々読んできたが,率直に言って,「へえー」とか「なるほど」といった感覚を生じさせてくれる脱常識性が高いと判断されるものや,著書などで引用したり授業で紹介したりしようと思うものに遭遇したことがない。そして,そればかりか,おそらくはSEMの数学的な高度さに惑わされて,その力を過大視し,不当な結論を一人歩きさせていると言えるであろう状態が蔓延っているように感じている。 主たる問題は,多くの専門家が「SEMは基本的に因果関係を立証する力を有するものではない」ことについて警鐘を鳴らしてきたにもかかわらず,ユーザーの側がこのことをきちんと踏まえていないことにあると考えられる。そして,このことに関連して「予測と因果の混同」と言えるであろう事態が散見されるとともに,「適合度への過度の注目」,「適合度の評価における論理的必然性がないであろう基準の無批判な受け入れ」,「(重回帰分析におけるR2に相当する)説明力の非重視」,「パス係数の評価における統計的検定への過度の依拠」,「潜在変数間の関係の検討における希薄化の不適切な修正」,「測定の妥当性に関わる問題の軽視」,「個々人における心理過程の究明であることを踏まえない,個人間変動に基づく検討」などといった問題が指摘されてきた。 本シンポジウムでは,以上のような現状を踏まえ,SEMの有効性の過大視・不適切な適用や弊害の発生の抑制,適切な適用の促進といったことを目的として,現実の適用において散見される種々の問題事象を提示して,それらについて議論するとともに,SEMならではだと考えられる優れた適用例を提示して,SEMを用いることのメリットについて議論する。そして,そのうえで,適切な適用を促進し,不適切な適用を抑制するための方策について提言することができればと考えている。SEMの営為の根本を見つめなおす荘島宏二郎 SEMの最大の魅力は,何と言っても分析結果の視覚的了解性の高さである。端的に言って,パス図(path diagram)を用いたデータの要約結果,すなわち「情報の可視化(information visualization)」に優れている。SEM以前は,t検定・分散分析・回帰分析・因子分析が主な分析手法であったが,それらは,大抵,表によって結果が表示されていたため,パス図による現象の描写力の高さに多くの研究者が魅力を感じた。 また,計算機の高度化が手伝い,従来,理論的には考えられていたが,エンドユーザの計算機ではなかなか実現することが難しかったカテゴリカルデータ解析・多母集団分析・潜在クラス分析・マルチレベル分析・欠測データ分析などの「重たい」分析手法が,SEMというプラットフォームで花開いた。 今や,単なる「共分散構造」分析ではなく,それらの諸分析も含めての構造方程式モデリング(SEM)である。SEMに万能感を抱く研究者・分析者も多いのではないだろうか。 ほかにも,SEMの普及により,科学的意思決定がほとんどp値一辺倒だった時代から,適合度指標や自由度を総合的に見ていくという科学的態度を養うことに貢献したことも大きい。 反面,SEMの普及に伴い,肥大したSEMに対する信頼に基づく「因果に関する誤った言及(限定的に言及できる場合があるが)」や,SEMに関する不識・不案内に基づく「誤差間共分散の乱用」,「甘い適合度指標への過度の依存」,「パス図におけるトポロジカルな配置と印象操作」など,様々な改善すべき問題点がある。 さらに,SEMもまた方法論であることを考えると,本質的に複雑であり,超高次元多様体であるかのような現象のある一面を切り取ってくるものでしかない。当然,SEMの分析だけで現象を理解することはできず,他の方法と組み合わせて(方法論的多次元主義),現象を立体化しなくてはいけないが,SEMを過信する者ほど,往々にしてそういう態度は希薄である。 本報告では,心理統計学の専門家の観点から,統計分析という営為の本質に踏み込みつつ,「SEMが何をしているものか」ということについて試論(私論)を述べたい。SEMを使って論文を書くことについて小塩真司 正直なことを言うと,SEMや共分散構造分析を使って論文を書くことはそれほど多いわけではない。おそらく,自分がかかわる研究においてもっとも使う頻度が多い使用方法は,確認的因子分析であろう。その他の手法は,その研究の文脈に応じて使うことはあっても,無理に使ったという印象は少ない。また,おそらく探索的な検討が多いこともあるように思われる。 これまでSEMを用いた論文の査読などをしていて,いくつか気になることがあった。たとえば探索的な研究過程でSEMを用いること,それほど必然性が感じられないような場面で用いること,強固な目的があるわけではなく単にエクスキューズのためではないかと思わせる場面で使われていること,ここで使わないよりも使ったほうが採択率の上昇が見込めると考えているのだろうなという著者の意図が見えてしまうこと,などである。これらは決して糾弾されるような用いられ方ではない。現実として,特定の研究領域において新たな統計手法を用いることは,方法論上のアドバンテージと考えられて論文の採択率を高めるであろうし,研究者もそのことを念頭に分析をする可能性はある。 では,多くはない私自身の経験の中で,どのようにSEMを用いたのかを例示してみたい。第1に,確認的因子分析である。特に,複数の国を対象とした調査において,国をまたいでおおよそ同じ因子構造が見られるかどうかを多母集団解析で検討したことがある。この場合,測定不変性(measurement invariance)について検討することになる。そこには,因子と観測変数の配置が群間で等しいこと(configural invariance),因子負荷量が群間で等しいこと(metric invariance),観測変数の切片が群間で等しいこと(scalar invariance),観測変数の誤差分散が群間で等しいこと(residual invariance)という複数のレベルがあり,どのレベルまで満たされるかを検討することになる。第2に,縦断データの分析である。その中の1つは交差遅延効果モデル,もう1つは潜在成長曲線モデルである。縦断的なデータを分析する際に,SEMはその有用性を発揮するように思われる。 本報告では,査読経験と論文執筆経験の両面から,SEMの使用方法について考えてみたい。自身の研究におけるSEMの適用を振り返って鈴木雅之 発表者がSEMを適用した研究の多くは,大学院生時代に行われたものである。発表者が修士課程に入学した2008年の前後には,SEMを用いた研究が多くみられ,学部の授業ではSEMについて詳しく学ぶ機会がなかったことから,当時の発表者にとってSEMは最先端の分析手法であり,その可視性の高さから非常に魅力的なものにみえた。当時の自身の研究を振り返ってみると,「SEMを使ってみたい」という気持ちが先行しており,SEMのメリットを十分に活かした研究はできていなかったというのが,正直なところである。 発表者は大学院生時代,テストが学習動機づけや学習方略の使用に与える影響に関心を寄せていた。テストについては,内発的動機づけの低下や,目先のテストを乗り越えることだけを目的とした低次の学習が助長されるなど,その否定的な側面が強調されることが多い(e.g., Gipps, 1994)。一方で,テストが一種のペースメーカーとなることで計画的な学習が促進されたり,テストによる達成度の把握や学習改善が促進されたりするなど,テストには肯定的な側面もあることが示されてきた(e.g., Hong & Peng, 2008)。このように,テストの影響というのは一様ではなく,個人差がある。 テストの影響の個人差を説明する要因の1つとして,テストに対する学習者の認識(テスト観)に焦点が当てられてきた(e.g., Struyven et al., 2005)。つまり,あるテストが実施されることで学習者が受ける影響は,学習者がそのテストをどう捉えたかによって異なることが示唆されてきた。発表者は,テスト観が学習動機づけや学習方略の使用とどのような関連を持つかについて,質問紙調査や実験授業を行い,分析手法の1つとしてSEMを適用することで検討してきた。たとえば鈴木(2011)は,評価基準と学習改善のための指針を明確にしたフィードバックが学習動機づけと学習方略の使用に与える影響を,テスト観が媒介している可能性について検討した。また鈴木他(2015)は,縦断調査を行い,学習動機づけの変化とテスト観の関係について検討した。 本発表では,自戒の意味も込めて,これら一連の研究におけるSEMの適用を振り返りながら,SEMの適用方法について議論していきたい。
著者
上田 卓司 安田 孝 椎名 乾平
出版者
日本認知心理学会
雑誌
日本認知心理学会発表論文集 日本認知心理学会第12回大会
巻号頁・発行日
pp.146, 2014 (Released:2014-10-05)

McWeeny, et al. (1987) によって発見された Baker-baker パラドックスは,同じ名でも職業名として憶えるより名字として憶える方が顔との対連合記憶成績が低下する,という現象であり,しばしば固有名の記憶の難しさを示すものとして扱われている.本研究では,文化的背景や名前の多様性等の条件が異なる日本語圏において同様の現象が生起するかを確認するため,人物属性(座右の銘・お気に入りの物事)を表す名詞を用いて,日本語版 Baker-baker パラドックスが見られるか検討することを目的とした.実験において40名の参加者は,印象評定,偶発再生,意図的再生の各課題で顔写真とともに記された人物プロフィール(氏名,人物属性)を学習し,顔写真を手がかりとした再生を行った.その結果,名詞を人物名として記憶する場合と,人物属性を表す名詞として記憶する場合とに顕著な差は認められなかった.
著者
椎名 乾平
出版者
心理学評論刊行会
雑誌
心理学評論 (ISSN:03861058)
巻号頁・発行日
vol.65, no.1, pp.20-51, 2022 (Released:2023-09-30)
参考文献数
209

Rating scales are by far the most popular psychological measure and their use extends beyond psychological studies. However, their origins are curiously obscure, and their working mechanism is not well-known. Therefore, their safety as a research tool is a concern. The aim of this study was to make a comprehensive historical search into the genesis of the rating scale in its original context and to thereby understand the hidden operational principles of rating processes. Many examples existed before the Likert study (1932) and were used in the studies of Galton and Pearson and in studies on aesthetics (Roger de Piles), educational evaluation (Rugg), industrial psychology (W. D. Scott), and psychophysics (Beaufort), but without a strong mutual connection. This paper argues that, when evaluated on a time axis, the rating scales are self-generated in fits and starts, which may indicate that the root of rating scales lies in the numerical cognition and production of mankind.
著者
上田 卓司 椎名 乾平 浅川 伸一
出版者
心理学評論刊行会
雑誌
心理学評論 (ISSN:03861058)
巻号頁・発行日
vol.46, no.2, pp.249-273, 2003 (Released:2019-04-12)
被引用文献数
3
著者
椎名 乾平
出版者
公益社団法人 日本心理学会
雑誌
心理学研究 (ISSN:00215236)
巻号頁・発行日
vol.56, no.3, pp.146-152, 1985-08-30 (Released:2010-07-16)
参考文献数
14
被引用文献数
2 1

In order to approximate the variety of natural categories, two kinds of stimuli whose attributes vary according to different multivariate normal distributions are generated on CRT screen. Twenty undergraduate and graduate students served as subjects. Subject's task was to discriminate the stimuli. Results revealed that subject's performance can be explained very well by the parameters of the distributions (Exp. 1). Although in previous studies prototypes have been assumed to be the mean value or central tendency of category instances, there is another possibility, especially when two or more concepts are simultaneously learned, that they have attributes which are emphasized. This hypothesis was confirmed in Exp. 2, using 30 undergraduates as subjects. It was argued that we must distinguish at least two kinds of prototypes: the one formed by the most frequent instances and the other the most discriminate in contrast with the other concepts.
著者
椎名 乾平
出版者
日本基礎心理学会
雑誌
基礎心理学研究 (ISSN:02877651)
巻号頁・発行日
vol.10, no.1, pp.15-32, 1991-10-31 (Released:2016-11-12)
被引用文献数
1

Why do we utilize artificial categories in investigating concepts and categories? No clear answer has been given to this question. Then, how can we claim the validity of artificial categories? This paper makes logical, set theoretical, and psychological consideration around this theme. The major conclusions are: 1) Artificial categories (concepts) should be homomorphic images of existent categories (concepts). 2) Some functional (or abstract) concepts cannot be represented by sets of artificial stimuli; this means artificial categories are not all-purpose tools. 3) As for the types of categories and concepts which can be represented by sets, a) intension and extension, b) the number of instances, and c) modes of uncertainty both in intension and extension, are problems of critical importance. In particular, we must make explicit representational formats for the processing of uncertainty and logical structures inherent in concepts and categories. Finally, 4) people can handle conceptual information in completely differently ways: they are sometimes naive statisticians, sometimes naive scientists, according to the task demands and the data available to them.