著者
沖 嘉訓 前川 眞一
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.44, no.1, pp.57-72, 2017 (Released:2017-12-01)
参考文献数
23

Equating or linking, which calibrate the parameters of two or more tests, are critical to the application of IRT, because they allow for comparisons between test scores. Common item design or common person design is often used for equating. In Multidimensional item response theory model (MIRT), there is a case that both common item design and common person design are available. However, few studies about the equating process corresponding to such a case has not been conducted. The present study proposes the integration of common item and common person criteria and analyzes the characteristics of the method through computer simulations. The results of the simulations reveal the proposed method is effective when one must take both criterion into consideration.
著者
深町 珠由 伊藤 由香 中川 正宣 前川 眞一
出版者
日本グループ・ダイナミックス学会
雑誌
実験社会心理学研究 (ISSN:03877973)
巻号頁・発行日
vol.43, no.2, pp.123-139, 2004 (Released:2004-04-16)
参考文献数
22

従来の相互作用論におけるパーソナリティは質問紙法で測定され,動態的相互作用という時系列変化過程を測定していなかった。本研究は,コンピュータ制御による相手との相互作用過程から動態的個人特性を測定し,従来の質問紙法による静態的指標と比較した。課題では,コンピュータ内の相手が反省エネ行動を繰り返し行う中で,被験者に省エネ行動と相手との友好関係維持という二律背反の目標を与えた。対人協調・非協調行動と対人友好感情評定値の時系列変化を測定し,この2変数相関を個人で求めて動態的個人特性とみなし,得点から高・低群に分類し,各群の代表的時系列特徴を主成分分析で求めた。実験条件には,相手が反省エネ行動を反復することを共通として,相手の攻撃的口調条件と非攻撃的口調条件とを設定した。結果として,対人友好感情評定値の時系列変化が動態的特性の高・低群と各実験条件とで変化傾向が異なり,相手の表面上の口調の影響と,口調と反復される反省エネ行動との一致感の認知の影響を受け,それが時間経過で変化する傾向が示された。動態的指標と静態的指標とを比較したところ,実験条件を通じて一貫した相関は確認されず,動態的指標が質問紙法で測定できない独自の個人特性を表現している点が示された。今後も動態的相互作用に基づく個人特性の測定研究が多くなされる必要がある。
著者
沖 嘉訓 前川 眞一
出版者
日本行動計量学会
雑誌
行動計量学 (ISSN:03855481)
巻号頁・発行日
vol.42, no.2, pp.117-128, 2015 (Released:2016-07-01)
参考文献数
37
被引用文献数
1

Multidimensional item response theory model (MIRT) is a sub-model of Item Response Theory (IRT). It assumes that multidimensional latent traits influence test item responses. Equating or linking, which calibrate the parameters of two or more tests, are critical to the application of IRT, because they allow for comparisons between test scores. However, little research has been conducted for MIRT equating, especially on the common examinee design. The present study describes three equating methods for MIRT, which utilizes rotation methods in factor analysis focusing on factor scores, by employing the common examinee design, and analyzes the characteristics of each method through computer simulations. The results of the simulations reveal that the Weighted Procrustes method is effective when correlations between equated scores of each dimension are expected to approximate the target ones.
著者
中村 知靖 前川 眞一
出版者
一般社団法人 日本教育心理学会
雑誌
教育心理学研究 (ISSN:00215015)
巻号頁・発行日
vol.41, no.1, pp.22-30, 1993-03-30 (Released:2013-02-19)
参考文献数
24

According to the Thurstonean point of view, a usual two-parameter normal ogive model can be derived as a special case of the Law of Categorical Judgement, where all subjects have common dispersion parameter. The generalized item response (GIRT) model, first proposed by Torgerson (1958), is an extension of the IRT model, in which each subject is characterized not only by the ability parameter (θ) but also by the dispersion parameter (Φ). For a subject characterized by (θ, Φ), the probability that he/she answers the item correctly is given by Pr (U=1|θ, Φ) =φ ((θ-b)), where φ is the standard normal or logistic distribution function and (a, b) constitutes the set of usual item parameters. In this article, an item parameter estimation method maximizing the marginal likelihood where the subject parameters (θ, Φ) are integrated out, is presented.
著者
仁田 善雄 前川 眞一 柳本 武美 前田 忠彦 吉田 素文 奈良 信雄 石田 達樹 福島 統 齋藤 宣彦 福田 康一郎 高久 史麿 麻生 武志
出版者
日本医学教育学会
雑誌
医学教育 (ISSN:03869644)
巻号頁・発行日
vol.36, no.1, pp.3-9, 2005-02-25 (Released:2011-02-07)
参考文献数
6
被引用文献数
2

共用試験CBTにおける項目反応理論の有用性を評価するために, 2002年の2-7月に実施した医学系第1回トライアルのデータを解析した. このトライアルはモデル・コア・カリキュラムの大項目分類 (6分野) をすべてカバーできるようにデザインされており, 含まれている試験問題数は2, 791題であった.各分野において, 3-40題の問題がランダムに抽出され, コンピューターシステムを用いて5, 693名 (4年生-6年生: 解析対象者5, 676名) の学生に実施された. 各学生には100題出題された. 項目反応パターンについては3母数ロジスティックモデル (項目識別力, 項目困難度, 当て推量) により分析した. 以下の知見が得られた. 1) 項目困難度と正答率には強い負の相関がみられた (r=-0.969--0.982). 2) 項目識別度と点双列相関係数には中程度の相関がみられた (r=0.304-0.511). 3) 推定された能力値と得点とには強い正の相関が見られた (r=0.810-0.945). 4) 平均能力値は学年が上がるにつれて増加した. 5) モデル・コア・カリキュラムの6分野間の能力値の相関係数は0.6未満であった. 1人ひとりが異なる問題を受験する共用試験の場合, 項目反応理論を使用することが望ましいと考える. 第1回トライアルは, 項目反応理論を使用することを想定してデザインされていなかった. 第2回トライアルでは, これらの比較を行うために適切にデザインされたシステムを用いた. 現在, この結果について詳細に解析を行っているところである.
著者
高橋 恵利子 畑佐 由紀子 山元 啓史 前川 眞一 畑佐 一味
雑誌
じんもんこん2015論文集
巻号頁・発行日
vol.2015, pp.59-64, 2015-12-12

本研究は日本語学習者の発音の自動評価システムの開発を目的としている.そのための基礎調査と して,中国人日本語学習者の音声データと,それに対する母語話者の一対比較評価データから,課題 文及び評価方法の妥当性について検討した. 評価者の属性に関わらず母語話者の評価はほぼ一致して いたことから,一対比較による評価方法を用いれば,評価者の属性に関わらず,妥当な評価値が得ら れる可能性が指摘できる.今後,さらに評価対象とする音声データを増やして今回の結果を検証する 必要がある.また,一対比較による膨大な評価作業における評価者の負担を軽減するため,一般母語 話者を対象としたクラウドソーシングを採用することの意義と課題について言及する.
著者
高橋 恵利子 畑佐 由紀子 山元 啓史 前川 眞一 畑佐 一味
雑誌
研究報告人文科学とコンピュータ(CH) (ISSN:21888957)
巻号頁・発行日
vol.2015-CH-107, no.5, pp.1-4, 2015-08-02

本研究の目的は,外国人日本語学習者の発音能力を簡易に診断するシステムを開発することである.その目的を達成するためにはさまざまな問題があるが,本稿では音声データの収集形式の問題と評価者の問題を取り上げる.音声データの収集方法としては,短文を読み上げ,それを録音する方法 (読み上げ課題) と,同じ短文をあらかじめ録音したものを聞いて発音したものを録音する方法 (リピート課題) の 2 つを検討する.録音の評価者は,全員日本語母語話者 (日本語教師,日本語教育未経験者) とし,これらの条件で,6 名 (母語話者 2 名,ほぼネイティブ水準の発音技能を持つ者 2 名,顕著な外国人訛りを持つ者 2 名) の音声提供者の録音資料を用い,一対比較法による評価実験を行った.実験の結果,データの収集方法については,いずれの方法によっても 0.86 以上の相関係数が得られたが,リピート課題 (0.86 以上) よりも読み上げ課題 (0.92 以上) の方が,若干高かった.これにより,今後のシステム設計計画では,一般の母語話者を評価者とし,あらかじめ音声材料を準備する必要のない読み上げ課題によるデータ収集方式を採用することにした.
著者
杉野 直樹 斎藤 栄二 高橋 貞雄 清水 裕子 根岸 雅史 野澤 健 石塚 智一 内田 照久 前川 眞一
出版者
全国英語教育学会
雑誌
ARELE : annual review of English language education in Japan (ISSN:13448560)
巻号頁・発行日
vol.14, pp.221-230, 2003-03

The present study aims at explicating the influence of test taking strategies on the test item reliability in English language proficiency tests. Widely known test taking strategies include starting with a certain section that might require more time than others to answer so that test takers can allocate more of their time allowance on it, or, especially in multiple-choice format, marking an alternative based on wild guessing. Also widely speculated is that, in the Daigaku Nyushi Center English test (DNC test, henceforth), those test takers who find themselves running out of time are forced to rely on wild guessing in answering test items. Some English language proficiency tests, such as TOEFL or TOEIC, strictly instruct test takers to tackle a specific section so that they cannot use the first strategy, however, many of the entrance examinations administered in Japan do not have such restrictions. In order to examine the influence of these two test taking strategies, viz. the 'answering order' strategy and the 'wild guessing' strategy, we conducted a large-scale survey using two parallel tests with different question/answering orders. Our analysis of the data with simulated wild guessing shows that wild guessing would deteriorate the test item reliability. Furthermore, it shows that those test takers who had more time to answer the same section seem to be using the wild guessing strategy anyway, which has significant implications on the test format itself.