著者
斉田 智里
出版者
横浜国立大学
雑誌
基盤研究(C)
巻号頁・発行日
2010

大学入試センター試験への英語リスニングテスト導入による高大英語教育への波及効果の解明に取組んだ。リスニングテストの内容はCEFR(ヨーロッパ言語共通参照枠)のA2からB1レベルの能力記述文に相当すること、関東地方にある一国立大学入学者全員の大学入学時のリスニング得点の平均値は、リスニングテスト導入前に比べて導入後は若干上昇傾向にあること、リスニング力の伸びを実感している学生の割合は7割程度と高く、音声に意識を向けて英語学習に取組む習慣が身についたなど、プラスの波及効果が認められること、一方、高校英語授業においては、テスト対策が主であり、教員の指導法そのものに変化をもたらすほどの顕著な波及効果は認められなかったこと、などが明らかとなった。
著者
斉田 智里 小林 邦彦 野口 裕之
出版者
茨城大学
雑誌
基盤研究(C)
巻号頁・発行日
2006

英語教育の効果を測定・評価するために、項目応答理論(IRT)と構造方程式モデリング(SEM)の使用が有用であることを実証的に示すことができた。IRTを用いた大規模テストで高校生や大学生の英語力を測定し、英語力の大きさや変化の要因をSEMを用いて検討した。その結果,学習指導要領の変遷や入試科目の変更、大学英語教育カリキュラムの変更が、高校生や大学生の英語力に大きな影響を及ぼしていることが示された。言語プログラムにおける教育評価情報の収集・分析・評価のシステムを構築した。
著者
斉田 智里
出版者
日本言語テスト学会
雑誌
日本言語テスト学会研究紀要
巻号頁・発行日
no.10, pp.119-133, 2007-10-01

This research addressed the comparison of concurrent calibration between a polytomous IRT model and a dichotomous IRT model using English achievement test data. Two forms of English achievement tests for senior high school students were composed of testlets (groups of items) to eliminate the effect of the dependence among within-testlet items. The two forms were equated with common testlets through a polytomous IRT model. The testlet parameter estimates and the category characteristic curves were analyzed on a common scale. The result showed that one form was more difficult than the other, as test designers had intended. The mean of the ability parameter estimates of the more difficult form was higher than that of the easier form. These findings yielded useful feedback for test designers. Item parameter estimates of independent dichotomous items, ability parameter estimates and the amount of test information derived by concurrent calibration under the graded response model (polytomous IRT model) and the two-parameter logistic model (dichotomous IRT model) were compared. The results showed similar parameter estimates for the two IRT models. The standard errors of ability parameter estimates for both models also were highly correlated. The two-parameter logistic model provided a greater amount of test information than the graded response model.