期刊名称:Journal of Measurement and Evaluation in Education and Psychology
电子版ISSN:1309-6575
出版年度:2012
卷号:3
期号:2
页码:291-296
语种:Turkish
出版社:EPODDER
摘要:Bu araştırmada,performansa dayalı durum belirlemeden elde edilen ölçümlere Genellenebilirlik Kuramı’nda karışık desen uygulanmış ve dört facetli desende Genellenebilirlik ve Karar çalışmaları yürütülmüştür.Araştırma verileri 2011- 2012 bahar döneminde Kütahya ilinde bir ilköğretim okulunda 6-7-8.sınıf 132 öğrenciyle gerçekleştirilen performansa dayalı durum belirleme uygulamasından rastgele seçilen 90 öğrencinin sergiledikleri performansların dört puanlayıcı tarafından yanıt tanıma kodları ve göreve özgü analitik dereceli puanlama anahtarı kullanarak puanlanmasından elde edilmiştir.Araştırma sonucunda,ölçmenin nesnesi olan bireyin en fazla toplam varyansı açıklama yüzdesine sahip olduğu,sınıf düzeyinin önemsenmeyecek düzeyde değişkenlik kaynağı olduğu,bunun yanında farklı sınıflardaki bireylerin puanlarının puanlayıcıdan puanlayıcıya kısmen değişebileceği görülmüştür.Yapılan Karar çalışması sonucunda ise G katsayısının 0.911,phi katsayısının ise 0.898 olduğu ve puanlayıcı sayısını arttırıp azaltmanın;görev sayısını arttırıp azaltmaya oranla daha fazla ölçümün güvenirliğine etkisi olduğu bulunmuştur.
其他摘要:In this research has been used mixed design in Generalizability Theory in performance assessment applications’ scores and has been made Generalizability and Decision Study for analyzing reliability of the scores.Research data has collected the 132 second tier students randomly selected 90 studens at a primary school in Kütahya in 2011-2012 spring term.According to the results of the study,person which is subject of measurement has the highest the percentage of total variance description,has seen insignificant as a source of variability in the level of class,as well as the scores of different classes can change partly seen from scorer to scorer.As a result of the Decision Study has been 0.911 G coefficient,phi coefficient that the 0.898,and increase or decrease the number of raters,increasing the number of tasks to reduce the effect was more than the reliability of the measurement.