期刊名称:Journal of Measurement and Evaluation in Education and Psychology
电子版ISSN:1309-6575
出版年度:2018
卷号:9
期号:4
页码:326-338
DOI:10.21031/epod.394659
语种:English
出版社:EPODDER
摘要:This study examined the effect of the structure of a common item set (only dichotomous common items – mixed-format common item sets),parameter estimation methods and scale shrinkage on vertical scaling results when multidimensional datasets were used within the context of Common Item Nonequivalent Group (CINEG) design.Interactions between these variables were also investigated.The study was performed using simulated data.Measurement error and bias indexes were used to evaluate the quality of vertical scaling.All the procedures used in the data analysis were replicated 50 times to increase the generalizability of the results.R program was used for the data generation,calibration of the parameters and vertical scaling procedures.Possible interactions were investigated with factorial analysis of variance by using SPSS.The results showed a consistent effect of the common item format in all conditions.In addition,some interactions between the variables were observed.These findings are discussed.
其他摘要:Testlerden elde edilen puanlar birçok başlık altında alınan önemli kararlar için temel bilgi kaynakları arasındadır.Alınacak önemli kararlardan bağımsız olarak,test puanlarının mümkün olan en kesin bilgiyi sunması gerekmektedir.Daha kesin bilgi daha iyi kararların alınabilmesi için önemlidir.Bununla birlikte uygulamada test güvenliği ve öğrenci gelişiminin takip edilebilmesi gibi birtakım gerekçeler yüzünden aynı testin farklı formları kullanılmakta veya farklı zamanlarda uygulanan testlerde ortak maddeler kullanılarak testler ölçeklenmektedir.Farklı formlardan elde edilen puanlar daha sonrasında eşitlenmekte ya da ölçeklenmektedir.Bu işlemin hatasız olması gerçekleştirilen sınavların daha adil olması ve öğrencilerin geleceği ile ilgili doğru kararlar verebilmek için önemlidir.Buna göre,puanları önemli kararlar için kullanılan testlere uygulanan dikey ölçekleme yöntemlerinin psikometrik olarak savunulabilir olması önemlidir.Bu sebepten dolayı ölçekleme gerçekleştirilirken uygulayıcıların kararlarını dayandıracakları kuramsal çalışmalar büyük önem taşımaktadır.Bu sebepten dolayı farklı yöntemlerin karşılaştırılması ve farklı durumlar için en az hata veren yöntemlerin belirlenmesi gerekmektedir.İki kategorili ve çok kategorili olarak puanlanan maddelerin birlikte yer aldığı karma format testlerin kullanımı gün geçtikçe artmaktadır.Benzer şekilde,büyük ölçekli ve öğrencilerle ilgili önemli kararlarn alındığı test uygulamalarında birden fazla formunun kullanımı da benzer şekilde yaygınlaşma eğilimindedir.Farklı test formlarından elde edilen puanların karşılaştırılabilir olabilmesi için bu formlar arasında fonksiyonel bir bağ oluşturulması gerekmektedir.Eğer kurulan bu bağ farklı sınıf (ya da test güçlüğü farklılaşan) formlar arasında gerçekleştirilirse,bu işlem dikey ölçekleme olarak adlandırılmaktadır.Dikey ölçeklemede farklı test formları birbirlerine bağlandığı için eşitleme ile benzerdir.Fakat test formları içerik ve güçlük olarak farklıdır çünkü formlar sınıflar arası ya da yaşa bağlı olarak ilerlemeyi yansıtmaktadırlar.Bundan dolayı,dikey ölçekleme farklı test formlarının karşılaştırılması için kullanılmakla birlikte her bir seviyedeki puanlar birbirlerinin yerine kullanılamazlar.Test ölçeklemesinde temel amaç farklı seviyelerdeki puanların karşılaştırılmasıdır.Seviye farklılığı bir öğrencinin bulunduğu sınıf,eğitim öğretim yılının bulunduğu aşama ya da yaştan kaynaklanabilir.Dikey ölçekleme genellikle aynı bireylerin farklı seviyelerde elde ettikleri puanların farklı zamanlara göre karşılaştırılabilmesi için kullanılmaktadır.Bu tür desenler ise DOGOM (Denk Olmayan Gruplarda Ortak Madde) deseni olarak adlandırılmaktadır.Bu çalışma kapsamında karma format maddelerden oluşan boyutlu testler DOGOM deseni kullanılarak ölçeklendiğinde ortak madde setinin yapısı (yalnızca iki kategorili maddelerden oluşan ortak madde seti - iki ve çok kategorili maddelerin yer aldığı ortak madde seti),yetenek daralması (üst yetenek grubunda yetenek varyansının daralması - varyansın eşit kalması) ve parametre kestirim yöntemlerinin (EM - MHRM) ölçekleme sonuçları üzerindeki etkisi incelenmiştir.Ayrıca bu koşulların etkileşim içinde olup olmadığına bakılmıştır.