摘要:Un estudio de simulacion de medidas de acuerdo entre observadores para tablas de contingencia 2x2. Mediante un estudio de simulacion se aborda una comparacion entre seis medidas obtenidas usando tres enfoques diferentes para la evaluacion del acuerdo. Los coeficientes de acuerdo elegidos fueron sigma de Bennet (1954), Pi de Scott (1955), Kappa de Cohen (1960) y gamma de Gwet (2001; 2008) para representar el enfoque clasico descriptivo, el coeficiente alpha de Aickin (1990), para representar el enfoque de los modelos loglineal y mixtura ("mixture models") y la medida delta de Martin and Femia (2004) para representar el enfoque de los test de eleccion multiple. Los resultados obtenidos confirman que los coeficientes Pi y kappa presentan diferencias notables en relacion a los restantes coeficientes particularmente en presencia de valores extremos de prevalencia y sesgo entre observadores. El mejor comportamento fue observado con los coeficientes alpha de Bennet y delta de Martin and Femia para todos los valores de prevalencia y sesgo entre observadores.
其他摘要:A comparison between six rater agreement measures obtained using three different approaches was achieved by means of a simulation study. Rater coefficients suggested by Bennet's sigma (1954), Scott's Pi (1955), Cohen's kappa(1960) and Gwet's gamma (2008) were selected to represent the classical, descriptive approach, ¿¿ agreement parameter from Aickin (1990) to represent loglinear and mixture model approaches and delta measure from Martin and Femia (2004) to represent multiple-choice test. Main results confirm that Pi and kappa descriptive measures present high levels of mean bias in presence of extreme values of prevalence and rater bias but small to null levels with moderate values. The best behavior was observed with Bennet and Martin and Femia agreement measures for all levels of prevalence.