摘要:Se analiza la utilización del algoritmo de clasificación de Ward en conjuntos de datos en los que la información está conformada únicamente por variables binarias o nominales. Se lleva el caso nominal al caso binario mediante una codificación disyuntiva completa y se establecen las matrices de distancias a partir de la distancia ponderada de Manhatan calculada a través de las distancias promedio de Manhatan y de Bray-Curtis. Se estudian todos los casos de dos y tres variables binarias y de dos variables nominales con dos y tres modalidades. Se establece el efecto que sobre los árboles resultantes tiene la asignación apriori de ponderaciones para las variables.
关键词:Estadística;Estadística matemática; Variables binarias; Variables nominales; Algoritmos; Algoritmo de Ward; Distancia ponderada de Manhatan;Estadística matemática; Variables binarias; Variables nominales; Algoritmos