标题:Group Comparisons for Regression Models with Binary Dependent Variables – Problems and Pitfalls Illustrated by Differences in Educational Opportunities between Cohorts
摘要:This research note refers to a known, but rarely noticed problem which arises when coefficients from regression models with binary dependent variables are compared over groups like cohorts or social classes. In order to attain valid and viable comparisons of coefficients and odds ratios (OR) from logit and probit models between groups, it has to be assumed that the unobserved heterogeneity is equal for all these groups. This is obviously an unrealistic assumption if data stem from different cohorts or if estimations are based on data from different countries and samples. Therefore, we propose for group comparisons the use of average marginal effects instead of OR. Moreover, we suggest a method of testing group differences in such models for statistical significance. Using the example of comparing educational opportunities over different birth cohorts, we illustrate that considering the problem of unobserved heterogeneity leads to significantly different conclusions.↓Die vorliegende Forschungsnotiz verweist auf eine bekannte, aber selten beachtete Problematik bei Vergleichen von Koeffizienten aus Regressionen mit binären abhängigen Variablen zwischen Gruppen. Damit Vergleiche von Logit- und Probit-Koeffizienten sowie Odds-Ratios (OR) über Gruppen oder Kohorten hinweg tragfähig sind, muss angenommen werden, dass die unbeobachtete Heterogenität in allen betrachteten Gruppen gleich ist. Dies ist zumindest bei Vergleichen von Kohorten oder Schätzungen, die Datensätze aus unterschiedlichen Ländern oder Erhebungsdesigns nutzen, eine sehr unrealistische Annahme. Wir schlagen daher vor, statt der OR die durchschnittlichen Marginaleffekte für Gruppenvergleiche heranzuziehen. Weiterhin verweisen wir auf eine Möglichkeit, Gruppenunterschiede in solchen Modellen auf statistische Signifikanz zu prüfen. Anhand des Beispiels von Bildungschancen im Kohortenvergleich lässt sich veranschaulichen, dass bei Beachtung der Problematik unbeobachteter Heterogenität wichtige Schlussfolgerungen anders ausfallen.