摘要:En este trabajo se presenta una nueva técnica para definir las fronteras en el proceso de discretización de una variable continua. Este método es usado como paso previo en un problema de regresión, considerado como un problema de aprendizaje en el cual la variable de salida puede ser cuantitativa (continua o discreta) o cualitativa definida sobre una escala ordinal. El método propuesto enfatiza el concepto de localidad para determinar las fronteras de las discretización. En el caso de variables continuas, el método se basa en la maximización de la diferencia entre distribuciones usando distancias intercalares, y en el caso de salidas cualitativas, en una distancia definida sobre una estructura de órdenes de magnitud absolutos. La principal característica del método se ilustra con tres ejemplos, dos para salidas continuas y un último con salidas cualitativas.
其他摘要:In this work, a new technique to define cut-points in the discretization process of a continuous attribute is presented. This method is used as a prior step in a regression problem, considered as a learning problem in which the output variable can be either quantitative (continuous or discreet) or qualitative defined over an ordinal scale. The proposed method emphasizes the concept of location to determine discretization cut-points. In the case of continuous outputs, the method is based on the maximization of the difference between distributions by using intervalar distances. In the case of qualitative outputs, a qualitative distance is defined over a structure of absolute orders of magnitude. The main characteristics of the method presented are illustrated through three examples, two for continuous outputs and the last for a qualitative output.