摘要:Las técnicas de inteligencia computacional o aprendizaje automático (machine learning) son de actual relevancia para el análisis y estudio de propiedades en compuestos químicos. En particular, para aquellos compuestos que son medicamentos, drogas o candidatos a drogas, resulta de vital importancia contar con técnicas computarizadas que asistan en la predicción de propiedades farmacocinéticas. Una de las técnicas de vigente estudio y aplicación en el área de quimioinformática es QSAR/QSPR (Quantitative Structure Activity/Property Relationships). La misma consiste en el análisis de las relaciones existentes entre la estructura molecular de un compuesto químico y una determinada actividad o propiedad biológica. En este tipo de técnicas un compuesto químico tiene asociado un número de descriptores moleculares, en donde cada descriptor representa una determinada característica del compuesto. Por otra parte, dado que el espacio de posibles compuestos químicos capaces de ser sintetizados es extremadamente grande, las técnicas de análisis de agrupamientos (cluster analysis) resultan ser una herramienta de interés para la mejora en el entendimiento de las relaciones entre estructura y propiedad. El presente trabajo tiene por objetivo analizar y mostrar las ventajas en la incorporación de clustering como parte del proceso de predicción de la hidrofobicidad de un compuesto. Se realizaron distintas alternativas de agrupamiento, procurando que dicha asociación sea de relevancia para la propiedad a modelar. Para la tarea de predicción numérica de la hidrofobicidad, las redes neuronales es la herramienta mayormente usada. Los resultados obtenidos ponen en evidencia las ventajas de la división del conjunto muestral de datos en subconjuntos de menor tamaño, y la utilización de esa división en la tarea de predicción.
其他摘要:Las técnicas de inteligencia computacional o aprendizaje automático (machine learning) son de actual relevancia para el análisis y estudio de propiedades en compuestos químicos. En particular, para aquellos compuestos que son medicamentos, drogas o candidatos a drogas, resulta de vital importancia contar con técnicas computarizadas que asistan en la predicción de propiedades farmacocinéticas. Una de las técnicas de vigente estudio y aplicación en el área de quimioinformática es QSAR/QSPR (Quantitative Structure Activity/Property Relationships). La misma consiste en el análisis de las relaciones existentes entre la estructura molecular de un compuesto químico y una determinada actividad o propiedad biológica. En este tipo de técnicas un compuesto químico tiene asociado un número de descriptores moleculares, en donde cada descriptor representa una determinada característica del compuesto. Por otra parte, dado que el espacio de posibles compuestos químicos capaces de ser sintetizados es extremadamente grande, las técnicas de análisis de agrupamientos (cluster analysis) resultan ser una herramienta de interés para la mejora en el entendimiento de las relaciones entre estructura y propiedad. El presente trabajo tiene por objetivo analizar y mostrar las ventajas en la incorporación de clustering como parte del proceso de predicción de la hidrofobicidad de un compuesto. Se realizaron distintas alternativas de agrupamiento, procurando que dicha asociación sea de relevancia para la propiedad a modelar. Para la tarea de predicción numérica de la hidrofobicidad, las redes neuronales es la herramienta mayormente usada. Los resultados obtenidos ponen en evidencia las ventajas de la división del conjunto muestral de datos en subconjuntos de menor tamaño, y la utilización de esa división en la tarea de predicción.