首页    期刊浏览 2024年11月15日 星期五
登录注册

文章基本信息

  • 标题:Análisis de la fertilidad por medio de técnicas de minería datos
  • 本地全文:下载
  • 作者:Omar Danilo Castrillón ; Jaime Antero Arango ; Luis Fernando Castillo
  • 期刊名称:Información tecnológica
  • 印刷版ISSN:0716-8756
  • 电子版ISSN:0718-0764
  • 出版年度:2022
  • 卷号:33
  • 期号:3
  • 页码:1-10
  • DOI:10.4067/S0718-07642022000300203
  • 语种:Spanish
  • 出版社:Centro de Información Tecnológica
  • 摘要:El objetivo de esta investigación es predecir las variables más importantes que afectan la fertilidad en una persona. Se utiliza la plataforma de aprendizaje automático y minería de datos Weka. Se emplean los algoritmos de Clusters EM, SimpleKMeans y J48, que es de comportamiento similar a un algoritmo Bayesiano. Inicialmente se modela una base de datos existente, hasta ajustar 105 registros y 9 variables, 8 de ellas independientes (edad, enfermedades, accidentes, cirugía, fiebre, alcohol, fumador y sedentarismo) y una dependiente (fertilidad). Como resultado se identifican las 5 variables más influyentes en este proceso: 1) edad, 2) accidente, 3) fiebre, 4) cirugía y 5) alcohol. Se logra un porcentaje de éxito superior al 90% cuando se emplea una validación cruzada 80% - 20%. Se concluye que las técnicas de árboles de decisión y clúster empleadas en este estudio permiten establecer de forma clara las variables más importantes en los procesos de fertilidad de una persona.
  • 其他摘要:The primary objective of this research study is to predict the most important variables that affect fertility in a person. The study is conducted by using the automatic learning and data mining platform Weka, the expectation maximization (EM) clustering algorithm, SimpleKMeans, and the classification algorithm J48, which behaves similarly to a Bayesian algorithm. Initially, an existing database is modeled until 105 records and nine variables are reached, eight independent variables (age, illnesses, accidents, surgeries, fever, alcohol, smoker, and sedentary lifestyle) and one dependent variable (fertility). The results revealed the five most influential variables: 1) age, 2) accidents, 3) fever, 4) surgery, and 5) alcohol. The success rate is over 90% when a cross-validation 80% - 20% is applied. It is concluded that the random forest and clustering algorithms employed here allow to clearly determine the most important variables that affect fertility in a person.
  • 关键词:minería;datos;Bayesiano;Weka;fertilidad;algoritmo J48
  • 其他关键词:strawberries;gellan gum;predictive microbiology;Huang model;edible coating
国家哲学社会科学文献中心版权所有