首页    期刊浏览 2024年11月30日 星期六
登录注册

文章基本信息

  • 标题:Nested and Repeated Cross Validation for Classification Model With High-Dimensional Data
  • 本地全文:下载
  • 作者:Yi Zhong ; Jianghua He ; Prabhakar Chalise
  • 期刊名称:Revista Colombiana de Estadística
  • 印刷版ISSN:2389-8976
  • 出版年度:2020
  • 卷号:43
  • 期号:1
  • 页码:103-125
  • DOI:10.15446/rce.v43n1.80000
  • 出版社:Universidad Nacional de Colombia, sede Bogotá
  • 摘要:Con la llegada de las tecnologías de alto rendimiento, los conjuntos de datos de alta dimensión están cada vez más disponibles. Esto no sólo ha abierto una nueva visión acerca de los sistemas biológicos, sino que también plantea desafíos analíticos. Un problema importante es la selección de subconjuntos de variables y la predicción de resultados futuros. Es crucial que los modelos no sean sobreajustados y que den resultados precisos con nuevos datos. Además, la identificaci ón confiable de variables informativas con alto poder predictivo (selección de características) es de interés en entornos clínicos. Proponemos un procedimiento de dos etapas para la selección de variables y la construcción de modelos de clasificación, el cual utiliza un método de validación cruzada anidada y repetida. Evaluamos nu-estro enfoque utilizando tanto datos simulados como dos conjuntos de datos de expresión génica disponibles públicamente. El método propuesto mostró una precisión predictiva comparativamente mejor para casos nuevos en comparación con el método estándar de validación cruzada..
  • 关键词:Area under ROC curve;Cross;validation;Área bajo la curva ROC;Validación cruzada;Red elástica;Bosque aleatorio;Máquina de vectores de soporte;Area under ROC curve;Cross;validation;Elastic net;Random forest;Support vector machine
国家哲学社会科学文献中心版权所有