Análisis de Componentes Principales en presencia de datos faltantes: el principio de datos disponibles

Principal Components Analysis in the presence of missing data: the principle of available data

  • Víctor Manuel Gonzalez Rojas Escuela de Estadística. Universidad del Valle, Cali. Colombia https://orcid.org/0000-0002-6526-7879
  • Gabriel Conde Arango Escuela de Estadística. Universidad del Valle, Cali. Colombia
  • Andrés Felipe Ochoa Muñoz Escuela de Estadística. Universidad del Valle, Cali. Colombia https://orcid.org/0000-0002-0003-1347
Palabras clave: ACP, datos faltantes, datos disponibles, NIPALS, relaciones de transición

Resumen

En este trabajo proponemos utilizar el principio de datos disponibles derivado del algoritmo NIPALS (Nonlinear estimation by Iterative Partial Least Square) para trabajar el Análisis de Componentes Principales (ACP) en presencia de datos faltantes. Esta propuesta es importante puesto que no realiza imputación de datos, ni se descartan individuos de la base datos, el método propuesto trabaja con los elementos pares disponibles para conformar las matrices de cuasicorrelación en  y en la descomposición espectral de estas matrices permite a través de las relaciones de transición realizar un ACP convencional. Del estudio de simulación realizado se encontró que a medida que aumenta el porcentaje de datos faltantes disminuye la inercia explicada en el primer plano factorial. Se desarrolló el algoritmo de solución bajo el entorno de programación R y se anexa el código para uso libre.

Descargas

La descarga de datos todavía no está disponible.
Publicado
2021-06-30
Cómo citar
Gonzalez Rojas, V., Conde Arango, G., & Ochoa Muñoz, A. (2021). Análisis de Componentes Principales en presencia de datos faltantes: el principio de datos disponibles. Scientia Et Technica, 26(2), 219-228. https://doi.org/10.22517/23447214.20591
Sección
Ciencias Básicas