Saber
versão impressa ISSN 1315-0162
Resumo
MARCANO, Luis e FERMIN, Wilmer. Comparación de métodos de detección de datos anómalos multivariantes mediante un estudio de simulación. Saber [online]. 2013, vol.25, n.2, pp.193-201. ISSN 1315-0162.
Los valores anómalos son un problema omnipresente en la recolección de datos, son observaciones que se desvían en alguna dirección respecto al comportamiento general del resto del conjunto de datos y pueden afectar los resultados de aplicar métodos estadísticos univariantes o multivariantes. Es fundamental la detección de estos valores, ya sea para eliminarlos o para atenuar sus efectos en el análisis. Se han desarrollado varios métodos para la detección de valores anómalos, entre ellos están la Distancia Robusta de Mahalanobis (DRM) de Rousseeuw y Van Zomeren (1990), la Curtosis-1 de Peña y Prieto (2001) y el método FGR de Filzmoser, Garrett y Reimann (2005). En este artículo se compararon estos tres métodos, en cinco escenarios de correlación considerando variables explicativas con varios porcentajes de anómalos, mediante análisis comparativo de aplicar estos métodos en datos simulados. Los resultados evidencian que la Curtosis-1 es más eficiente que la DRM y el método FGR para la detección de valores anómalos multivariantes, independientemente de la proporción de éstos y la presencia de correlación entre las variables consideradas en el estudio.
Palavras-chave : Valores anómalos multivariantes; detección; comparación; simulación.