· charlas · 1 min read

Eigenvalue Clipping and PCA in Unsupervised Feature Selection

Cuando desarrollamos modelos de prevención de fraude de pagos con tarjeta de crédito, nos enfrentamos a conjuntos de datos enormes con miles de variables. Además, la relación entre características y la variable objetivo, puede no ser estacionaria, siendo un desafío mantener la capacidad predictiva y a su vez evitar los errores de sobreajuste.

Sin embargo, la relación entre las variables es casi estacionaria. Por lo tanto, podríamos descartar información redundante mediante la comparación entre variables. Para ello tenemos en cuenta la señal contenida en cada variable y descartamos el ruido que puede llevar a malos resultados. En esta charla discutiremos un método que tiene en cuenta ambos componentes: eigenvalue clipping with PCA.

Back to Blog