Los viejos rockeros nunca mueren

Author

José Luis Cañadas Reche

Published

October 15, 2020

En todo este mundo de la analítica de datos las modas van y vienen, pero la sensatez y el buen hacer siempre vuelven. Y vuelven porque son útiles, porque aportan valor y porque ¡qué demonios! ya está bien de postureo big datero de dibujitos de animales.

Esta entrada viene a colación de lo que me cuenta un ex compañero de curro y sin embargo amigo, que hacen en su nueva empresa. Y la mayoría de lo que hacen son cosas sensatas. Contrastes de hipótesis, modelos lineales (que es un marco más general que los contrastes de hipótesis), modelos multinivel, modelos de supervivencia, etc.

A todos nos seduce la idea de lanzar un modelo de deep lenin (cómo dice otro amigo) o la última variación de un xgboost con no se cuánta profundidad y con búsqueda vía randomsearch de los mejores “hiperparámetros” y ganar un punto de AUC (alguno una vez dijo que pasar de 0.78 a 0.79 era un millón de euros de beneficio, en fin) . Pero para cualquiera que lleve un tiempo razonable en estos lares sabe que es más importante tener datos limpios, actualizados y veraces.

Y para terminar, una lista de técnicas que siempre me han gustado, no necesariamente en orden.

En fin, esta entrada va dedicada a mi amigo Sergio Calderón que creo que va a aprender un montón de cosas y no sólo a tirar árboles vía la última librería disponible en x lenguaje.