“Lo bueno de la ciencia es que es cierta independientemente de si crees o no en ella” (Neil deGrasse Tyson)

Réquiem por el Análisis: Cuando la Ingeniería devoró a la Ciencia de Datos

Estamos a comienzos de 2026. Miro por la ventana de mi oficina —o más bien, la pantalla que simula una ventana en este entorno de trabajo híbrido que ya es la norma— y me doy cuenta de que algo fundamental se ha roto.

Os voy a contar una breve historia, no real, pero que es el día a día de muchas de las viejas glorias que nos dedicamos a esto.


Hace unos días, un "Junior AI Specialist" (el título que ha reemplazado a nuestros antiguos analistas junior) me entregó un modelo predictivo de rotación de clientes. El modelo era perfecto. Tenía un AUC de 0.98. Se desplegó en producción con un solo clic a través de nuestra pipeline de MLOps automatizada. Se reentrena solo. Se monitorea solo.

Y sin embargo, cuando le pregunté al chico: "¿Por qué se van los clientes? ¿Qué variable es la que está disparando la señal?", me miró con cara de no entender la pregunta.

"El modelo lo ha optimizado, el vector de embeddings capturó la semántica del comportamiento", me respondió.

En ese momento, sentí el peso de lo que hemos perdido.


La muerte de la curiosidad

Hace cinco o seis años, la Ciencia de Datos era, ante todo, Ciencia.

Recuerdo las discusiones acaloradas frente a una pizarra blanca, debatiendo si una distribución era normal o si teníamos un sesgo de selección en la muestra. Recuerdo pasar horas "limpiando" datos, no porque fuera una tarea ingrata, sino porque en esa suciedad estaba la realidad del negocio. Al tocar el dato, al mancharnos las manos con él, entendíamos el problema.

Hoy, en 2026, ya no buscamos entender el dato. Buscamos que el dato fluya.

Hemos sustituido la curiosidad estadística por la eficiencia ingenieril. A nuestros equipos ya no les formamos como data scientist curiosos; los formamos como ingenieros de tuberías de datos y arquitectos de nubes. El objetivo ya no es el insight (el "por qué"), sino el throughput (el "cuánto" y "cómo de rápido").


El espejismo del resultado artificial

Lo que más me aterra es esta nueva forma de "entender" los resultados de manera artificial.

Ahora tenemos herramientas que generan explicaciones sintéticas. Un LLM lee los pesos del modelo y te escupe un párrafo que suena convincente: "Los clientes se van porque la sensibilidad al precio ha aumentado en el sector demográfico X".

Suena bien. Es gramaticalmente correcto. Pero, ¿es real?

Hemos dejado de interrogar a la realidad. Aceptamos la salida de la caja negra porque es computacionalmente costosa de rebatir. Hemos industrializado tanto el proceso que detenerse a pensar se considera un cuello de botella en la producción.


De la Artesanía a la Cadena de Montaje

Echo de menos la artesanía. Echo de menos el feature engineering manual, ese momento "Eureka" donde tu conocimiento del dominio humano te permitía crear una variable que disparaba la precisión del modelo, no porque una red neuronal probara mil combinaciones, sino porque tú entendías cómo pensaba el cliente.

La tecnología de 2026 es asombrosa, no lo niego. Las capacidades generativas y predictivas están a años luz de lo que teníamos en 2023. Pero siento que, en el camino, hemos matado el alma de la profesión.

Nos hemos convertido en fontaneros de datos de lujo. Nos aseguramos de que la tubería no gotee, pero ya no nos importa qué agua corre por ella ni de qué manantial viene.

¿Hay vuelta atrás?

Quizás soy solo un viejo gruñón gritándole a la nube (literalmente). Pero creo que es hora de reivindicar el "Science" en Data Science.

Necesitamos menos AutoML y más Auto-Reflexión. Necesitamos volver a preguntar "¿Por qué?" antes de preguntar "¿Cómo lo despliego?". Porque si seguimos por este camino, en 2030 no tendremos científicos de datos; tendremos supervisores de algoritmos que, en el fondo, no tienen ni la menor idea de lo que está pasando bajo el capó.

Y una ciencia que no entiende sus propias causas, no es ciencia. Es solo magia negra automatizada.

¿Tú también sientes que hemos perdido el norte? Te leo en los comentarios.




"¿Por qué esta magnífica tecnología científica, que ahorra trabajo y nos hace la vida mas fácil, nos aporta tan poca felicidad? La repuesta es esta, simplemente: porque aún no hemos aprendido a usarla con tino." (Albert Einstein)

Comentarios

Entradas populares de este blog

LLM en 2025: Comparativa de los Líderes del Mercado

Estrategias de Pricing Dinámico Utilizando Machine Learning

¿Cómo identificar sistemas de IA de bajo riesgo según el nuevo Reglamento de la UE?