¿Qué es el Machine Learning?

articulo

El machine learning no es una caja negra que produce respuestas automáticas, sino un proceso de modelado donde cada decisión refleja supuestos que vale la pena entender. Este post explica qué ocurre cuando un sistema aprende a partir de datos, cómo se construye un modelo y por qué la interpretación sigue siendo central, incluso cuando el algoritmo hace el trabajo pesado.

Author

Atelier de Código

Published

April 11, 2026

¿Qué es el Machine Learning?

El término machine learning aparece con frecuencia en noticias, cursos y conversaciones sobre tecnología y ciencia de datos. A menudo se lo asocia con sistemas complejos, automatización o inteligencia artificial, lo que puede generar la impresión de que se trata de algo distante o exclusivamente técnico. Sin embargo, la idea central del machine learning es bastante más concreta: usar datos para construir modelos que identifiquen patrones y permitan hacer predicciones o clasificaciones sobre casos nuevos.

Lo que distingue a este enfoque de otras formas de programar es que el sistema no sigue reglas escritas explícitamente por un programador para cada situación posible. En cambio, se le presenta un conjunto de ejemplos y se le pide que encuentre regularidades en ellos. A partir de esas regularidades, el modelo puede operar sobre datos que no vio durante su construcción. Esa capacidad de generalizar a partir de ejemplos es lo que suele llamarse “aprendizaje”, aunque conviene tener presente que se trata de una metáfora: lo que ocurre es un ajuste matemático de parámetros, no una comprensión en ningún sentido profundo.

De dónde surge

El machine learning tiene raíces en varios campos que convergen. La estadística lleva décadas desarrollando modelos para describir relaciones entre variables y hacer inferencias sobre poblaciones. La informática aporta los métodos para implementar esos modelos de manera eficiente y ejecutarlos sobre grandes volúmenes de datos. La inteligencia artificial, por su parte, contribuyó el interés explícito por construir sistemas que se adapten a la información disponible en lugar de seguir procedimientos fijos.

El crecimiento sostenido del machine learning en los últimos años está estrechamente ligado a dos condiciones materiales: la acumulación masiva de datos digitales —registros de interacciones, textos, imágenes, transacciones— y el aumento considerable de la capacidad de cómputo disponible. Cuando ambas condiciones se combinan, entrenar modelos complejos sobre información real y actualizada se vuelve algo técnicamente viable, y esto abrió el campo a una enorme variedad de aplicaciones.

Cómo se construye un modelo

Un modelo de machine learning se construye a partir de tres elementos que vale la pena distinguir. El primero es un conjunto de datos que funciona como material de entrenamiento: los ejemplos a partir de los cuales el sistema va a aprender. El segundo es un algoritmo¹ que define cómo buscar patrones en esos datos, es decir, qué tipo de estructura matemática se va a ajustar. El tercero es un objetivo que indica qué resultado se espera del modelo: predecir un valor numérico, clasificar casos en categorías, detectar agrupamientos, entre otros.

Un ejemplo concreto puede ayudar a clarificar esta estructura. Supongamos que contamos con datos sobre personas e información sociodemográfica —edad, nivel educativo, región de residencia— y queremos construir un modelo que prediga si alguien está empleado. El algoritmo analiza los ejemplos donde el resultado ya es conocido y ajusta sus parámetros internos para aproximarse a ese resultado. Cuando posteriormente recibe un caso nuevo —alguien sobre quien no tiene la respuesta—, produce una predicción basada en lo que aprendió de los ejemplos anteriores.

Lo que ocurre en ese proceso de ajuste es, en esencia, una búsqueda de la configuración de parámetros que minimiza el error del modelo sobre los datos de entrenamiento. Los distintos algoritmos de machine learning representan distintas maneras de plantear esa búsqueda y distintas formas de representar los patrones encontrados.

Tipos de aprendizaje

Una de las distinciones más habituales en el campo es entre aprendizaje supervisado y aprendizaje no supervisado. En el primero, los datos incluyen una variable objetivo conocida —una etiqueta o resultado— y el modelo aprende a relacionar las variables de entrada con ese resultado. El ejemplo del empleo pertenece a esta categoría: hay un resultado conocido para cada caso de entrenamiento. En el aprendizaje no supervisado, en cambio, no hay una etiqueta previa. El objetivo es explorar la estructura de los datos, identificar grupos o patrones recurrentes sin que nadie haya definido de antemano cuáles son las categorías correctas.

Existen también enfoques más específicos, como el aprendizaje por refuerzo, donde un sistema aprende a partir de la retroalimentación que recibe de sus propias acciones en un entorno. Para una primera aproximación al campo, lo más relevante es entender que la elección entre estos tipos de enfoque no es arbitraria: depende de la naturaleza del problema, del tipo de datos disponibles y de qué pregunta se quiere responder.

Qué hace y qué no hace un modelo

Un aspecto fundamental del machine learning es que los resultados que produce un modelo dependen directamente de los datos con los que fue entrenado. Esto implica que los supuestos, sesgos y limitaciones de esos datos se transfieren al modelo. Si los datos de entrenamiento son incompletos, no representativos o reflejan desigualdades estructurales, el modelo aprenderá esas mismas regularidades y las proyectará sobre casos nuevos.

Por este motivo, el machine learning no reemplaza la interpretación ni el juicio. Ayuda a identificar patrones y a automatizar ciertos análisis que sería imposible hacer a mano, pero sigue siendo necesario evaluar si esos patrones tienen sentido en el contexto del problema, si generalizan razonablemente a otros contextos y qué implicancias concretas tienen las predicciones. Las decisiones sobre qué datos usar, cómo prepararlos y cómo interpretar los resultados siguen siendo decisiones humanas, y son las que determinan en gran medida la calidad y la responsabilidad de un análisis.

No obstante, sabemos que el mundo está cambiando a una velocidad abrumadora y que no siempre estos principios se mantienen (o no son compartidos con todas las personas). Sin embargo, querríamos recordar en este punto al famoso manual de entrenamiento de IBM de 1979: “nunca se puede responsabilizar a una computadora, por lo que una computadora nunca debe tomar una decisión de gestión” [a computer can never be held accountable, therefore a computer must never make a management decision]. Por acción o por omisión, es posible que en distintos ámbitos, políticos, empresariales, gubernamentales, se usen algoritmos de machine learning para tomar decisiones que puedan ser determinantes en las vidas de las personas: esto -creemos- debe ser tomado con extremo cuidado².

Una forma de ver el problema

El machine learning se usa en contextos muy diversos: clasificar textos, detectar fraudes, analizar imágenes médicas, estudiar trayectorias laborales, modelar dinámicas sociales. En cada uno de estos casos, el valor de la técnica no proviene del algoritmo en sí mismo sino de cómo se lo integra en un marco de preguntas claras y de prácticas de trabajo rigurosas. El machine learning es una técnica de procesamiento de datos como pueden ser tantas otras: no debería ser el fin, sino uno de los medios más.

Aprender machine learning, en ese sentido, implica entender qué tipo de problemas se pueden formular como problemas de aprendizaje, cómo evaluar si un modelo generaliza bien o simplemente memorizó los datos de entrenamiento, y cómo comunicar los resultados de manera honesta sobre sus alcances y sus límites. El cambio de perspectiva más importante quizás sea este: pasar de pensar en el machine learning como una caja negra que produce respuestas a pensarlo como un proceso de modelado donde cada decisión —sobre los datos, sobre el algoritmo, sobre el objetivo— refleja supuestos que vale la pena hacer explícitos.

Footnotes

Para quienes venimos de otras áreas, la palabra algoritmo puede parecer lejana, misteriosa, casi mística. Pero en esencia un algoritmo es una serie de pasos para realizar algo, que se puede aplicar en distintas situaciones. Por ejemplo, la serie de pasos para “hacer un nudo” se puede aplicar a los cordones de una zapatilla, a un pañuelo, a las sogas de un barco, etc. En estos casos, se habla de algoritmos matemáticos, que implica tomar un valor y realizar una serie de operaciones matemáticas sobre ese valor.↩︎
Este es un tema que requiere ríos de tinta, pero no podemos dejar de preguntarnos: ¿hasta qué punto en algunos casos se está aprovechando esta tecnología para tomar decisiones que, si fueran tomadas por personas, serían ampliamente cuestionadas? ¿Acaso están aprovechando de la supuesta objetividad del algoritmo (que no es tal) para desligarse de la carga moral de las decisiones? ¿Acaso es real que se puede enseñar ética a un modelo de lenguaje o es solamente un salvoconducto para las críticas?↩︎