Home Tecnología Machine Learning: Aprendizaje supervisado
Machine Learning: Aprendizaje supervisado

Machine Learning: Aprendizaje supervisado

0
0
Reading Time: 2 minutes

¿Este aplicante pagará el préstamo?, la pregunta que nuestro programa responde miles de veces al día con cada solicitud que nos llega.

En la mayoría de los casos, el objetivo del aprendizaje supervisado es lograr que la computadora aprenda el sistema de clasificación que nosotros creamos (un sistema de clasificación es ordenar la información según sus características).  Esto implica comenzar con la recolección de información (data) para entrenar al modelo (computadora o programa) a reaccionar con las clasificaciones que nosotros le demos, así aplicará lo que aprenda para dar respuestas a situaciones completamente nuevas que no ha visto antes.

¿Suena complicado? Un ejemplo básico de esto son las clasificaciones de dígitos. Seguramente has utilizado aplicaciones que te permiten introducir el número de tu tarjeta con sólo tomar una foto desde tu smartphone. El modelo usa los números como sistema de clasificación y trata de relacionar las figuras en la foto con un número que ya tiene guardado en su sistema, creando así una relación que le permite saber cuál figura es qué número, tratando siempre de minimizar su margen de error. ¡Así es como puedes introducir el número de tu tarjeta en la aplicación del banco sólo tomando una foto!

Otros modelos de aprendizaje automático son de regresión en lugar de clasificación. Una regresión permite estimar o predecir un valor numérico continuo con base en los datos que se han introducido al sistema.

Una regresión puede compararse a una consulta médica. Cuando vamos al doctor él analiza nuestros síntomas (que en un modelo de regresión serían las variables): el color de la piel, frecuencia cardiaca, revisará la garganta y la temperatura antes de poder diagnosticar un resfriado. Entre más variables se analizan es posible tener un diagnóstico más exacto.

Si lo vemos como una ecuación, tenemos la información que metemos al sistema (X) para que pueda predecir un número continúo (Y) y la relación entre ambas partes (f). La información, o data, se divide en dos partes para el aprendizaje de máquina: en un grupo entrenamiento con etiquetas (las variables de X) y otro grupo para tratar de predecir el resultado (Y) a través de la relación entre ellas (f):

Y= f(x) + E (valor constante)

En resumen, se trata de darle información a una computadora para que aprenda y aprenda con datos que ya existen, de forma que cuando llegue una consulta nueva tome esa experiencia y pueda predecir un resultado con el menor margen de error posible.

Leer: Machine learning o aprendizaje automático, la clave de Kueski