Home Kueski Machine Learning: Qué es y para qué sirve el Clustering
Machine Learning: Qué es y para qué sirve el Clustering

Machine Learning: Qué es y para qué sirve el Clustering

0
0
Reading Time: 3 minutes

¿Te acuerdas qué es el machine learning? También conocido como aprendizaje de máquina, su propósito es entrenar a las computadoras para realizar ciertas tareas rápidamente, en grandes volúmenes y con el menor error posible, algo que sería imposible para un humano. ¿Cómo lo hace? A través de el aprendizaje de patrones con base en ejemplos, lo que permite evaluar grandes cantidades de información en un tiempo reducido.

aprendizaje máquina

Anteriormente hemos hablado sobre áreas del aprendizaje automático como el aprendizaje supervisado, concretamente,  la regresión lineal y hoy te contaremos sobre una aplicación del machine learning de aprendizaje no supervisado: el clustering, y cómo lo usamos en Kueski.

Leer: Machine Learning: Aprendizaje supervisado

A través del aprendizaje de máquina, una computadora analiza los datos que se le dan, hace la tarea que se le pide, encuentra el error e inicia el mismo proceso una y otra vez hasta converger un error.

El clustering, por su parte, sirve para segmentar datos en grupos iguales o similares. Tiene usos en medicina para el diagnóstico de enfermedades a través de imágenes, en el monitoreo de redes sociales, mercadotecnia y finanzas.

En Kueski, por ejemplo, lo podemos usar para agrupar información como  edad, género, ubicación y otras variables de nuestros usuarios que nos ayudan a identificar cuál es el perfil de nuestros clientes y con lo cual podemos tener un mejor entendimiento de sus necesidades.

Leer: Machine Learning: así decide Kueski cuánto prestarte

¿Cómo se hace clustering con aprendizaje automático?

Aunque pueden ser procesos complicados, el aprendizaje automático es un tema tan fascinante (y la base principal de Kueski) que queremos que lo conozcas, al menos desde una perspectiva general y básica.

Si lo vemos con pasos, se pueden explicar de esta forma:

  1. Mides el error: Lo primero es definir una métrica de error (es decir, el nivel de error que queremos que tenga el modelo) después se corren las fórmulas con los datos que se tienen en la computadora para encontrar el error inicial.
  2. Agregas el error al algoritmo de entrenamiento.
  3. Vuelves a medir el error: repites el proceso miles de veces en poco tiempo. 

En otras palabras, el aprendizaje máquina es como un bucle que consiste en encontrar errores, agregarlos al entrenamiento, volver a calcular el error con la finalidad de reducirlo, volver a introducir el error resultante al entrenamiento y repetir el proceso miles de veces en poco tiempo.

En general, la forma en la que se realiza un clustering es así:

  1. Decides el número de clusters (agrupaciones) por hacer.
  2. Formas grupos de similaridades y les asignas un centro, como se observa en el ejemplo de abajo.
  3. Mides el error de la máquina en  su capacidad para encontrar el centro de los grupos.
  4. Vuelves a formar grupos de similaridad partiendo del centro anterior.
  5. Mides el error y lo agregas al algoritmo hasta que este ya no varíe.

El  GIF se puede apreciar mejor el proceso de un clustering que sigue estos pasos. 

clustering

By Chire, from Wikimedia Commons

Las pequeñas cruces son los datos que se le dan a la computadora, en el primer cuadro podemos ver cómo se distribuirían en un plano de dos ejes y cómo el modelo (las áreas sombreadas) está situado en una posición aleatoria, no tan cercana de la información proporcionada.

En las siguientes iteraciones el modelo cambia para ajustarse mejor a la información proporcionada en el plano hasta agrupar todos los datos con el error mínimo posible.

Leer: Machine learning o aprendizaje automático, la clave de Kueski

Todos los Kueskids somos unos apasionados de nuestro trabajo y nos encanta compartir contigo lo que hacemos, ¡esperamos que lo disfrutes tanto como nosotros!


Kueski SAPI de CV SOFOM ENR. Consulta aviso de privacidad, CAT y requisitos de contratación en Kueski.com. No requiere para su constitución u operación autorización de la SHCP y está sujeta a la supervisión de la CNBV en materia de prevención y detección de operaciones con recursos de procedencia ilícita.