jueves, 3 de junio de 2021

3 algoritmos de machine learning predictivo que todo analista de datos debe conocer

Sin dudas, al momento de ingresar al mundo del análisis de datos uno se siente  muy ahogado y perdido al ver la enorme cantidad de algoritmos que se usan para diversas realidades, pero ante ese panorama, uno debe hacerse la siguiente pregunta: ¿Todos son utilizados en todo momento? Y bueno, la respuesta es obvia la cual es NO. Cuando logras asimilar ello, nace una segunda pregunta, muy válida, la cual es ¿qué algoritmos entonces son los más usados en las empresas normales (bancos, transporte, comercio)?

Bueno, a continuación se describen, de manera muy simple, los tres algoritmos del tipo predictivo más usados y que sin duda son un punto de partida muy interesante que después permite pasar a otros tipos de algoritmos más complejos.


Regresión logística:


Fuente: Internet

Es uno de los más antiguos pero también de los más usados.
Es un algoritmo lineal y aditivo, basado en la regresión múltiple, pero adaptado para predecir eventos de cero o uno.
Por ejemplo si un empleado va a dejar o no la empresa en los próximos 3 meses.
El motivo por el que te recomiendo aprenderlo es porque aún hoy en día es de los más usados en el ámbito empresarial.
Por ejemplo es masivamente usado en análisis de riesgos.
Por tanto si te gustaría trabajar en una empresa grande y "tradicional" (bancos, aseguradoras, etc.) debes dominar este algoritmo.


 
Árbol de decisión:

Fuente: Internet
 

Consiste en ir haciendo divisiones sucesivas del conjunto de datos basadas en la variable que mejor consiga separarlo en cuanto al objetivo que estamos modelizando.
Por ejemplo si queremos calcular la probabilidad de cada cliente de comprar un coche de alta gama es posible que la primera variable que mejor separe entre los que lo comprarán y los que no sea el salario.
Y así con todas las variables disponibles hasta que llega al máximo de predicción posible.
La salida final que nos devuelve es un conjunto de reglas si-entonces.
Por ejemplo: si el cliente gana más de 80000 dólares anuales y tiene más de 45 años entonces la probabilidad de comprar un Mercedes clase S es de 64%.
El motivo de su éxito es que como ves es muy explotable desde negocio y su salida es entendible por todos.
Por lo que es un algoritmo muy usado en contextos de marketing.


 
Random Forest:

Fuente: Internet
Fuente: Internet

Este algoritmo se basa en generar muchos árboles (pueden ser miles) pero cada uno de ellos muy pequeñito, y luego combinarlos para tener una salida única.
El motivo es que se ha demostrado que este sistema consigue mayor capacidad predictiva a la vez que genera modelos muy robustos en producción.
El "problema" es que a diferencia de los árboles con este algoritmo no podemos explicar el por qué de la probabilidad que nos ofrece como salida.
Por tanto se usa mucho cuando no nos importan tanto la explicación de la capacidad predictiva, por ejemplo en sistemas de scoring automáticos.

sábado, 22 de mayo de 2021

Se acabó el espacio ilimitado de fotos y vídeos de Google Photos, ¿y qué hago ahora?

Desde el 1 de junio de 2021, la gran G terminó con su servicio de almacenamiento gratuito de imágenes en su app "Google Photos" llevando a que las personas deban de ocupar y arreglárselas únicamente con los 15 GB que tiene gratuitamente asignada la cuenta Gmail para las fotos, vídeos, correos electrónicos y otras cosas que ya están y serán guardadas en Google Drive. ¿Por qué hace esto? Bueno, ya tiene la cuota de mercado que desea y cautivo (la gran mayoría tiene Android y una cuenta Gmail que usan para casi todo), por lo cual si una persona quiera cambiarse a la competencia (que únicamente son Iphone y Huawei que está bloqueado a usar las apps de Google -excepto el sistema operativo Android- por la guerra de Trump con China), deberá de cambiar su forma de interactuar con el celular. Ahora, y lo más grave, es que al poco tiempo de ya no tener almacenamiento ilimitado y gratuito para vídeos y fotos sacadas con nuestro celular, la memoria de nuestro equipo, como el enclenque espacio que ofrece Google Drive, obliga a buscar alternativas y lo cual fue todo un agrado al ver que existen varias alternativas que dan un buen ancho.

Ahora, dentro de estas alternativas, creo que estas son las más destacables.

Amazon Photos

Prime-Photos-Amazon

Amazon Photos es otro de los servicios similares a Google Fotos que ofrece espacio de almacenamiento ilimitado para usuarios de Amazon Prime. El servicio se encarga de almacenar de forma automática las imágenes y crear copias de seguridad que te permitirá recuperarlas incluso si pierdes tu teléfono móvil.

Puedes visualizar las imágenes desde cualquier dispositivo y ordenarlas según la fecha en la que se tomó.

TeraBox

Es una aplicación que no es muy conocida, pero que funciona bastante bien otorgándonos un 1 TB de almacenamiento, con un sistema de copia de seguridad de nuestras fotos. Es compatible con la web, es decir, podremos ver que fotos y vídeos tenemos guardados desde el ordenador, pero también tiene aplicación para Android y para iOS.

Tendremos muchas opciones interesantes y muy parecidas a lo que nos ofrece Google Fotos. Cualquier foto que saquemos en cualquier dispositivo se subirá a la nube de TeraBox automáticamente, además de fotos tendremos la opción de subir videos, documentos u otro tipo de archivos, podremos acceder al contenido desde cualquier dispositivo que tenga TeraBox con nuestra cuenta activa, siempre tendremos una vista previa de todo el contenido, podremos crear carpetas y mover archivos entre ellas, se podrán transferir archivos a un almacenamiento diferente si lo necesitamos o podremos buscar por palabra clave o nombre, entre otras cosas. Una buena alternativa a Google Fotos, aunque poco conocida.

TeraBox


Disco Duro Externo.

Sí, también es una interesante opción, ya que estos servicios en la nube o internet pueden caducar en cualquier momento, como también existe la posibilidad de violación a la privacidad y exponer todas estas imágenes y vídeos para todos, pero es parte del riesgo que también se tiene con Google Photos, mientras que con un disco duro externo que nosotros manejamos, es menos probable que ello pase, pero también existe la opción de que el disco duro se dañe y pierda la información que contiene.

 

Conclusión.

Como se puede ver, no existe una opción que supere a las otras, por lo cual toca a cada persona definir cuál es la que mejor le va y le dé confianza. Para mí, la nube es lo mejor y la posibilidad de violación de la privacidad, se puede dar en cualquier momento ya sea en la nube o en físico, por lo cual es el nivel de tolerancia que uno posea el que realmente ayudará a tomar mejor la decisión.




¿La Inteligencia Artificial realmente "ve" lo que dicen los datos? 🤔

Imagen creada con IA Copilot. Recientemente se realizó un experimento muy curioso para poner a prueba a los modelos de lenguaje (LLMs). La i...