Qlik AutoML: Las mejores prácticas

¿Qué es AutoML?

Qlik AutoML es una herramienta de aprendizaje automático automatizado que permite a los usuarios sin experiencia avanzada en datos desarrollar modelos predictivos. Al ofrecer una interfaz accesible, Qlik AutoML permite a analistas de negocio y otros profesionales trabajar directamente con machine learning (ML) para mejorar sus decisiones sin tener que programar ni construir modelos complejos.

Principales características de Qlik AutoML

Interfaz Intuitiva: Diseñada para que cualquier usuario, independientemente de su nivel técnico, pueda utilizar el machine learning. Qlik AutoML guía a los usuarios en cada paso de la creación y evaluación de modelos.

Entrenamiento y Selección de Modelos Automática: Qlik AutoML automatiza el proceso de selección y entrenamiento de modelos, eligiendo algoritmos y configuraciones óptimas de acuerdo a los datos y al objetivo que se desea alcanzar.

Predicciones Integradas: Una vez que el modelo está listo, las predicciones pueden integrarse en paneles de Qlik Sense, permitiendo a los usuarios visualizar y usar los datos de forma predictiva en sus análisis diarios.

Interpretabilidad del Modelo: A diferencia de otros enfoques de machine learning, Qlik AutoML incluye herramientas para comprender las razones detrás de las predicciones, como la importancia de las variables, lo cual es crucial para la confianza y adopción del modelo por parte de los usuarios de negocio.

Beneficios de usar Qlik AutoML

Agiliza la Toma de Decisiones: Al incorporar predicciones basadas en datos, Qlik AutoML permite que los equipos anticipen tendencias y respondan rápidamente a oportunidades y riesgos.

Democratización del Machine Learning: Tradicionalmente, el aprendizaje automático estaba limitado a científicos de datos, pero con Qlik AutoML, los usuarios de negocio pueden construir sus propios modelos predictivos.

Reducción de Costos y Tiempo: La automatización de tareas complejas, como la selección de algoritmos y el ajuste de parámetros, reduce considerablemente el tiempo y el esfuerzo invertidos en análisis avanzados.

Cómo Funciona

El aprendizaje automático automatizado generalmente se alinea con el flujo de trabajo tradicional del aprendizaje automático. Al igual que en otros proyectos de ciencia de datos o análisis de datos, primero debes definir claramente la pregunta que intentas responder o el problema que deseas resolver. Este paso crítico te ayudará a determinar los requisitos de datos necesarios.

Dependiendo de tu caso de uso específico y del tipo de datos (estructurados, imágenes, video o lenguaje), los detalles del proceso de AutoML variarán. A continuación, se presenta como usarlo.

Conjunto de Datos (Dataset)

Primero, reúne los datos apropiados y prepara tu conjunto de datos. Las acciones clave incluyen:

  • Asegurarte de que el conjunto de datos esté correctamente etiquetado y formateado.
  • Evitar la fuga de datos y el sesgo entre el entrenamiento y el despliegue.
  • Limpiar datos que estén incompletos, ausentes o inconsistentes.
  • Revisar el conjunto de datos después de importarlo a tu plataforma de aprendizaje automático automatizado para asegurar su precisión.

Entrenamiento y Evaluación

Una vez preparado el conjunto de datos, estás listo para entrenar el modelo. Los procesos de AutoML suelen emplear técnicas como ajuste de hiperparámetros, preprocesamiento de datos, meta-aprendizaje, ingeniería de características y búsqueda de arquitectura neuronal. En la próxima sección, se describen los principales tipos de aprendizaje automático automatizado.

Asegúrate de comprender todas las columnas de características que estás incluyendo, y de no agregar columnas que no sean relevantes para tu análisis, ya que esto solo generaría ruido.

Después de completar el entrenamiento, la herramienta debería proporcionar un informe de métricas sobre el rendimiento del modelo entrenado en el conjunto de datos de prueba. Estas métricas de validación ayudan a determinar si el modelo está listo para su uso. Incluyen métricas de pronóstico y regresión (como el error absoluto medio y el cuantil observado), y métricas de clasificación (como los resultados de predicción y el umbral de puntuación).

Además de este informe de métricas, las mejores herramientas de AutoML permiten utilizar AI explicable (XAI) para comprender la lógica detrás de los resultados del modelo de ML. También puedes evaluar más a fondo el modelo ejecutando pruebas adicionales con datos nuevos para verificar si las predicciones generadas cumplen con tus expectativas.

Despliegue y Servicio

Cuando estés seguro del rendimiento de tu modelo, puedes ponerlo en funcionamiento. Su uso puede ser para un proyecto puntual o como parte de un proceso de producción continuo.

  • Para proyectos puntuales, probablemente sea más adecuado un enfoque de predicción por lotes asincrónico.
  • Si el modelo será parte integral de un proceso de análisis de IA en el que otras aplicaciones dependen de predicciones rápidas, considera un despliegue sincrónico y en tiempo real.

Las mejores herramientas de AutoML permiten publicar tus datos en otras plataformas en la nube e integrar directamente tus modelos en herramientas de BI y análisis para un análisis interactivo completo. Esto aporta una visión más profunda y decisiones basadas en datos que mejoran el rendimiento de tu empresa.

Ejemplo de AutoML

Para ilustrar el aprendizaje automático automatizado en acción, imaginemos que diriges una empresa SaaS que vende suscripciones mensuales a una plataforma en línea. A continuación, veremos cómo puedes utilizar el aprendizaje automático automatizado en una herramienta de BI para evaluar el comportamiento de los clientes.

Evaluando la pérdida de clientes (churn)

Las tablas de AutoML pueden ayudarte a comprender los patrones y factores que han influido en la pérdida de clientes en el pasado. Además, pueden utilizar esos mismos patrones para predecir cuáles de los clientes actuales tienen mayor riesgo de abandonar en el futuro.

Acceder a un conjunto de datos históricos de clientes muestra cómo se verían las primeras 12 filas de un conjunto de datos de este tipo:

Cada fila de la tabla anterior representa a un cliente histórico único. Cada columna representa un atributo sobre el cliente.

Algunos atributos de cada cliente se conocen en el momento en que se convierte en cliente, como el CustomerID, Género, Edad, Código Postal y Tipo de Plan. Otros atributos de cada cliente se vuelven disponibles más adelante en el recorrido del cliente, como Inicios_1M (el número de veces que el cliente ingresó al sitio durante el primer mes), Prom_min_log_1M (el tiempo promedio – en minutos – que el cliente pasó en el sitio durante el primer mes), y Churn_1A (si el cliente abandonó o no la plataforma dentro del primer año de ser cliente). Churn_1A es la columna de interés porque deseas predecir si un cliente es probable que abandone la plataforma en los primeros 12 meses.

Al examinar de cerca las tablas de AutoML, se revelan tres patrones clave en el conjunto de datos:

1. Los clientes mayores de 70 años rara vez abandonan la plataforma durante su primer año.

2. Las clientas de unos 40 años que tienen un plan “Familiar” rara vez abandonan la plataforma durante su primer año.

3. Los clientes masculinos en sus 30 años con un plan “Personal” son más complicados. Es probable que abandonen la plataforma durante su primer año si iniciaron sesión menos de 20 veces durante el primer mes. Sin embargo, si iniciaron sesión más de 20 veces durante su primer mes, es poco probable que se vayan.

El aprendizaje automático automatizado destaca en la identificación de patrones como estos. Incluso puede descubrir patrones significativamente más complejos a partir de un gran número de columnas para predecir cómo las combinaciones de valores en las columnas de características afectarán los valores en las columnas objetivo.

AutoML toma un conjunto de datos (como el del ejemplo) y te permite especificar un campo objetivo (por ejemplo, Churn_1A). Luego, encuentra los factores clave y patrones en los datos que a menudo son imposibles de visualizar o detectar por un ser humano. Después, puedes refinar y finalizar el modelo, así como utilizarlo para hacer predicciones futuras tanto para datos prospectivos como para la planificación de escenarios.

Tomando Acción Sobre Tus Predicciones

Una vez que identifiques qué clientes abandonarán, puedes implementar estrategias de retención de clientes y comenzar a hacer preguntas sobre los patrones de compra, la demografía y otras características de los clientes más valiosos que los convierten en los más exitosos.

El conocimiento que obtienes de los patrones que descubre el aprendizaje automático automatizado puede tener un impacto directo en las conversaciones comerciales relacionadas con la estrategia de crecimiento a largo plazo y el rendimiento financiero de tu empresa.

Scroll al inicio