Data Storytelling
El mayor desafío que enfrenta todo vendedor es cómo gastar mejor el dinero para hacer crecer su marca de manera rentable. Queremos gastar nuestros dólares de marketing en actividades que atraigan a los mejores clientes, mientras evitamos gastar en clientes no rentables o en actividades que erosionen el valor de la marca.
Con demasiada frecuencia, los profesionales de la mercadotecnia se fijan en la eficiencia del gasto. ¿Qué es lo mínimo que puedo gastar en publicidad y promociones para generar ingresos? Centrarse únicamente en la métrica del retorno de la inversión puede debilitar el valor de la marca y hacer que se dependa más de la promoción de precios como forma de generar ventas.
Dentro de su actual conjunto de clientes hay personas que van desde los leales a la marca hasta los transitorios de la misma. Los leales a la marca están muy comprometidos con su marca, están dispuestos a compartir su experiencia con los demás y son los que tienen más probabilidades de volver a comprar. Los transeúntes de la marca no son leales a su marca y compran en base al precio. Lo ideal sería que su gasto en marketing se centrara en hacer crecer el grupo de fieles a la marca, mientras se minimiza la exposición a los transitorios de la marca.
Entonces, ¿cómo puede identificar a estos leales a la marca y utilizar mejor su dinero de marketing para prolongar su relación con usted?
El cliente de hoy en día no tiene escasez de opciones. Para destacarse, las empresas necesitan hablar directamente de las necesidades y deseos del individuo al otro lado del monitor, el teléfono o la estación, a menudo de manera que reconozca no sólo al cliente individual sino también el contexto que lo trae al intercambio.
Cuando se hace de manera adecuada, el compromiso personalizado puede generar mayores ingresos, eficiencia en la comercialización y retención de clientes1, y a medida que las capacidades maduren y las expectativas de los clientes aumenten, la personalización correcta será cada vez más importante. Como dice McKinsey & Company, la personalización será «el principal impulsor del éxito de la comercialización en los próximos cinco años2».
Pero un aspecto crítico de la personalización es comprender que no todos los clientes tienen el mismo potencial de rentabilidad. No sólo los diferentes clientes obtienen un valor diferente de nuestros productos y servicios, sino que esto se traduce directamente en diferencias en la cantidad total de valor que podríamos esperar a cambio.
Para que la relación entre nosotros y nuestros clientes sea mutuamente beneficiosa, debemos alinear cuidadosamente los costos de adquisición de los clientes (CAC) y las tasas de retención con los ingresos totales o el valor de vida del cliente (CLV) que podríamos recibir razonablemente a lo largo de la vida de esa relación.
Esta es la motivación central detrás del cálculo del valor de vida del cliente. Al calcular la cantidad de ingresos que podríamos recibir de un cliente determinado a lo largo de la vida de nuestra relación con él, podríamos adaptar mejor nuestras inversiones para maximizar el valor de nuestra relación para ambas partes.
Podríamos tratar de entender por qué algunos clientes valoran más nuestros productos y servicios que otros y orientar nuestros mensajes para atraer a más individuos con mayor potencial. También podríamos utilizar CLV en conjunto para evaluar la eficacia general de nuestras prácticas de comercialización en la construcción de la equidad y supervisar cómo la innovación y los cambios en el mercado la afectan a lo largo del tiempo3.
Pero por muy poderoso que sea CLV, es importante que apreciemos que se deriva de dos estimaciones separadas e independientes. La primera de ellas es el gasto por transacción (o el valor promedio del pedido) que podemos esperar ver de un cliente determinado. La segunda es el número estimado de transacciones que podemos esperar de ese cliente en un horizonte de tiempo determinado.
Esta segunda estimación se considera a menudo un medio para alcanzar un fin, pero a medida que las organizaciones desplazan sus gastos de comercialización de la adquisición de nuevos clientes hacia la retención5, se vuelve increíblemente valiosa por derecho propio.
Cómo los clientes señalan su intención de por vida
En los escenarios no contractuales dentro de los cuales la mayoría de los minoristas interactúan, los clientes pueden ir y venir a su antamente. Los minoristas que intentan evaluar la vida útil restante en una relación con el cliente deben examinar cuidadosamente las señales transaccionales generadas anteriormente por los clientes en términos de la frecuencia y la rectitud de su compromiso.
Por ejemplo, un comprador frecuente que ralentiza su patrón de compras o simplemente no reaparece durante un período prolongado de tiempo puede indicar que se está acercando al final de su vida útil de la relación. Otro comprador que infrecuentemente participa puede seguir en una relación viable incluso cuando está ausente por una duración similar.
Machine Learning y el Valor de Vida del Cliente
Diferentes clientes con el mismo número de transacciones pero que señalan una intención de por vida diferente
Comprender dónde está un cliente en la vida útil de su relación con nosotros puede ser fundamental para entregar los mensajes correctos en el momento adecuado. Los clientes que señalan su intención de estar en una relación a largo plazo con nuestra marca, pueden responder positivamente a ofertas de mayor inversión que profundizan y fortalecen su relación con nosotros y que maximizan el potencial a largo plazo de la relación incluso mientras sacrifican los ingresos a corto plazo.
Los clientes que señalan su intención de una relación a corto plazo pueden ser empujados por ofertas similares o peor pueden aceptar esas ofertas sin ninguna esperanza de que podamos recuperar la inversión.
Aprovechando mlflow, una plataforma de administración e implementación de modelos de Machine Learning, podemos asignar fácilmente nuestro modelo a interfaces de programa de aplicaciones estandarizadas.
Aunque mlflow no admite de forma nativa los modelos generados por las vidas, se extiende fácilmente para este propósito. El resultado final de esto es que podemos convertir rápidamente nuestros modelos entrenados en funciones y aplicaciones que permiten la puntuación periódica, en tiempo real e interactiva de las métricas de esperanza de vida de los clientes.
Del mismo modo, podemos reconocer cambios en las señales de relación, como cuando los clientes de larga duración se acercan al final de su vida útil de relación y promueven productos y servicios alternativos que los convierten en una nueva relación potencialmente rentable con nosotros mismos o con un socio.
Incluso con nuestros clientes de corta duración, podríamos considerar la mejor manera de ofrecer productos y servicios que maximicen los ingresos durante su compromiso de tiempo limitado y que les permitan recomendarnos a otros que buscan ofertas similares.
Como escriben Peter Fader y Sarah Toms en The Customer Centricity Playbook, en una estrategia eficaz centrada en el cliente «las oportunidades para obtener las máximas ganancias financieras se identifican y se aprovechan plenamente, pero estas apuestas de alto riesgo también deben ponderarse y distribuirse entre categorías de activos de menor riesgo».
Encontrar el equilibrio adecuado y adaptar nuestras interacciones comienza con una estimación cuidadosa de dónde están los clientes en su viaje de por vida con nosotros.
Estimación de la vida útil del cliente a partir de señales transaccionales
Como se ha mencionado anteriormente, en los modelos sin suscripción, no podemos saber la duración exacta de la vida de un cliente o dónde reside en ella, pero podemos aprovechar las señales transaccionales que generan para estimar la probabilidad de que el cliente esté activo y tenga posibilidades de volver en el futuro.
Popularizados como los modelos «Buy ‘til You Die» (BTYD), la frecuencia de un cliente y la frecuencia reciente de compromiso en relación con los patrones del mismo en toda la población de clientes de un comercio minorista pueden utilizarse para derivar las curvas de supervivencia que nos proporcionan estos valores.
Machine Learning y el Valor de Vida del Cliente
Figura 2. La probabilidad de volver a comprometerse (P_alive) en relación con el historial de compras de un cliente
Las matemáticas detrás de estos modelos predictivos de CLV son bastante complejas. El modelo original de BTYD propuesto por Schmittlein et al. a finales de los años 80 (y hoy conocido como el modelo de Pareto/Distribución Binomial Negativa o Pareto/NBD) no despegó en su adopción hasta que Fader et al. simplificaron la lógica de cálculo (produciendo el modelo de Distribución Binomial Beta-Geométrica/Negativa o BG/NBD) a mediados de los años 2000. Incluso entonces, las matemáticas del modelo simplificado se vuelven bastante retorcidas bastante rápido.
Afortunadamente, la lógica detrás de estos dos modelos es accesible para nosotros a través de una popular biblioteca de Python llamada lifetimes a la que podemos proporcionar simples métricas de resumen para derivar estimaciones de vida útil específicas del cliente.
Delivering Customer Lifetime Estimates to the Business
Si bien es muy accesible, el uso de la biblioteca de vida útil para calcular las probabilidades específicas de los clientes de una manera que se ajuste a las necesidades de una gran empresa puede ser un desafío. En primer lugar, debe procesarse un gran volumen de datos de transacciones para generar las métricas por cliente que requieren los modelos.
A continuación, deben derivarse curvas a partir de esos datos, ajustándolos a los patrones esperados de distribución de valores, cuyo proceso está regulado por un parámetro que no puede predeterminarse y que, en cambio, debe evaluarse de forma iterativa en una amplia gama de valores potenciales.
Por último, los modelos de vida útil, una vez ajustados, deben integrarse en las funciones de comercialización y participación de los clientes de nuestra empresa para que las predicciones que genere tengan algún impacto significativo. Es nuestra intención en este blog y el cuaderno asociado demostrar cómo se puede abordar cada uno de los desafíos.
Metrics Calculations
Los modelos BTYD dependen de tres métricas clave por cliente:
- Frecuencia: el número de unidades de tiempo dentro de un período de tiempo determinado en el que se observa una transacción no inicial (repetición). Si se calcula a nivel diario, se trata simplemente del número de fechas únicas en las que se produjo una transacción menos 1 para la transacción inicial que indica el inicio de una relación de cliente.
- Edad: el número de unidades de tiempo desde la aparición de una transacción inicial hasta el final de un período de tiempo determinado. Una vez más, si las transacciones se observan a nivel diario, este es simplemente el número de días desde la transacción inicial de un cliente hasta el final del conjunto de datos.
- Recencia – la edad de un cliente (como se definió anteriormente) en el momento de su última transacción no inicial (repetición).
Las métricas en sí son bastante sencillas. El desafío consiste en derivar estos valores para cada cliente de los historiales de transacciones que pueden registrar cada partida individual de cada transacción que se produce durante un período de varios años. Al aprovechar una plataforma de procesamiento de datos como Apache Spark, que distribuye de forma nativa este trabajo a través de la capacidad de un entorno de varios servidores, este desafío se puede abordar fácilmente y calcular métricas de manera oportuna. A medida que llegan más datos transaccionales y estas métricas se deben volver a calcular en un conjunto de datos transaccional en crecimiento, la naturaleza elástica de Spark permite que se den de alta recursos adicionales para mantener los tiempos de procesamiento dentro de límites definidos por el negocio.
Ajuste del modelo
Con las métricas por cliente calculadas, la biblioteca de duración se puede utilizar para entrenar uno de varios modelos BTYD que pueden ser aplicables en un escenario comercial determinado. (Los dos más ampliamente aplicables son los modelos Pareto/NBD y BG/NBD, pero hay otros.) Aunque computacionalmente complejo, cada modelo se entrena con una simple llamada al método, lo que hace que el proceso sea altamente accesible.
Aún así, se emplea un parámetro de regularización durante el proceso de entrenamiento de cada modelo para evitar sobreajustarlo a los datos de
entrenamiento. El valor que es mejor para este parámetro en un ejercicio de entrenamiento determinado es difícil de conocer de antemano para que la práctica común sea entrenar y evaluar el ajuste del modelo en un rango de valores potenciales hasta que se pueda determinar un valor óptimo.
Este proceso a menudo implica cientos o incluso miles de ejecuciones de capacitación/evaluación.
Cuando se realiza uno a la vez, el proceso de determinar un valor óptimo, que normalmente se repite a medida que llegan nuevos datos transaccionales, puede llevar mucho tiempo. Mediante el uso de una biblioteca especializada llamada hyperopt, podemos aprovechar la infraestructura detrás de nuestro entorno Apache Spark y distribuir el modelo de entrenamiento/ evaluación de una manera paralelizada.
Esto permite que el ejercicio de ajuste de parámetros se realice de manera eficiente, devolviendo a nosotros el tipo de modelo óptimo y la configuración de parámetros de regularización.
Implementación de soluciones
Una vez debidamente entrenado, nuestro modelo tiene la capacidad de no sólo determinar la probabilidad de que un cliente vuelva a comprometerse, sino el número de interacciones esperadas durante períodos futuros. Las matrices que ilustran la relación entre las métricas de rectitud y frecuencia y estos resultados previstos proporcionan representaciones visuales poderosas del conocimiento encapsulado en los modelos ahora ajustados. Pero el verdadero desafío es poner estas capacidades predictivas en manos de aquellos que determinan la participación del cliente.
Figura 3. Matrices que ilustran la probabilidad de que un cliente esté vivo (izquierda) y el número de compras futuras en una ventana de 30 días dadas las métricas de frecuencia y rectitud de un cliente (derecha)
Aprovechando mlflow, una plataforma de administración e implementación de modelos de Machine Learning, podemos asignar fácilmente nuestro modelo a interfaces de programa de aplicaciones estandarizadas. Aunque mlflow no admite de forma nativa los modelos generados por las vidas, se extiende fácilmente para este propósito. El resultado final de esto es que podemos convertir rápidamente nuestros modelos entrenados en funciones y aplicaciones que permiten la puntuación periódica, en tiempo real e interactiva de las métricas de esperanza de vida de los clientes.
Bringing It All Together with Databricks
La capacidad predictiva de los modelos BYTD combinada con la facilidad de implementación proporcionada por la biblioteca de por vida hacen factible la adopción generalizada de la predicción de la vida útil del cliente. Aun así, hay varios desafíos técnicos que deben superarse al hacerlo. Pero ya sea escalando el cálculo de las métricas de los clientes a partir de grandes volúmenes del historial de transacciones, realizando un ajuste optimizado del hiperparámetros en un gran espacio de búsqueda o la implementación de un modelo óptimo como una solución que permite la puntuación del cliente, las capacidades necesarias para superar cada uno de estos desafíos están disponibles. Aún así, la integración de estas capacidades en un único entorno puede ser un desafío y llevar mucho tiempo. Afortunadamente, Databricks ha hecho este trabajo por nosotros. Y al entregarlos como una plataforma nativa de la nube, los minoristas y fabricantes que necesitan acceso a estos pueden desarrollar e implementar soluciones en un entorno altamente escalable con un costo inicial limitado.
Table of Contents
Toggle¿Qué es la narración de datos?
La narración de historias a través de datos es el proceso de transformar los análisis basados en datos en un formato visual ampliamente accesible para influir en una decisión, estrategia o acción comercial mediante la utilización de información analítica que, en última instancia, se convierte en información procesable.
Más allá de esta definición de narración de datos, el poder de una historia de datos radica en nuestra afinidad natural por las tramas y narrativas que transmiten información. Al aprovechar las herramientas adecuadas, es posible tomar métricas cuantitativas o información, organizarla en un formato lógico y crear una narrativa que simplifique la información compleja, presentándola de una manera que involucre a un público objetivo en particular.
La narración de datos tiene una serie de beneficios que impulsan el negocio.
Los beneficios de la narración de datos
Los cuentos ayudan a dar sentido al mundo que nos rodea, y esta misma noción es el corazón palpitante del uso de datos para contar una historia.
Según un estudio realizado por Skyword, el contenido que presenta una mezcla de palabras y elementos visuales genera un 34% más de participación que los artículos de solo texto, publicaciones de blog o documentos técnicos. Tiene todo que ganar aprovechando el poder de la visualización de datos, el análisis visual y el uso de una combinación de información relevante para crear una narrativa convincente.
Estos son los beneficios clave de saber cómo contar historias con datos:
- Inclusión: Como se mencionó, a un nivel fundamental, las historias nos ayudan a dar sentido a un mundo complejo y ocasionalmente desconcertante. Al utilizar las herramientas adecuadas de narración de datos para medir, rastrear y extraer datos relevantes y colocarlos en un formato visual que se ajuste a una narrativa basada en objetivos comerciales específicos, hará que su información analítica sea accesible para un público más amplio. Al hacerlo, podrá compartir mensajes importantes de una manera que inspire, alentando la aceptación de las partes o partes interesadas adecuadas como resultado.
- Decisión: Al contar una historia de datos a través de un potente software de panel de KPI, podrá impulsar una mejor toma de decisiones en toda la organización en varias áreas críticas del negocio. Si su audiencia, ya sea interna o externa a la organización, puede seguir una narrativa y extraer la información correcta de su presentación, obtendrán la información que necesitan para basar sus estrategias en datos herméticos, haciendo que la organización sea más eficiente, económica y exitosa en su conjunto.
- Organización: En un mundo dominado por los datos, saber qué ideas explorar puede resultar desalentador. Pero al trabajar con las herramientas adecuadas de narración de datos, no solo es posible simplificar el proceso de análisis, sino que también obtendrá la capacidad de organizar sus datos de una manera que sea efectiva, eficiente y, en última instancia, le ahorre tiempo. Como sin duda sabes, en los negocios, el tiempo es dinero.
- Acción: Si cuentas historias con datos y adaptas tus presentaciones a tu público objetivo, obtendrás resultados procesables. Si la persona se inspira en lo que tienes que mostrarle, y lo entiende en un nivel profundo y significativo, actuará de la manera deseada. Por ejemplo, si su audiencia es interna, pueden formular una iniciativa que ayude a mejorar los esfuerzos de marketing de la empresa. O, si está presentando a las partes interesadas externas a través de la narración de historias con datos, puede pedirles que aumenten su inversión.
«La narración de historias es la actividad humana esencial. Cuanto más difícil es la situación, más esencial es». – Tim O’Brien, autor
How To Tell Stories With Your Data?
It’s clear that storytelling with data is powerful. To place the notion of knowing how to tell stories with data into practical perspective, here we look at a mix of data storytelling examples or concepts, backed with actionable advice as well as genuine data storytelling templates.
a) Turn metrics into actionable concepts
Como hemos explorado, saber cómo contar una historia con datos le permitirá convertir las métricas en conceptos o ideas procesables.
Una de las formas más efectivas de transformar los datos cuantitativos en una narrativa basada en resultados es trabajar con indicadores clave de rendimiento (KPI).
Al aprovechar el poder de un panel interactivo de inteligencia empresarial (BI), podrá seleccionar los KPI que se alinean con sus objetivos comerciales principales, utilizando la combinación perfecta de gráficos, tablas y elementos visuales para crear una narrativa que dé vida a sus datos.
Para sumergirse en la piel de este concepto más valioso, lea nuestra guía para la presentación del tablero basado en datos.
b) Mejorar los procesos con trazado
Toda historia sólida, independientemente de su temática o formato, tiene una trama definitiva: un principio, un medio y un final.
Mediante el uso de plantillas, herramientas y plataformas de narración de datos, puede rellenar su trama con las visualizaciones que impulsarán la narrativa hacia adelante mientras transmite su mensaje de la manera más efectiva posible.
Para mejorar sus procesos con el trazado, debe sentarse en un entorno de colaboración y considerar el objetivo principal de su historia basada en datos mientras describe el principio, el medio y el final.
Con su marco firmemente establecido, debe comenzar a llenar su trama con los KPI y visualizaciones que no solo representan lo que tiene que decir, sino que también son más relevantes para los datos que desea presentar.
Al trabajar a través de su trama de manera lógica y desarrollarla con las visualizaciones correctas desde su tablero, ayudará a optimizar los procesos dentro de su organización, aumentando la eficiencia y la productividad como resultado.
c) Simplificar y hacer conexiones
Si su negocio está informado, bien engrasado y estratégico en todos los ámbitos, crecerá, evolucionará y aumentará sus ganancias con el tiempo.
Al aprovechar el poder de la narración de historias a través de los datos, podrá conectar los puntos, simplificar las ideas y hacer el tipo de conexiones que le darán a su negocio un nuevo sentido de dirección estratégica.
Para obtener el máximo beneficio de sus esfuerzos de narración de datos, debe centrarse en crear un diálogo interactivo entre sus conocimientos y su audiencia, utilizando una combinación de datos históricos, en tiempo real y predictivos para llevar su mensaje a casa, ya sea para procesos de informes financieros o desarrollo estratégico de la empresa.
Además, debe crear un equilibrio o armonía entre sus palabras y sus imágenes para que sea más fácil para su audiencia hacer las conexiones necesarias que resultarán en acciones que mejoren el negocio.
La forma más poderosa de narrativas creativas basadas en datos que simplifican las ideas es adoptar un enfoque de «narración de historias con visualización de datos» para sus esfuerzos. Ahora, vamos a explorar este concepto invaluable en acción.
Contar historias a través de la visualización de datos
Contar historias con datos a través de la visualización de datos es la mejor manera de compartir historias con su audiencia. Es el pegamento que une todas las ideas que hemos mencionado hasta ahora.
Para demostrar el poder de la narración de historias con visualización de datos, aquí hay dos imágenes sorprendentemente diferentes pero igualmente poderosas utilizadas para construir una narrativa efectiva con sus ideas.
Ejemplo de panel de rendimiento de empleados
KPI destacados:
- Tasa de absentismo
- Horas extras
- Costos de capacitación
- Productividad de los empleados
Utilizado principalmente para optimizar los departamentos de recursos humanos ocupados, este panel de recursos humanos que se centra en el rendimiento de los empleados presenta una combinación de KPI que construyen un perfil integral en torno a las tasas de asistencia, la productividad individual, los costos de capacitación y las horas extras acumuladas.
**click to enlarge**
It’s possible to use this dynamic mix of charts, graphs, and graphical information by utilizing HR analytics tools, and build an effective narrative relating to employee performance over a particular time frame, creating a compelling plot that will lead to increased productivity and enhanced economic efficiency as well as and support strategies that will boost staff engagement exponentially.
Al mirar este panel y los KPI de recursos humanos relacionados, es fácil ver cómo podría construir una trama en torno a esta tormenta perfecta de información. Junto con las visualizaciones de datos presentadas en los paneles de control relacionados basados en recursos humanos, las posibilidades son aparentemente infinitas; desde la creación de informes efectivos de recursos humanos hasta la obtención de una visión panorámica de todos los procesos y desarrollo de los recursos humanos.
KPI de tasa de cumplimiento
Un valioso KPI basado en el cumplimiento en todas las industrias, esta combinación dinámica de gráficos ofrece una instantánea panorámica de las tasas de cumplimiento de los proveedores durante un período de tiempo particular.
Un componente clave de nuestro panel de control de adquisiciones, el KPI de tasa de cumplimiento es un excelente ejemplo de cuán poderosa puede ser una visualización individual para comunicar información vital y cómo puede encajar en una narrativa más amplia.
Es posible colocar este KPI en el corazón de una historia que rodea las estructuras, el éxito y los procesos de adquisición, ofreciendo un desglose del cumplimiento por proveedor, además de la tasa general de éxito de cumplimiento de la empresa.
Conectado con una combinación personalizada de nuestros 10 principales KPI de adquisición adicionales, es posible desarrollar una historia que ayude a transmitir tendencias clave, conectar puntos organizacionales y compartir información procesable que impulse un cambio real. Un excelente ejemplo de informe de negocios de narración de datos en acción.
Por Sandra Durcevic en Análisis de datos