Table of Contents
ToggleCon la reciente versión de Tableau 2020.2, hemos introducido algunas nuevas capacidades de modelado de datos, con las relaciones. Las relaciones son una forma fácil y flexible de combinar datos de varias tablas para su análisis. Las relaciones se definen en función de los campos coincidentes, de modo que, durante el análisis, Tableau aporte los datos correctos de las tablas correctas en la agregación correcta, lo que le permite controlar el nivel de detalle. Un origen de datos con relaciones actúa como un origen de datos personalizado para cada visualización, pero solo se compila una vez.
Las relaciones pueden ayudarle de tres maneras clave:
Tableau necesita reglas a seguir (semántica) para determinar cómo consultar datos. Las relaciones tienen dos tipos de comportamiento semántico:
Con las combinaciones contextuales, el tipo de combinación se determina en función de la combinación de medidas y dimensiones en la visualización y sus tablas de origen. La figura siguiente ilustra las 8 R de la semántica de relación, con comportamientos de agregación inteligentes en púrpura y comportamiento de combinación contextual en azul.
Una nota rápida antes de profundizar:Los ejemplos siguientes se basan en un conjunto de datos de librería. Si desea seguir el seguimiento en Tableau Desktop, puede descargar el libro de trabajo de Tableau aquí.
Tableau solo extrae datos de las tablas que son relevantes para la visualización. Cada ejemplo muestra el subgráfico de tablas unidas para generar el resultado.
Analizar el número de libros del autor muestra a todos los autores, incluso aquellos sin libros.
Si todas las dimensiones proceden de una sola tabla, Tableau muestra todos los valores del dominio, incluso si no existen coincidencias en las tablas de medida.
Agregar Suma de desprotecciones en la visualización muestra una medida nula para los autores sin libros, a diferencia de la agregación de recuento que representa automáticamente los valores NULL como ceros.
Envolver el SUM en la función ZN representa valores NULL no coincidentes como ceros.
Tableau muestra a los autores con premios, excluyendo a los autores sin premios y premios que ningún autor ganó, si existe.
La combinación de dimensiones entre tablas muestra las combinaciones que existen en los datos.
Al añadir la medida Recuento de libros, se muestran todos los libros por autor y premio. Dado que algunos libros no ganaron ningún premio, aparece un nulo que representa libros sin premios.
La regla de oro de las relaciones que le permitirá generar cualquier tipo de combinación es que siempre se conservan todos los registros de las tablas de medida.
Tenga en cuenta que una propiedad emergente de combinaciones contextuales es que el conjunto de registros de la visualización puede cambiar a medida que agrega o quita campos. Si bien esto puede ser sorprendente, en última instancia sirve para promover una comprensión más profunda en sus datos. Los valores nulos a menudo se descartan prematuramente, ya que muchos usuarios los perciben como «datos sucios». Aunque esto puede ser cierto para los valores NULL que se derivan de los valores que faltan, los valores NULL no coincidentes clasifican los subconjuntos interesantes en la sección externa de una relación.
La visualización anterior mostró a los autores que tienen libros. Al añadir la medida Recuento de autor a la visualización, se muestran todos los autores, incluidos los que no tienen libros.
Dado que Tableau siempre conserva todos los valores de medida, puede recuperar dimensiones inigualables agregando una medida de su tabla a la visualización.
La combinación de la calificación media por título de libro y género muestra todos los libros, incluidos aquellos sin calificaciones, según la propiedad «permanecer» del primer ejemplo. Para ver solo libros con clasificaciones, filtre el Recuento de calificaciones para que sea mayor o igual a 1.
Es posible que se pregunte «¿por qué no excluir calificaciones nulas?» Filtrar el recuento de calificaciones, como arriba, elimina los libros sin calificaciones, pero conserva las opiniones que pueden carecer de una calificación . Excluir null quitaría ambos, porque los valores NULL no distinguen entre los valores que faltan y los valores no coincidentes.
Las relaciones posponen la elección de un tipo de combinación hasta el análisis; aplicar este filtro equivale a establecer una combinación correcta y dejar caer libros intencionalmente sin clasificaciones. No especificar un tipo de combinación desde el principio permite un análisis más flexible.
Cada libro tiene un autor. Un libro puede tener muchas calificaciones y muchas ediciones. Las reseñas se dan para el libro, no para la edición, por lo que la misma calificación se puede contar con varias ediciones. Esto significa que efectivamente hay una relación de varios a varios entre las calificaciones y las ediciones.
Observe a Bianca Thompson, ya que todos sus libros fueron publicados en tapa dura, mientras que sólo algunos fueron publicados en otros formatos, el número de reseñas para sus publicaciones en tapa dura es igual al número total de reseñas para sus libros.
Mediante combinaciones, las clasificaciones se replicarían en todas las ediciones del origen de datos. El recuento de clasificaciones por autor mostraría el número de clasificaciones multiplicado por el número de ediciones para cada libro, un número sin sentido.
Con las relaciones, la replicación solo se produce en el contexto específico de una medida que se divide por dimensiones con las que tiene una relación de varios a varios. Puede ver que el subtotal se resuelve correctamente en el nivel de detalle Autores, en lugar de mostrar incorrectamente una suma de las barras.
Los registros incluidos en la visualización anterior son todos los libros con clasificaciones,según la propiedad ‘retener todos los valores de medida’. Para ver todos los libros debemos añadir una medida de la tabla Libros.
Añadir Count of Books a las columnas presenta a Robert Milofsky, un autor que tiene un libro inédito sin calificaciones. Para representar ninguna calificación con ceros, puede intentar ajustar la medida en ZN. Puede ser sorprendente que no aparezcan ceros, esto se debe a que la medida no es una nula sin igual; falta la marca.
Tableau genera una consulta por tarjetas de marcas y une los resultados en los encabezados de dimensión.
Para mostrar el número de calificaciones de Robert Milofsky como cero, los registros representados por esa tarjeta de marcas deben ser todos los libros. Esto se logra agregando la tarjeta Recuento de libros al recuento de marcas de calificaciones.
Las relaciones son la nueva forma predeterminada de combinar varias tablas en Tableau. Las relaciones abren mucha flexibilidad para las fuentes de datos, al tiempo que alivian muchas de las tensiones de la administración de combinaciones y niveles de detalle para garantizar un análisis preciso.
Traducido de Blog de Tableau y poducido por:
Canales de Youtube para aprender sobre Data Science : Tableau , Power BI, Machine Learning
Power BI : 10 aplicaciones alternativas gratuitas para crear Dashboards