En Tableau combine varias tablas para el análisis con las relaciones

Con la reciente versión de Tableau 2020.2, hemos introducido algunas nuevas capacidades de modelado de datos, con las relaciones. Las relaciones son una forma fácil y flexible de combinar datos de varias tablas para su análisis. Las relaciones se definen en función de los campos coincidentes, de modo que, durante el análisis, Tableau aporte los datos correctos de las tablas correctas en la agregación correcta, lo que le permite controlar el nivel de detalle. Un origen de datos con relaciones actúa como un origen de datos personalizado para cada visualización, pero solo se compila una vez.

Las relaciones pueden ayudarle de tres maneras clave:

  1. Menos preparación inicial de datos: Con las relaciones, Tableau combina automáticamente solo las tablas relevantes en el momento del análisis, preservando el nivel de detalle adecuado. ¡No más pre-agregación en vistas SQL o de base de datos personalizadas!
  2. Más casos de uso por fuente de datos: El nuevo modelo de datos lógicos de varias tablas de Tableau significa que puede conservar todos los registros detallados de varias tablas de hechos en una única fuente de datos. Diga adiós a diferentes orígenes de datos para diferentes escenarios; las relaciones pueden manejar modelos de datos más complejos en un solo lugar.
  3. Mayor confianza en los resultados: Aunque las uniones pueden filtrar datos, las relaciones siempre conservan todas las medidas. Ahora valores importantes como el dinero nunca pueden desaparecer. Y a diferencia de las uniones, las relaciones no duplicarán sus problemas duplicando los datos almacenados en diferentes niveles de detalle.

Las 8 Rs de la semántica de la relación

Tableau necesita reglas a seguir (semántica) para determinar cómo consultar datos. Las relaciones tienen dos tipos de comportamiento semántico:

  1. Agregaciones inteligentes: Las medidas se agregan automáticamente al nivel de detalle de su tabla de origen previa a la unión. Esto difiere de las uniones, donde las medidas olvidan su fuente y adoptan el nivel de detalle de la tabla posterior a la unión.
  2. Combinaciones contextuales: Los valores no coincidentes se controlan individualmente por visualización, por lo que una sola relación admite simultáneamente todos los tipos de combinación (interno, izquierdo, derecho y completo)

Con las combinaciones contextuales, el tipo de combinación se determina en función de la combinación de medidas y dimensiones en la visualización y sus tablas de origen. La figura siguiente ilustra las 8 R de la semántica de relación, con comportamientos de agregación inteligentes en púrpura y comportamiento de combinación contextual en azul.

image 1 5

Una nota rápida antes de profundizar:Los ejemplos siguientes se basan en un conjunto de datos de librería. Si desea seguir el seguimiento en Tableau Desktop, puede descargar el libro de trabajo de Tableau aquí.

image10

 

Interpretar los resultados del análisis en varias tablas relacionadas

Tableau solo extrae datos de las tablas que son relevantes para la visualización. Cada ejemplo muestra el subgráfico de tablas unidas para generar el resultado.

Los dominios completos permanecen para las dimensiones de una sola tabla

image1 29
 

Analizar el número de libros del autor muestra a todos los autores, incluso aquellos sin libros.

gif 1 0
 

Si todas las dimensiones proceden de una sola tabla, Tableau muestra todos los valores del dominio, incluso si no existen coincidencias en las tablas de medida.

Representar medidas sin igual como ceros

image2 26
 

Agregar Suma de desprotecciones en la visualización muestra una medida nula para los autores sin libros, a diferencia de la agregación de recuento que representa automáticamente los valores NULL como ceros.

gif 2 0
 

Envolver el SUM en la función ZN representa valores NULL no coincidentes como ceros.

Los dominios relevantes se muestran para las dimensiones de las tablas

image3 16
 

Tableau muestra a los autores con premios, excluyendo a los autores sin premios y premios que ningún autor ganó, si existe.

gif 3 0
 

La combinación de dimensiones entre tablas muestra las combinaciones que existen en los datos.

Los valores de medida sin igual siempre se conservan

image5 5
 

Al añadir la medida Recuento de libros, se muestran todos los libros por autor y premio. Dado que algunos libros no ganaron ningún premio, aparece un nulo que representa libros sin premios.

gif 4 0
 

La regla de oro de las relaciones que le permitirá generar cualquier tipo de combinación es que siempre se conservan todos los registros de las tablas de medida.

Tenga en cuenta que una propiedad emergente de combinaciones contextuales es que el conjunto de registros de la visualización puede cambiar a medida que agrega o quita campos. Si bien esto puede ser sorprendente, en última instancia sirve para promover una comprensión más profunda en sus datos. Los valores nulos a menudo se descartan prematuramente, ya que muchos usuarios los perciben como «datos sucios». Aunque esto puede ser cierto para los valores NULL que se derivan de los valores que faltan, los valores NULL no coincidentes clasifican los subconjuntos interesantes en la sección externa de una relación.

Recuperación de valores inigualables con medidas

image6 6
 

La visualización anterior mostró a los autores que tienen libros. Al añadir la medida Recuento de autor a la visualización, se muestran todos los autores, incluidos los que no tienen libros.

gif 5
 

Dado que Tableau siempre conserva todos los valores de medida, puede recuperar dimensiones inigualables agregando una medida de su tabla a la visualización.

Eliminación de valores inigualables con filtros

image4 10
 

La combinación de la calificación media por título de libro y género muestra todos los libros, incluidos aquellos sin calificaciones, según la propiedad «permanecer» del primer ejemplo. Para ver solo libros con clasificaciones, filtre el Recuento de calificaciones para que sea mayor o igual a 1.

gif 6
 

Es posible que se pregunte «¿por qué no excluir calificaciones nulas?» Filtrar el recuento de calificaciones, como arriba, elimina los libros sin calificaciones, pero conserva las opiniones que pueden carecer de una calificación . Excluir null quitaría ambos, porque los valores NULL no distinguen entre los valores que faltan y los valores no coincidentes.

Las relaciones posponen la elección de un tipo de combinación hasta el análisis; aplicar este filtro equivale a establecer una combinación correcta y dejar caer libros intencionalmente sin clasificaciones. No especificar un tipo de combinación desde el principio permite un análisis más flexible.

Las agregaciones se resuelven según el nivel de detalle nativo de la medida, y las medidas se replican a través de niveles más bajos de detalle en la visualización
image7 5
 

Cada libro tiene un autor. Un libro puede tener muchas calificaciones y muchas ediciones. Las reseñas se dan para el libro, no para la edición, por lo que la misma calificación se puede contar con varias ediciones. Esto significa que efectivamente hay una relación de varios a varios entre las calificaciones y las ediciones.

Observe a Bianca Thompson, ya que todos sus libros fueron publicados en tapa dura, mientras que sólo algunos fueron publicados en otros formatos, el número de reseñas para sus publicaciones en tapa dura es igual al número total de reseñas para sus libros.

gif 7
 

Mediante combinaciones, las clasificaciones se replicarían en todas las ediciones del origen de datos. El recuento de clasificaciones por autor mostraría el número de clasificaciones multiplicado por el número de ediciones para cada libro, un número sin sentido.

Con las relaciones, la replicación solo se produce en el contexto específico de una medida que se divide por dimensiones con las que tiene una relación de varios a varios. Puede ver que el subtotal se resuelve correctamente en el nivel de detalle Autores, en lugar de mostrar incorrectamente una suma de las barras.

Consejo: Las marcas vacías y los valores NULL no coincidentes son diferentes

Los registros incluidos en la visualización anterior son todos los libros con clasificaciones,según la propiedad ‘retener todos los valores de medida’. Para ver todos los libros debemos añadir una medida de la tabla Libros.

Añadir Count of Books a las columnas presenta a Robert Milofsky, un autor que tiene un libro inédito sin calificaciones. Para representar ninguna calificación con ceros, puede intentar ajustar la medida en ZN. Puede ser sorprendente que no aparezcan ceros, esto se debe a que la medida no es una nula sin igual; falta la marca.

gif 8
 

Tableau genera una consulta por tarjetas de marcas y une los resultados en los encabezados de dimensión.

image 2 3
 

Para mostrar el número de calificaciones de Robert Milofsky como cero, los registros representados por esa tarjeta de marcas deben ser todos los libros. Esto se logra agregando la tarjeta Recuento de libros al recuento de marcas de calificaciones.

image8 3

 

Más información sobre las relaciones

Las relaciones son la nueva forma predeterminada de combinar varias tablas en Tableau. Las relaciones abren mucha flexibilidad para las fuentes de datos, al tiempo que alivian muchas de las tensiones de la administración de combinaciones y niveles de detalle para garantizar un análisis preciso.

Traducido de Blog de Tableau y poducido por:

Canales de Youtube para aprender sobre Data Science : Tableau , Power BI, Machine Learning

Power BI : 10 aplicaciones alternativas gratuitas para crear Dashboards

Gobierno de Datos : DAMA, DMBok 2 y Big Data