“El mayor valor de una imagen es cuando nos hace ver lo que nunca hemos esperado a encontrar”.

1*lmXyzYVicEFSgFJ0tY hQ

¿Qué es la visualización de datos? La visualización de datos e información es un campo interdisciplinario que se ocupa de la representación gráfica de datos e información.

La psicología dice que las representaciones visuales nos ayudan a entender los datos rápidamente. Cuando muestra un gráfico o tabla efectivo, su informe o presentación gana claridad y autoridad, ya sea que esté comparando cifras de ventas o destacando una tendencia.

Cuando la información se representa en forma gráfica, un ser humano puede darse cuenta de tendencias más frecuentes y rápidamente complicadas. Sin embargo, no requiere ninguna habilidad técnica y es fácil de aprender con la ayuda de varias herramientas como Power BITableauetc.

Pero la verdadera pregunta viene ahora: Hay tantos gráficos, entonces, ¿cómo decidimos cuándo usar qué gráfico?

No temas porque te tengo cubierto. Hace unos días, nos pidieron que hiciéramos un proyecto de predicción de AQI basado en ML y tuvimos que usar bibliotecas de Python para hacer las visualizaciones de datos. Estaba en una solución real en cuanto a cuándo usar qué gráfico porque era la primera vez que hacía un proyecto de ML. He adjuntado el enlace del repositorio de Github a mi proyecto:

GitHub – prajuktadey/AQI-Predicción

No puede realizar esa acción en este momento. Ha iniciado sesión con otra pestaña o ventana. Has cerrado sesión en otra pestaña o…

github.com

 

Pasando a la pregunta real, ¿cuándo usar qué gráfico? Bueno, si está más inclinado a trabajar con datos, hay 5 gráficos esenciales que necesita saber y la mayoría de las visualizaciones se realizan utilizando estos gráficos, pero, por supuesto, siempre puede explorar algunos más.

El gráfico más popular es, sí, lo has adivinado bien: Gráficos de barras.

Con los gráficos de barras, puede comparar datos fácilmente. Trabajaremos con tres tipos principales de gráficos de barras.

  1. Gráficos de barras verticales: Los gráficos de barras verticales son muy comunes, pero pierden su comparabilidad si hay más de 7 categorías. Por lo tanto, si está utilizando un gráfico de barras verticales, intente limitar las categorías de datos hasta 7.
1*RVE w8UaHiIoAu4VPjw34w

2. Gráficos de barras horizontales: En caso de que tenga más de 7 categorías, gráficos de barras horizontales si lo suyo. Estos son mejores cuando desea mostrar clasificaciones como los resultados de las elecciones. Las comparaciones realizadas con gráficos de barras horizontales son muy convenientes porque puede comparar elementos incluso con figuras grandes con solo mirarlos.

1*8FBwzU0L1BnnPLlpPgolRQ

3. Gráficos de barras apiladas: puede usar gráficos de barras apiladas si desea mostrar parte a todo, cuántos elementos diferentes contribuyen a ese total general. En palabras más simples, un gráfico de barras apiladas (o gráfico de barras apiladas) es un gráfico que utiliza barras para mostrar comparaciones entre categorías de datos, pero con la capacidad de desglosar y comparar partes de un todo. Cada barra en el gráfico representa un todo, y los segmentos en la barra representan diferentes partes o categorías de ese todo.

Pasando al segundo gráfico popular que es el Histograma.

Los gráficos de barras desglosan los datos por diferentes categorías, los histogramas, por otro lado, muestran la distribución sobre una variable continua, por lo que cosas como el tiempo, la edad, el peso.

En otras palabras, proporciona una interpretación visual de los datos numéricos al mostrar el número de puntos de datos que caen dentro de un rango específico de valores.

Los histogramas son generalmente menos sobre puntos de datos individuales y más sobre el patrón más amplio.

¿Cuál es la diferencia entre los gráficos de barras y los histogramas?

Los gráficos de barras le permiten comparar variables o categorías específicas. Los histogramas le permiten comprender la distribución de variables o la frecuencia de ocurrencias específicas.

1*I35kkTDnrgJF4AOmoZSbkQ

El tercer gráfico más popular es un gráfico circular.

1*Av hzaKlYt8mgopUoOts6Q

Antes de sumergirme en él, solo quería decir que este es el gráfico más odiado por los analistas de datos. Nuestros cerebros no son realmente buenos para medir ángulos y áreas. Los gráficos de barras son mucho mejores que los gráficos circulares en la comunicación de datos.

Los gráficos circulares a menudo distorsionan la información y dificultan que los responsables de la toma de decisiones entiendan los mensajes que contienen.

Pero, en caso de que realmente desee utilizar gráficos circulares para sus visualizaciones, debe seguir ciertas reglas:

un. Nunca use más de 5 puntos de datos porque si lo hace, el gráfico circular se agrupará y no podrá leer sus datos. He adjuntado una imagen de un gráfico circular mal construido a continuación:

1*Rx8pG6enzYHCEY je ALBQ

b. Clasifique los valores en orden donde comienza el segmento más grande en la esquina superior derecha porque leer los datos de los gráficos circulares es lo suficientemente difícil, por lo que queremos que los datos sean fácilmente legibles.

c. Sea creativo y use colores para comunicarse.

4. En 4º lugar, tenemos Diagrama de dispersión.

Si está buscando mostrar la correlación o cómo dos cosas se relacionan entre sí, entonces los gráficos de dispersión son los mejores. Se pueden usar para mostrar si hay una correlación o no hay correlación, para mostrar tendencias de agrupamiento o detectar valores atípicos.

¿Cuándo usar el diagrama de dispersión?

Respuesta: Los gráficos de dispersión se utilizan para trazar puntos de datos en un eje horizontal y vertical en el intento de mostrar cuánto se ve afectada una variable por otra.

Intente usar el diagrama de dispersión cuando la variable independiente tenga varios valores para la variable dependiente.

1*nJVJgsjmkAKTun3wXT11uA
  1. Evite el diagrama de dispersión cuando sus datos no estén en absoluto relacionados.
  2. Evite el diagrama de dispersión cuando tenga grandes conjuntos de datos.
1*4S7a0qqhmmIHD eqpEKlVg

Realmente no puede leer los datos porque hay demasiados puntos de datos aquí.

5. El quinto gráfico más popular es el gráfico de líneas.

1* do0FM6O 6X1zQJrS7HQNw

Si desea mostrar cómo algo cambia con el tiempo, entonces el gráfico de líneas es definitivamente para usted. Los gráficos de líneas se utilizan para realizar un seguimiento de los cambios en períodos de tiempo cortos y largos.

Si tiene datos continuos que le gustaría representar a través de un gráfico, entonces un gráfico de líneas es una buena opción. Este gráfico es especialmente efectivo cuando se trata de identificar una tendencia o patrón en sus datos, por ejemplo, efectos estacionales y grandes cambios a lo largo del tiempo.

1*J2SRUoH myd1hXktuW6Vnw

Como puede ver, estamos aquí analizando la temperatura corporal de Parker. Estamos haciendo un seguimiento de su temperatura durante un corto período de tiempo.

Facilita la previsión o el reconocimiento de patrones.

Prajukta Dey
Prajukta Dey
 

https://medium.com/@theprajuktadey

Ayudamos a las empresas a elevar su valor con el aporte de especialistas en Analítica, 
Diseño y Desarrollo de Soluciones, Control de Calidad y Consultoría Tecnologica.