Para Power BI o Tableau un Data Set se trata de una colección de datos que se encuentra habitualmente tabulada, los sitios abajo detallados nos pueden servir para desarrollar nuestros Dashboards en Power BI – Tableau – Microstrategy u otro.Algunos profesionales recomiendan comenzar a utilizar estos conjuntos de datos gratuitos para empezar a aprender a analizar datos, crear visualizaciones de datos o simplemente mejorar las habilidades de alfabetización de datos.
En esta base de dato se pueden visualizar todos los datos públicos recolectados por las Naciones Unidas.
Data de ejemplo :
Country: Peru
Country: Peru
Country: Peru
Country: Peru
Esta es la base de datos del Banco Mundial, pero no solo se puede acceder a datos relacionados con la economía de los países. También, poseen otra gran cantidad de datos relacionados con la salud, educación o ciencia y tecnología.
Aquí podemos encontrar todos los datos públicos que recoge nuestro gobierno. La mayoría de los países comparten sus datos, así que también es otra forma de acceder a data sets gratuitos.
Google no podía faltar en la lista. A través de esta web ofrece los datos que se pueden encontrar en otros data sets, pero no deja de ser interesante buscar algunas veces colecciones de datos aquí.
Está dentro de GitHub y a través de esta web puede encontrar un montón de data set que ofrecen otras organizaciones. Hay cualquier tipo de tema desde agricultura hasta neurociencia.
Se patrocinan así mismos como el mayor data set de empresas, y podría ser así ya que puedes encontrar datos de cualquier empresa del mundo. Aunque, en esta si es necesario registrarse para acceder a la información.
Este data set es muy útil sobre todo para los profesionales de marketing, ya que a través de él puedes obtener información de otros usuarios y creadores de Instagram o medir la interacción con el perfil.
Como muchas otras organizaciones, la OMS también comparte los datos públicos que obtiene de todos los países. Se pueden encontrar datos sobre salud infantil, medicamentos esenciales, covid-19, malaria, etc.
La misión de Open AQ es luchar contra la contaminación del aire. Por eso, en su web ofrecen un data set de datos físicos de calidad del aire de fuentes de datos públicas proporcionadas por el gobierno y otras fuentes.
El último, y no por ello menos importante, es FiveThirthyEight. En esta web recogen datos que utilizan para hacer análisis y contar historia, después comparten todos los datos que han recogido para ser totalmente transparentes.
La publicación se tomo de Big Data Magazine.
Asimismo recomendamos los propuestos por Tableau
Seleccionado por: Google
Ejemplo de conjunto de datos: Resultados de la búsqueda de «Cupcake”
Éste es uno de los conjuntos de datos públicos más amplios e interesantes para analizar. El vasto motor de búsqueda de Google rastrea los datos de términos de búsqueda para mostrarnos qué buscan las personas y cuándo. Puedes explorar estadísticas sobre el volumen de búsqueda para casi cualquier término de búsqueda desde 2004. Ingresa cualquier término de búsqueda, o un puñado de términos de búsqueda, y haz clic en el botón de descarga para analizar los datos fuera del sitio web de tendencias.
Existe una gran variedad de filtros para reducir las tendencias según la ubicación (en todo el mundo o por país), varios rangos de tiempo, categorías o incluso tipos de búsqueda específicos (resultados de búsqueda web vs imagen vs YouTube). Puedes ver fácilmente qué temas son populares en este momento y cuáles son las tendencias actuales en la página de inicio de Trends. Google también destaca varios ejemplos interesantes de tendencias con datos visuales en esa página de inicio.
Si estás interesado en obtener más datos de Google, consulta Google Finance, Google Public Data y Google Scholar.
Seleccionado por: Centros nacionales de información ambiental (antes NOAA)
Ejemplo de conjunto de datos: Datos climáticos locales (LCD)
Si lo que te interesa es el clima y la ciencia climática es difícil encontrar más detalles que en el National Climatic Data Center (Centro Nacional de Datos Climáticos). Han hecho un pequeño cambio de marca, fusionando los centros de datos de la Administración Nacional Oceánica y Atmosférica (NOAA) para convertirse en los Centros Nacionales de Información Ambiental (NCEI).
Aquí puedes encontrar un archivo de conjuntos de datos climáticos en los EE. UU., el archivo de datos ambientales más grande del mundo. Es un recurso enorme para todo tipo de datos sobre el clima, incluidos datos meteorológicos, oceánicos, climáticos, atmosféricos y geofísicos.
Seleccionado por: Organización Mundial de la Salud (OMS)
Ejemplo de conjunto de datos: Acceso universal a la salud reproductiva
Como parte de su objetivo central para lograr una mejor información de salud en todo el mundo, la Organización Mundial de la Salud hace públicos sus datos sobre la salud mundial a través del Observatorio Mundial de la Salud (GHO). El GHO actúa como un portal para acceder y analizar situaciones y temas importantes sobre la salud.
Los diversos conjuntos de datos se organizan según temas, como mortalidad, sistemas de salud, enfermedades transmisibles y no transmisibles, medicamentos y vacunas, riesgos para la salud, etc. Las estadísticas de salud de la OMS son una fuente de información de salud global y también se utilizan en el trabajo de los Centros para el Control y la Prevención de Enfermedades de los EE. UU.
Seleccionado por: Gobierno de Singapur
Ejemplo de conjunto de datos: Residentes de Singapur por grupo de edad, grupo étnico y género, fines de junio, anual (2017)
En realidad, existen muchos sitios web de datos gubernamentales excelentes en Internet. La mayoría de ellos son increíblemente ricos en datos e información. Los Estados Unidos tienen uno de los más conocidos en data.gov, y el Reino Unido y Australia también tienen excelentes sitios similares. Con todos ellos, y con grandes muestras de población, tenemos muchos datos a los que podemos acceder. Entonces, ¿por qué Singapur?
Francamente, el sitio web de datos del gobierno de Singapur es muy accesible visualmente. La página de inicio está llena de pequeñas visualizaciones que cuentan historias sobre cada conjunto de datos. Parte de la visualización de datos es asegura que no sólo muestres la información en un formato preciso y relevante, sino que también atraigas el interés. La mayoría de los sitios de datos del gobierno son utilitarios y simples, lo suficiente como para transmitir los datos de una manera fácil de entender. Sin embargo, Singapur lleva esto un paso más allá con visualizaciones coloridas, toques de color en los gráficos y una sección de «conjuntos de datos similares» en la parte inferior de cada conjunto de datos para alentar a los lectores a explorar.
Seleccionado por: NASA
Ejemplo de conjunto de datos: Electricidad atmosférica (relámpagos)
Earthdata es parte del Programa de Sistemas de Datos de Ciencias de la Tierra de la NASA, específicamente el Sistema de Datos e Información del Sistema de Observación de la Tierra (EOSDIS). EOSDIS actúa como un medio para procesar y distribuir datos de ciencias de la Tierra desde satélites de observación de la Tierra, aeronaves y mediciones de campo.
A través de Earthdata, el público puede acceder a los datos, noticias e información sobre eventos de la NASA. Cubre datos de la atmósfera de la Tierra, la radiación solar, la criosfera (áreas árticas/congeladas), el océano, la superficie terrestre (gravedad, geomagnetismo, tectónica) y los entornos humanos.
Seleccionado por: Amazon
Ejemplo de conjunto de datos: 1000 Genomes Project
A medida que más organizaciones ponen sus datos a disposición del público, Amazon ha creado un registro para buscar y compartir esos diversos conjuntos de datos. Hay más de 50 conjuntos de datos públicos admitidos a través del registro de Amazon, que van desde los archivos del IRS hasta las imágenes satelitales de la NASA, la secuenciación del ADN y el rastreo web. Los conjuntos de datos también incluyen ejemplos de uso, que muestran lo que otras organizaciones y grupos han hecho con los datos.
Seleccionado por: Pew Research Center
Ejemplo de conjunto de datos: Adolescentes, redes sociales y tecnología 2018
La misión de Pew Research Center es recopilar y analizar datos de todo el mundo. Abarcan todo tipo de temas como política, redes sociales, periodismo, economía, privacidad en línea, religión y tendencias demográficas. Si bien realizan su propia investigación y análisis no partidista y no de abogacía, también ofrecen sus datos sin procesar para el acceso público. El acceso simplemente requiere un breve registro en el sitio y un crédito para Pew Research Center como la fuente de los datos, con la exención de que Pew no es responsable de las conclusiones alternativas a partir de los datos.
En cierto modo, hacer que los datos sean accesibles también es otro proyecto de investigación para Pew. Ya tienen toda la información sobre cómo usan los datos en su investigación y están interesados en saber cómo otros también usan sus datos. Tienen sólo una petición: contactarlos por correo electrónico si algo se publica como resultado de los datos adquiridos.