06/12/2022
Alguna vez referido como fuente de datos o base de datos en el contexto de Tableau contiene los datos usados para construir visualizaciones.
Todas las visualizaciones tienen como fundamento un dataset que proporciona los datos.
Hojas de cálculo: Excel, Google sheet, .csv
Relational Database: MySQL, Postgres
Cloud data: S3 amazon, azure
Otros tipos de conexión:
archivos espaciales: .kml, .shp
archivos estadísticos
los campos de datos son asignados a un rol y un tipo
Rol | Tipo |
---|---|
un campo puede ser asignado a un rol de dimensión o un rol de ´medida´ | si el tipo de dato del campo es: cadena, entero, fecha, decimal. |
un campo, o columna, es una sola pieza de información de un registro en un dataset.
Nombre | Modo de transporte | Días por semana |
---|---|---|
Neil | Caminar | 2 |
Neil | Bus | 3 |
Lin | Bicicleta | 1 |
Lin |
Automóvil | 3 |
Lin | Bus | 1 |
Mae | Automóvil | 2 |
Mae | Bicicleta | 3 |
campos
.Medidas
, y los campos cualitativos son referidos como Dimensiones
Los tipos de datos pueden ser cambiados por el usuario y todos los cambios son mapeados por tableau en un archivo .tds (tableau data source)
Las dimensiones
y medidas
son los bloques de construcción de las gráficas de Tableau.
Campos Cualitativos (Dimensiones ) |
Campos Cuantitativos (Medidas ) |
---|---|
Describe o categoriza los datos | Datos numéricos |
Te dice qué, cuándo, o quién | Provee la medida para la categoría cualitativa |
Divide los datos cuantitativos | Puede ser usada en las calculaciones |
Tableau asigna los campos del dataset como Dimensión
o Medida
:
las Dimensiones
en la parte superior del panel en azul
las Medidas
en la parte inferior del panel en verde
Mover dimensiones y medidas dentro y fuera de la vista cambia el gráfico resultante. Es una forma útil de ver diferentes aspectos de losdatos y ayuda a descubrir las tendencias y las historias que afectan según el contexto.
¿qué contiene? puede ser complejo
Nombre | Modo de transporte | Días por semana |
---|---|---|
Neil | Caminar | 2 |
Neil | Bus | 3 |
que pasa si quieres saber …
¿cuántas personas usan multiples modos de transporte?
¿cómo son las idas al trabajo con las vueltas al trabajo?
¿cuánto duran?
¿cuánto es la distancia de cada viaje?
Nombre | Viaje | Inicio del viaje | Fin del viaje | Fecha | Modo | Km. estimad. |
---|---|---|---|---|---|---|
Mae | Al trabajo | 7:45 am | 8:50 am | 7/17/2019 | Bicycle | 9 |
Mae | Del trabajo | 5:15 pm | 5:45 pm | 7/17/2019 | Bus | 6 |
Mae | Del trabajo | 5:45 pm | 6:15 pm | 7/17/2019 | Bicycle | 3 |
En este dataset una fila es más detallada y granular que en el primero.
la granularidad se refiere al nivel de detalle para una pieza de datos. Cuando los datos sea menos granulares, los describiremos como agregaciones o datos agregados.
De forma predeterminada, las medidas que se colocan en una vista se agregan por SUMA, lo que significa que se combinan los datos de ese campo en todas las filas.
Las medidas
también se pueden agregar como promedio, mediana, conteo, conteo distinto, máximo y mínimo.
Las dimensiones
desglosan el total agregado en totales más pequeños por categoría.
Las píldoras azules son discretas y las píldoras verdes son contínuas
cambiar una a otra
aplicados al color, en filtro
Largo:
Cuantitativo:
Cualitativo:
Ancho
Cuantitativo: Limitado
Cualitativo: Pobre
Posición
Cuantitativo: Excelente
Cualitativo: Pobre
Tono de Color
Cuantitativo: Pobre
Cualitativo: Excelente
Ventas
por ganancias
como ratio:
Dato tabulares planos
comparar valores altos y bajos, entre diferentes columnas y hojas
color a los negativos … ¿eso estamos buscando?
largo de la barra con las ventas
y color para las ganancias
altas ventas, bajas ganancias
Una gráfica bien diseñada debería ser fácil de leer y entender, y no debe despistar (extraviar).
¿qué representa el gráfico? ¿el gráfico y el título tienen un propósito? ¿entiendes su intención en poco tiempo?
¿este gráfico muestra algún patrón o tendencia en particular? ¿alguna temporalidad? ¿tiene outliers? ¿se deben revisar?
¿esta mostrando todos los datos? ¿hay data excluida? ¿se puede responder las preguntas?
¿es claro lo que ha sido medido, y lo que los números representan? hay leyendas, notas.
Y la pregunta del millón: ¿se puede recolectar datos útiles y accionables de este gráfico?
Línea: ver tendencias en los datos a lo largo del tiempo. Ejemplos: cambio en el precio de las acciones durante un período de cinco años o visitas a la página del sitio web durante un mes. |
Barra: compara datos entre categorías. Ejemplos: Volumen de camisas en diferentes tallas, o porcentaje de gasto por departamento. |
Mapa de calor: muestra la relación entre dos factores. Ejemplos: análisis de segmentos del mercado objetivo o oportunidades de ventas por representante individual. |
Resaltar tabla: muestra información detallada sobre mapas de calor. Ejemplos: el porcentaje de un mercado para diferentes segmentos o números de ventas en una región. |
Diagrama de árbol: muestra datos jerárquicos como una proporción de un todo. Ejemplos: uso de almacenamiento en equipos informáticos, comparación de presupuestos fiscales entre años. |
Gantt: muestra la duración en el tiempo. Ejemplos: línea de tiempo del proyecto, duración del uso de una máquina, disponibilidad de jugadores en un equipo. |
Viñeta: evalúe el rendimiento de una métrica frente a un objetivo. Ejemplos: evaluación de la cuota de ventas, espectro de desempeño (excelente/bueno/malo). |
Diagrama de dispersión: investigue las relaciones entre valores cuantitativos. Ejemplos: Probabilidad masculina versus femenina de tener cáncer de pulmón a diferentes edades, o patrones de compra de teléfonos inteligentes de los primeros usuarios de tecnología y los rezagados. |
Histograma: comprenda la distribución de sus datos. Ejemplos: número de clientes por tamaño de empresa, desempeño de los estudiantes en un examen, frecuencia de un producto defectuoso. |
Mapas de símbolos: se utilizan para totales en lugar de tasas. Tenga cuidado, ya que las pequeñas diferencias serán difíciles de ver. Ejemplos: Número de clientes en diferentes geografías. |
Mapas de área: use para tasas en lugar de totales. Utilice una base geográfica sensata. Ejemplos: tasas de uso de Internet en ciertas geografías, precios de la vivienda en diferentes barrios. |
Caja y bigotes: muestra la distribución de un conjunto de datos. Ejemplos: comprender sus datos de un vistazo, ver cómo los datos están sesgados hacia un extremo, identificar valores atípicos en sus datos. |
Usado para comparar datos entre categorías. Al hacerlo bien son fácil de leer e interpretar.
el largo de las barras indican que categoría tiene el valor más alto
Los ejes del gráfico de barras indican que respresenta el valor
Son muy útiles para ver cambios en los datos en el tiempo.
¿cuándo las tendencias suben y bajan?
¿alguno de estos datos te sirven para identificar tendencias futuras?
toma atención a los ejes. ¿cuál es el rango típico del rango de valores? ¿son los intervalos uniformes?
¿cuál es la linea de tiempo: diaria, mensual, anual? ¿muestra el detalle adecuado para analizar?
Útiles cuando se quiere ver las relaciones entre 2 medidas o valores cuantitativos. ¿Hay alguna correlación? ¿hasta que punto?
Si consideramos el diagrama de dispersión:
¿para el usuario final estará interesado en si una variable incrementa o decrementa con los cambios en otra variable?
¿será útil ver si el cambio en una variable afecta a otra?, y que efecto es ese?
¿cuán cerca le sigue un cambio de una variable a otra?
La división espacial de Bolivia (ABE) lo contrató recientemente como nuevo analista de datos. Una de sus primeras responsabilidades es analizar datos sobre meteoritos. En su reunión inicial, revisó los datos y discutió lo que querían lograr. Durante esta conversación, revelaron que querían localizar meteoritos recientes que hayan caído a la tierra.
El objetivo de este proyecto es explorar los datos, decidir qué historia debe contar su análisis y organizar adecuadamente los datos.
El proyecto se divide en tres partes. La primera parte: exploración de datos se detalla a continuación.
Fuente de datos: Nasa - Aterrisajes de meteoritos
Mire los datos, y responda a las siguientes preguntas en un informe
¿cuáles son las dos variables que encuentra críticas para el análisis?
¿Podemos usar los datos para mapear dónde ha caído cada meteorito?
Si esto es posible, ¿qué campo de datos es crítico para esto?
¿Hay algún cambio en los datos que haría esto posible?
¿Podemos determinar los meteoritos más grandes que han caído a la Tierra?
Cada columna en el conjunto de datos fue creada inicialmente por un programa de computadora. ¿Estos nombres parecen correctos? ¿Ves algún problema que debería solucionarse?
La segunda parte: comprender los tipos de datos se detalla a continuación.
Copie la tabla a continuación e incluyalá en el documento informe.
Utilizando los datos proporcionados, organice cada tipo de datos en una de las siguientes categorías: Cualitativo y Cuantitativo.
Para los datos cuantitativos, resalte los valores discretos en azul y los valores continuos en verde.
Cualitativos | Cuantitativos |
---|---|
A continuación se detalla la tercera parte: cómo preparar sus datos.
En Tableau
realice las siguientes acciones para preparar datos y saque capturas.