Analítica y Visualización de Datos, Aplicaciones - II/2022

Actualizado al 20/Dic/2022

Hola y bienvenidos al Módulo 5. Analítica y Visualización de Datos - Aplicaciones. Este curso va a introducir a los estudiantes en análisis y visualización de datos. Iniciando con los fundamentos de visualización, posteriormente utilizando herramientas de analítica y visualización de datos, para finalmente concluir el módulo con aplicaciones de analítica y visualización de datos.

Datos Generales

Institución: Universidad Mayor de San Simón - Postgrado Universidad Mayor de San Simón
Programa: Diplomado en Estadística Aplicada a la Toma de Decisiones, primera versión.
Módulo V: Analítica y Visualización de Datos, Aplicaciones
Gestión: II/2022
Carga horaria: 120 horas ( 40 horas síncronas, 80 horas asíncronas)
Docente: Rolando Amir Mirabal Hinojosa

Justificación

Con la gran cantidad de datos generados hoy en día, y la necesidad del negocio de sacarles provecho se requiere elaborar análisis y visualizaciones que reflejan los datos con precisión, cuenten una historia y sean elaborados profesionalmente. El objetivo es trasladar datos complejos, de alto volumen o numéricos a una representación visual más fácil de procesar, que permitan descubrir, interpretar y transmitir patrones importantes presentes en los datos. Estas visualizaciones que deben apuntar a ser una herramienta para la toma de decisiones con datos.

Este curso va a introducir a los estudiantes en análisis y visualización de datos. Iniciando con los fundamentos de visualización, posteriormente utilizando herramientas de analítica y visualización de datos, para finalmente concluir el módulo con aplicaciones de analítica y visualización de datos.

Cronograma

Fechas de Clases

Cronograma General

Descripción Nombre de la Unidad N° de sesiones
UNIDAD I Fundamentos de Analítica y Visualización de los Datos 3
UNIDAD II Utilizando Herramientas de Analítica y Visualización de Datos 4
UNIDAD III Aplicaciones de Analítica y Visualización de Datos 3
TOTAL 10

Cronograma por Sesión

Unidad Diapositivas Título Enlace
1 1 Analítica y Visualización de Datos 🖥️
1 2 Fundamentos de Analítica y Visualización de Datos II 🖥️
1 3 Fundamentos de Analítica y Visualización de Datos III 🖥️
2 1 Tableau para analítica y visualización de datos I 🖥
2 2 Tableau para analítica y visualización de datos II
2 3 Tableau para analítica y visualización de datos III
2 4 Tableau con QGis y R
3 1 Aplicación Geoespacial 🖥
3 2 Aplicación usando APIs
3 3 Aplicación - BigData

Asignaciones del Módulo

El medio utilizado para que el alumno entregue las tareas es classroom.

Sesión Asignación Individual / Grupal Fecha de entrega
1 Tarea 1 - Análisis y Visualización de datos Individual o grupos de hasta 3 personas 1-Dic-2022
1 Tarea 2 - Análisis y Visualización de datos de la encuesta Individual o grupos de hasta 3 personas 3-Dic-2022
2 Quiz Sesión 2 Individual o grupos de hasta 3 personas 3-Dic-2022
2 Tarea 3 - Comparar herramientas de Visualización Individual o grupos de hasta 3 personas 8-Dic-2022
3 Quiz Unidad 1 Individual 12-Dic-2022
4 Ejercicio 1 - Caída de Meteoritos Individual o grupos de hasta 2 personas 9-Dic-2022

Proyectos del Módulo

Proyecto 1 - Datos proporcionados

Modalidad: máximo grupos de 2 personas

Datos Fuente: Publicada en Classroom, se escogió Buenos Aíres y Ciudad de México de: airbnbn data

Fecha de entrega: 25-Dic-2022

Instrucciones:

Los archivos de datos fuente contienen datos de airbnb Buenos Aíres y Ciudad de México:

Archivo Descripción
listing Catálogo de anuncios de alquileres de alojamientos y apartamentos
calendar Tabla calendario de la disponibilidad de un anuncio
reviews Reseñas de los clientes que han alquilado
neighbourgoods.csv Vecindades y grupo de vecindades en la ciudad
neighbourgoods.geojson Vecindades y grupo de vecindades en la ciudad con su polígono
data dictionary Diccionario de datos de airbnb

Se le ha asignado la tarea de crear un libro de trabajo y publicarlo en Tableau Cloud, sin embargo es libre de usar otras herramientas para producir el análisis. Como parte del análisis debe producir una comparación entre las dos ciudades: Buenos Aires y Ciudad de México. Y agregar visualizaciones que vea conveniente. Presentará el tablero al Gerente de airbnb para Iberoamérica y compartirá sus hallazgos desde una perspectiva que ayude a tomar decisiones.

Así muestra los anuncios la página de airbnb:

Detalles

Agregue los archivos de datos a Tableau, asegúrese de realizar los ajustes necesarios para crear las relaciones de dichos archivos. A continuación, genere dashboards e historias, y los detalles de apoyo que considere necesarios compuestos por elementos de su elección del modelo generado previamente. Debe incluir un análisis comparativo entre Ciudad de México y Buenos Aíres.

Tienes licencia completa creativa con este proyecto, se quiere ver qué análisis produce, por ejemplo los mejores anuncios, análisis de las reseñas, análisis de precios, temporadas, entre otros. Finalmente debes grabar un video de máximo de 10 minutos en el cual presentes tu producto final, asumirá que usted(es) presentarán al Gerente de airbnb para Iberoamérica.

Pasos:

  1. Agregue los archivos de datos fuente
  2. Realice cualquier cambio necesario para relacionar los archivos y generar su modelo de datos
  3. Analice los datos visualmente utilizando hojas, dashboards e historias a fin de producir su análisis
  4. Demuestre su análisis y comunique los hallazgos al Gerente de airbnb en el video (máximo 10 minutos)
  5. Publique su Análisis en tableau Cloud en el proyecto “Proyecto I” con el apellido o los apellidos en la descripción del dashboard, use el título más apropiado para su análisis
  6. Suba la grabación al classroom

Extra.- en caso que quieran agregar datos de otras fuentes y utilizarla en el análisis puede agregarlo con total libertad. Estas otras fuentes pueden ser por ejemplo datos del censo, puntos de interés (parques, comercios, etc.), rutas de movilidad, datos estadísticos, entre otros.

Evaluación: Se evaluará cómo produjo tanto el modelo de datos como el libro de trabajo publicado, el análisis desarrollado, y qué funcionalidades demuestra y cómo la demuestra a su público objetivo.

Proyecto 2 - Datos proporcionados

Modalidad: máximo grupos de 2 personas

Fecha de entrega: 30-Dic-2022

Intrucciones:

  1. El punto de partida es el análisis del Proyecto 1 y expandirlo.
  2. Añadir dnsidad poblacional de Facebook en .shp (fuende de datos en classroom de Buenos Aires y Ciudad de México) al modelo y realizar un análisis con la densidad poblacional, utilizar ratios o factores con los datos existentes del Proyecto 1.
  3. Agregar puntos de interés al análisis (al menos 2 por cada ciudad), ya sea incluyéndo o no en el dataset, es decir una fuente de datos separada. Este siguiente análisis debe añadir puntos comparativos, como por ejemplo: estadios, comercios, hospitales, etc.
  4. Desarrollando soble el punto 2 y 3, preferentemente como fuente de datos separada, se debe obtener twits que el estudiante o los estudiantes consideren apropiados a unir, por ejemplo que se relacionen a los puntos de interés utilizados u otros: “Obelisco Buenos Aires”, “Xochimilco Ciudad de México”, utilizando como base el notebook de extracción de dataset de twitter en kaggle.

Pasos:

  1. Agregue los archivos de datos fuente o mantengalos como fuentes de datos separados, según el caso amerite
  2. Realice cualquier cambio necesario para relacionar los archivos y generar modelos de datos
  3. Analice los datos visualmente utilizando hojas, dashboards e historias a fin de producir su análisis
  4. Demuestre su análisis y comunique los hallazgos al Gerente de airbnb en el video (máximo 10 minutos) considerando que es una segunda reunión, el Gerente ya conoce su primer análisis.
  5. Publique su Análisis en tableau Cloud en el proyecto “Proyecto II” con el apellido o los apellidos en la descripción del dashboard, use el título más apropiado para su análisis
  6. Suba la grabación al classroom

Evaluación: Se evaluará cómo produjo el estudio de análisis en su segunda iteración utilizando sus modelos de datos, también el libro de trabajo publicado, el análisis desarrollado, y qué funcionalidades demuestra y cómo lo comunica a su público objetivo.

Materiales del Curso

Tecnología

Estaremos usando las siguientes herramientas:

(*) en proceso de solicitud a Tableau for Teaching, en espera nos den acceso.

Catálogo de material de apoyo

El catálogo de material de apoyo se encuentra clasificado por categorías: Aplicación, Catálogos, Inspiración, Libro electrónico, Fuentes de Datos, Buenas Prácticas, Cursos.

Puede ser accedido en el siguiente URL - Material de Apoyo.

Bibliografía:

  • Wickham, Grolemund (2017). R para Ciencia de Datos.
  • Claus O. Wilke (2019), Fundamentals of Data Visualization
  • Wexler, S. & Shaffer, J. & Cotgreave, A. (2017). The Big Book of Dashboards. Wiley.
  • Ann Jackson, Luke Stanke (2022), Tableau Strategies.
  • Nussbaumer, C. (2015). Storytelling with Data. Wiley.
  • Bentley, D. (2017). Business Intelligence and Analytics. Library Press.
  • Tufte, E. (2007) The Visual Display of Quantitative Information. Graphics Press LLC.
  • Few S. (2009). Now you see it.

Fuentes de Datos Abiertos