Analítica y Visualización de Datos, Aplicaciones - II/2022
Actualizado al 20/Dic/2022
Hola y bienvenidos al Módulo 5. Analítica y Visualización de Datos - Aplicaciones. Este curso va a introducir a los estudiantes en análisis y visualización de datos. Iniciando con los fundamentos de visualización, posteriormente utilizando herramientas de analítica y visualización de datos, para finalmente concluir el módulo con aplicaciones de analítica y visualización de datos.
Datos Generales
Institución: | Universidad Mayor de San Simón |
Programa: | Diplomado en Estadística Aplicada a la Toma de Decisiones, primera versión. |
Módulo V: | Analítica y Visualización de Datos, Aplicaciones |
Gestión: | II/2022 |
Carga horaria: | 120 horas ( 40 horas síncronas, 80 horas asíncronas) |
Docente: | Rolando Amir Mirabal Hinojosa |
Justificación
Con la gran cantidad de datos generados hoy en día, y la necesidad del negocio de sacarles provecho se requiere elaborar análisis y visualizaciones que reflejan los datos con precisión, cuenten una historia y sean elaborados profesionalmente. El objetivo es trasladar datos complejos, de alto volumen o numéricos a una representación visual más fácil de procesar, que permitan descubrir, interpretar y transmitir patrones importantes presentes en los datos. Estas visualizaciones que deben apuntar a ser una herramienta para la toma de decisiones con datos.
Este curso va a introducir a los estudiantes en análisis y visualización de datos. Iniciando con los fundamentos de visualización, posteriormente utilizando herramientas de analítica y visualización de datos, para finalmente concluir el módulo con aplicaciones de analítica y visualización de datos.
Cronograma
Fechas de Clases
Cronograma General
Descripción | Nombre de la Unidad | N° de sesiones |
---|---|---|
UNIDAD I | Fundamentos de Analítica y Visualización de los Datos | 3 |
UNIDAD II | Utilizando Herramientas de Analítica y Visualización de Datos | 4 |
UNIDAD III | Aplicaciones de Analítica y Visualización de Datos | 3 |
TOTAL | 10 |
Cronograma por Sesión
Unidad | Diapositivas | Título | Enlace |
---|---|---|---|
1 | 1 | Analítica y Visualización de Datos | 🖥️ |
1 | 2 | Fundamentos de Analítica y Visualización de Datos II | 🖥️ |
1 | 3 | Fundamentos de Analítica y Visualización de Datos III | 🖥️ |
2 | 1 | Tableau para analítica y visualización de datos I | 🖥 |
2 | 2 | Tableau para analítica y visualización de datos II | |
2 | 3 | Tableau para analítica y visualización de datos III | |
2 | 4 | Tableau con QGis y R | |
3 | 1 | Aplicación Geoespacial | 🖥 |
3 | 2 | Aplicación usando APIs | |
3 | 3 | Aplicación - BigData |
Asignaciones del Módulo
El medio utilizado para que el alumno entregue las tareas es classroom.
Sesión | Asignación | Individual / Grupal | Fecha de entrega |
---|---|---|---|
1 | Tarea 1 - Análisis y Visualización de datos | Individual o grupos de hasta 3 personas | 1-Dic-2022 |
1 | Tarea 2 - Análisis y Visualización de datos de la encuesta | Individual o grupos de hasta 3 personas | 3-Dic-2022 |
2 | Quiz Sesión 2 | Individual o grupos de hasta 3 personas | 3-Dic-2022 |
2 | Tarea 3 - Comparar herramientas de Visualización | Individual o grupos de hasta 3 personas | 8-Dic-2022 |
3 | Quiz Unidad 1 | Individual | 12-Dic-2022 |
4 | Ejercicio 1 - Caída de Meteoritos | Individual o grupos de hasta 2 personas | 9-Dic-2022 |
Proyectos del Módulo
Proyecto 1 - Datos proporcionados
Modalidad: máximo grupos de 2 personas
Datos Fuente: Publicada en Classroom, se escogió Buenos Aíres y Ciudad de México de: airbnbn data
Fecha de entrega: 25-Dic-2022
Instrucciones:
Los archivos de datos fuente contienen datos de airbnb Buenos Aíres y Ciudad de México:
Archivo | Descripción |
---|---|
listing | Catálogo de anuncios de alquileres de alojamientos y apartamentos |
calendar | Tabla calendario de la disponibilidad de un anuncio |
reviews | Reseñas de los clientes que han alquilado |
neighbourgoods.csv | Vecindades y grupo de vecindades en la ciudad |
neighbourgoods.geojson | Vecindades y grupo de vecindades en la ciudad con su polígono |
data dictionary | Diccionario de datos de airbnb |
Se le ha asignado la tarea de crear un libro de trabajo y publicarlo en Tableau Cloud, sin embargo es libre de usar otras herramientas para producir el análisis. Como parte del análisis debe producir una comparación entre las dos ciudades: Buenos Aires y Ciudad de México. Y agregar visualizaciones que vea conveniente. Presentará el tablero al Gerente de airbnb para Iberoamérica y compartirá sus hallazgos desde una perspectiva que ayude a tomar decisiones.
Así muestra los anuncios la página de airbnb:
Detalles
Agregue los archivos de datos a Tableau, asegúrese de realizar los ajustes necesarios para crear las relaciones de dichos archivos. A continuación, genere dashboards e historias, y los detalles de apoyo que considere necesarios compuestos por elementos de su elección del modelo generado previamente. Debe incluir un análisis comparativo entre Ciudad de México y Buenos Aíres.
Tienes licencia completa creativa con este proyecto, se quiere ver qué análisis produce, por ejemplo los mejores anuncios, análisis de las reseñas, análisis de precios, temporadas, entre otros. Finalmente debes grabar un video de máximo de 10 minutos en el cual presentes tu producto final, asumirá que usted(es) presentarán al Gerente de airbnb para Iberoamérica.
Pasos:
- Agregue los archivos de datos fuente
- Realice cualquier cambio necesario para relacionar los archivos y generar su modelo de datos
- Analice los datos visualmente utilizando hojas, dashboards e historias a fin de producir su análisis
- Demuestre su análisis y comunique los hallazgos al Gerente de airbnb en el video (máximo 10 minutos)
- Publique su Análisis en tableau Cloud en el proyecto “Proyecto I” con el apellido o los apellidos en la descripción del dashboard, use el título más apropiado para su análisis
- Suba la grabación al classroom
Extra.- en caso que quieran agregar datos de otras fuentes y utilizarla en el análisis puede agregarlo con total libertad. Estas otras fuentes pueden ser por ejemplo datos del censo, puntos de interés (parques, comercios, etc.), rutas de movilidad, datos estadísticos, entre otros.
Evaluación: Se evaluará cómo produjo tanto el modelo de datos como el libro de trabajo publicado, el análisis desarrollado, y qué funcionalidades demuestra y cómo la demuestra a su público objetivo.
Proyecto 2 - Datos proporcionados
Modalidad: máximo grupos de 2 personas
Fecha de entrega: 30-Dic-2022
Intrucciones:
- El punto de partida es el análisis del Proyecto 1 y expandirlo.
- Añadir dnsidad poblacional de Facebook en .shp (fuende de datos en classroom de Buenos Aires y Ciudad de México) al modelo y realizar un análisis con la densidad poblacional, utilizar ratios o factores con los datos existentes del Proyecto 1.
- Agregar puntos de interés al análisis (al menos 2 por cada ciudad), ya sea incluyéndo o no en el dataset, es decir una fuente de datos separada. Este siguiente análisis debe añadir puntos comparativos, como por ejemplo: estadios, comercios, hospitales, etc.
- Desarrollando soble el punto 2 y 3, preferentemente como fuente de datos separada, se debe obtener twits que el estudiante o los estudiantes consideren apropiados a unir, por ejemplo que se relacionen a los puntos de interés utilizados u otros: “Obelisco Buenos Aires”, “Xochimilco Ciudad de México”, utilizando como base el notebook de extracción de dataset de twitter en kaggle.
Pasos:
- Agregue los archivos de datos fuente o mantengalos como fuentes de datos separados, según el caso amerite
- Realice cualquier cambio necesario para relacionar los archivos y generar modelos de datos
- Analice los datos visualmente utilizando hojas, dashboards e historias a fin de producir su análisis
- Demuestre su análisis y comunique los hallazgos al Gerente de airbnb en el video (máximo 10 minutos) considerando que es una segunda reunión, el Gerente ya conoce su primer análisis.
- Publique su Análisis en tableau Cloud en el proyecto “Proyecto II” con el apellido o los apellidos en la descripción del dashboard, use el título más apropiado para su análisis
- Suba la grabación al classroom
Evaluación: Se evaluará cómo produjo el estudio de análisis en su segunda iteración utilizando sus modelos de datos, también el libro de trabajo publicado, el análisis desarrollado, y qué funcionalidades demuestra y cómo lo comunica a su público objetivo.
Materiales del Curso
Tecnología
Estaremos usando las siguientes herramientas:
- Tableau Public y Tableau Cloud (*)
- RStudio
- Python
- QGIS
(*) en proceso de solicitud a Tableau for Teaching, en espera nos den acceso.
Catálogo de material de apoyo
El catálogo de material de apoyo se encuentra clasificado por categorías: Aplicación, Catálogos, Inspiración, Libro electrónico, Fuentes de Datos, Buenas Prácticas, Cursos.
Puede ser accedido en el siguiente URL - Material de Apoyo.
Bibliografía:
- Wickham, Grolemund (2017). R para Ciencia de Datos.
- Claus O. Wilke (2019), Fundamentals of Data Visualization
- Wexler, S. & Shaffer, J. & Cotgreave, A. (2017). The Big Book of Dashboards. Wiley.
- Ann Jackson, Luke Stanke (2022), Tableau Strategies.
- Nussbaumer, C. (2015). Storytelling with Data. Wiley.
- Bentley, D. (2017). Business Intelligence and Analytics. Library Press.
- Tufte, E. (2007) The Visual Display of Quantitative Information. Graphics Press LLC.
- Few S. (2009). Now you see it.
Fuentes de Datos Abiertos
- Tableau datasets
- Kaggle datasets
- TidyTuesday
- NHS Scotland Open Data
- Edinburgh Open Data
- Open access to Scotland’s official statistics
- Bikeshare data portal
- UK Gov Data
- OpenIntro datasets
- Awesome public datasets
- Youth Risk Behavior Surveillance System (YRBSS)
- PRISM Data Archive Project
- Harvard Dataverse
- National Archive of Criminal Justice Data
- Data is Plural
- American Community Survey datos de Maine.
- IPUMS USA microdatos del censo
- The Lawrence Papers de Bates y metadata
- Health-related datasets compilados por Bates library
- Si conoces otros, háganmelo saber y lo agregaré aquí