En estas lecciones nos centraremos en la relación entre los gráficos y los conjuntos de datos subyacentes utilizados para crearlos.
En estas lecciones nos centraremos en la relación entre los gráficos y los conjuntos de datos subyacentes utilizados para crearlos. No todos los datos son iguales y algunos gráficos funcionan mejor que otros para determinadas situaciones. Exploraremos varios conjuntos de datos propicios para histogramas, diagramas de dispersión y mapas de calor. Para los histogramas, utilizamos conjuntos de datos que pueden considerarse una distribución, como mil tiradas de dados y los resultados correspondientes, que nos permiten ver esa distribución.
Le enseñaremos a combinar números aleatorios, Numpy y matplotlib.pyplot para crear conjuntos de datos con una distribución, extrayendo datos de una misión a Marte de la NASA para trazar un diagrama de dispersión. La NASA tiene un satélite que orbita Marte y toma fotografías de la superficie marciana y en estas lecciones, exploraremos ese conjunto de datos para trazar áreas de la superficie marciana. También exploraremos cómo funcionan los mapas de calor, incluyendo la relación entre las diferentes variables de un mapa de calor, cuándo tienen sentido y cuándo no.
Objetivos de aprendizaje:
- Comprender la relación entre los datos subyacentes y su gráfico apropiado
- Evaluar las prácticas con Numpy, Pandas y grandes conjuntos de datos
- Describir la relación entre los conjuntos de datos y las formas típicas de expresarlos
Habilidades que obtendrás
Visualización de datosVisualización de la informaciónDiagramas de dispersiónGráficos estadísticosSimulaciones visualesVisualizaciónLo que aprenderás
- Comprender la relación entre un conjunto de datos subyacente y el tipo de gráfico más adecuado para expresarlo
- Crear conjuntos de datos de distribución combinando números aleatorios, Numpy y matplotlib.pyplot
- Trazar histogramas para conjuntos de datos que representan una distribución, como los resultados de mil tiradas de dados
- Construir diagramas de dispersión a partir de un conjunto de datos de la misión de Marte de la NASA para trazar áreas de la superficie marciana
- Construir diagramas de mapa de calor y evaluar las relaciones entre sus variables
- Aplicar prácticas con Numpy, Pandas y grandes conjuntos de datos
Puntos clave
- No todos los datos son iguales, y algunos gráficos funcionan mejor que otros en ciertas situaciones.
- Los histogramas son apropiados para conjuntos de datos que pueden considerarse una distribución, como mil tiradas de dados y sus resultados.
- Los diagramas de dispersión se pueden trazar a partir de datos reales, como las imágenes de un satélite de la NASA de la superficie marciana.
- Los mapas de calor dependen de la relación entre sus variables, lo que determina cuándo tienen sentido y cuándo no.
- Los números aleatorios, Numpy y matplotlib.pyplot se pueden combinar para crear conjuntos de datos con una distribución.
Preguntas frecuentes
¿Qué cubre este curso?
Se enfoca en la relación entre gráficos y los conjuntos de datos subyacentes utilizados para crearlos, explorando histogramas, gráficos de dispersión y mapas de calor y cuándo es apropiado cada uno.
¿Qué tipos de gráficos aprenderé a crear?
Aprenderá a trazar con histogramas, diagramas de dispersión y diagramas de mapa de calor.
¿Qué herramientas y bibliotecas se utilizan en este curso?
Las lecciones utilizan números aleatorios, Numpy, Pandas y matplotlib.pyplot para trabajar con conjuntos de datos y crear gráficos.
¿Qué conjuntos de datos se utilizan como ejemplos?
Los ejemplos incluyen una distribución como mil tiradas de dados y sus resultados, y un conjunto de datos de la misión de Marte de la NASA de un satélite que fotografía la superficie marciana.
¿Qué habilidades ganaré?
Desarrollará habilidades en visualización de datos, visualización de información, gráficos de dispersión, gráficos estadísticos, simulaciones visuales y visualización.
Transcripción
Transcripción
En esta lección vamos a hablar sobre histogramas, ¿qué son y cuando los usas. El histograma muestra la distribución de frecuencia y lo que quiero decir con eso es con qué frecuencia sucede algo En relación a otros eventos. Por ejemplo, usemos una tirada de dados. Sólo hay seis respuestas posibles. Del uno al seis, tiramos los dados. Vamos del uno al seis. Tiramos los dados 1.000 veces. ¿Qué esperaríamos en términos de esas tiradas de dados. Y sigamos adelante y simulemos eso. Hagamos esa pregunta. Enmarquemos que ahí es cuando un histograma es en realidad la respuesta correcta, cuando intentas ver qué los datos parecen. Y en este caso queremos ver cómo es una tirada de dados. Entonces usaremos un histograma. Vamos a saltar de inmediato. Creo que todos estamos familiarizados con estas tres importaciones en este momento. punto, así que no dedicaremos mucho tiempo a hablar de eso. Vamos a crear una lista llamada rand con el número caso r, póngalo en blanco. Y luego crearemos seis contenedores y los llamaremos contenedores a falta de un nombre mejor. Y luego en un rango de 0 a 100 vamos a crear X que es va a ser un número aleatorio entre 1 y 6 y este es el tirada de dados simulada, eso es lo que hay aquí Y luego vamos a agregar cualesquiera que sean esos resultados a nuestro lista. Y luego simplemente vamos a trazar eso y ver cómo se ve. como. Comencemos con solo 100 registros y ejecutémoslos. Y lo que notaremos es que, en este caso, aquí están nuestros dados. tira 1, 2, 3, 4, 5 y 6. Y luego esta es la frecuencia. Y sacamos un 1 20 veces. Lanzamos un 2 15 veces. Sacamos un 3, parece un poco más que Probablemente 17 veces. Lanzamos un 4 15 veces. Lo ejecutamos nuevamente y obtendremos una respuesta diferente. Pero lo que comenzaremos a notar es que definitivamente hay una tendencia Y esa tendencia es que se trata de una distribución uniforme. Y lo que quiero decir con eso es que cuando tiras un dado, el Las posibilidades de que obtengas un 1 son exactamente las mismas que las que obtienes. un 6, que es exactamente lo mismo que obtener un 4, y así sucesivamente. Entonces, ¿cómo esperaríamos que se vieran estos datos mientras conducimos? aumentar el conteo es para que se convierta en una distribución obviamente uniforme y puedes empezar a verlo ahora con 175 más o menos como máximo, tal vez 180 sea el máximo, pero puedes ver aquí donde está definitivamente el dado saliendo y ciertamente se ve uniforme, es decir Igual probabilidad para cualquier respuesta. Ahora vamos a llegar a 10.000. Eche un último vistazo y podrá ver realmente que lo estamos conduciendo. realmente a este look uniforme. Muy bien, podemos ver que esta es una distribución uniforme, es por eso que usarías un histograma, este es el tipo de información que estás tratando de descubrir cuando estás usando un histograma. Ahora vamos a sube esto un nivel y mira ¿Qué pasa cuando tienes dos tiradas de dados? Así que ahora vamos a continuar con el mismo enfoque. excepto que vamos a tirar los dados una vez y luego un segundo momento vamos a sumar esos dados y vamos a para agregar eso a nuestro número aleatorio. Ahora ¿por qué estamos haciendo eso? Porque eso es más como una tirada de dados. Ahora bien, ¿una tirada de dados con dos dados tiene una distribución uniforme? No, no debería ser así. Y la razón es que con dos dados, hay una cantidad de maneras en que puedes sacar cuatro y cinco y seis y siete y ocho, de ahí algunos de los juegos que se juegan en torno a eso. Pero con dos dados las opciones son del 1 al 12. Y lo que encontraremos es que la gran mayoría de estos son va a salir en medio de eso, en el área de distribución de 6, 7 y 8 y así sucesivamente. Ya podemos empezar a ver esa forma y ciertamente podemos decir que esta no es una distribución uniforme. Así que ejecutémoslo una vez más y podremos ver que esto Definitivamente tiene forma. Lo que quiero decir con forma es que aquí hay un 2, está bien, esa es la posibilidad más baja, sucedió cientos de veces. Aquí hay un 8, que es una probabilidad mucho mayor. Sucede 300 veces. Entonces el 8 claramente es más probable que suceda que un 2. Y la razón es que sólo hay una forma de obtener un 2, un 1 y un 1. Hay muchas maneras de obtener un 8. La próxima lección son los diagramas de dispersión.
Aprende sobre la marcha
Lleva tu aprendizaje a todas partes: la app de KnowledgeCity te permite ver las lecciones sobre la marcha.