Dans ces leçons, nous nous concentrerons sur la relation entre les graphiques et les ensembles de données sous-jacents utilisés pour les créer.
Dans ces leçons, nous nous concentrerons sur la relation entre les graphiques et les ensembles de données sous-jacents utilisés pour les créer. Toutes les données ne sont pas égales et certains tracés fonctionnent mieux que d'autres pour certaines situations. Nous explorerons plusieurs ensembles de données propices aux histogrammes, aux diagrammes de dispersion et aux cartes thermiques. Pour les histogrammes, nous utilisons des ensembles de données qui peuvent être considérés comme une distribution, tels que mille jets de dés et les résultats correspondants, ce qui nous permet de voir cette distribution.
Nous allons vous montrer comment combiner des nombres aléatoires, Numpy et matplotlib.pyplot pour créer des ensembles de données avec une distribution en tirant des données d'une mission Mars de la NASA pour tracer un diagramme de dispersion. La NASA a un satellite qui orbite autour de Mars et prend des photos de la surface martienne; et dans ces leçons, nous explorerons cet ensemble de données pour tracer des zones de la surface martienne. Vous explorerez également le fonctionnement des cartes thermiques, y compris la relation entre les différentes variables d'une carte thermique, quand elles ont un sens et quand elles n'ont pas de sens.
Objectifs de la formation :
- Comprendre la relation entre les données sous-jacentes et leur tracé approprié
- Évaluer les pratiques avec Numpy, Pandas et de grands ensembles de données
- Décrire la relation entre les ensembles de données et les façons typiques d'exprimer les ensembles de données
Compétences acquises
Visualisation des donnéesVisualisation de l'informationDiagrammes de dispersionGraphiques statistiquesSimulations visuellesVisualisationCe que vous allez apprendre
- Comprendre la relation entre un ensemble de données sous-jacent et le type de graphique le mieux adapté pour l'exprimer
- Créer des ensembles de données de distribution en combinant des nombres aléatoires, Numpy et matplotlib.pyplot
- Tracer des histogrammes pour des ensembles de données représentant une distribution, tels que les résultats d'un millier de lancers de dés
- Créer des diagrammes de dispersion à partir des données de la mission martienne de la NASA pour tracer des zones de la surface de Mars
- Construire des diagrammes de cartes thermiques (heat maps) et évaluer les relations entre leurs variables
- Appliquer des pratiques avec Numpy, Pandas et de grands ensembles de données
Points clés à retenir
- Toutes les données ne se valent pas et certains graphiques fonctionnent mieux que d'autres dans certaines situations.
- Les histogrammes conviennent aux ensembles de données qui peuvent être considérés comme une distribution, comme un millier de lancers de dés et leurs résultats.
- Les diagrammes de dispersion peuvent être tracés à partir de données réelles, telles que les photos de la surface martienne prises par un satellite de la NASA.
- Les cartes thermiques dépendent de la relation entre leurs variables, qui détermine quand elles sont pertinentes et quand elles ne le sont pas.
- Les nombres aléatoires, Numpy et matplotlib.pyplot peuvent être combinés pour créer des ensembles de données avec une distribution.
Foire aux questions
Que couvre ce cours ?
Il se concentre sur la relation entre les graphiques et les ensembles de données sous-jacents utilisés pour les créer, en explorant les histogrammes, les nuages de points et les cartes thermiques, ainsi que le moment approprié pour les utiliser.
Quels types de graphiques apprendrai-je à créer ?
Vous apprendrez à créer des graphiques avec des histogrammes, des diagrammes de dispersion et des diagrammes de cartes thermiques (heat maps).
Quels outils et bibliothèques sont utilisés dans ce cours ?
Les leçons utilisent des nombres aléatoires, Numpy, Pandas et matplotlib.pyplot pour travailler avec des ensembles de données et créer des graphiques.
Quels ensembles de données sont utilisés comme exemples ?
Les exemples incluent une distribution telle qu'un millier de lancers de dés et leurs résultats, ainsi qu'un ensemble de données de la mission Mars de la NASA provenant d'un satellite qui photographie la surface martienne.
Quelles compétences vais-je acquérir ?
Vous développerez des compétences en matière de visualisation de données, de visualisation d'informations, de nuages de points (scatter plots), de graphiques statistiques, de simulations visuelles et de visualisation.
Transcription
Transcription
Dans cette leçon, nous allons parler des histogrammes, de quoi ils le sont et quand vous les utilisez. L'histogramme montre la distribution des fréquences et ce que je veux dire par que c'est à quelle fréquence quelque chose arrive en relation avec Autres événements. Par exemple, utilisons un lancer de dés. Il n'y a que six réponses possibles. De un à six, nous lançons les dés. Nous allons en avoir un à six. Nous lançons les dés 1 000 fois. À quoi pouvons-nous nous attendre en termes de ces lancers de dés. Et allons-y et simulons cela. Posons cette question. Imaginons que c'est à ce moment-là qu'un histogramme est en fait la bonne réponse, lorsque vous essayez de voir ce que à quoi ressemblent les données. Et dans ce cas, nous voulons voir à quoi ressemble un lancer de dés. Nous allons donc utiliser un histogramme. Nous allons intervenir directement. Ces trois importations, je pense que nous les connaissons tous à ce stade point, nous ne passerons donc pas trop de temps à en parler. Nous allons créer une liste appelée rand avec le numéro cas r, définissez-le sur vide. Et puis nous allons créer six bacs, et nous les appellerons poubelles faute d’un meilleur nom. Et puis dans une plage de 0 à 100 nous allons créer X qui est va être un nombre aléatoire entre 1 et 6 et c'est le un lancer de dés simulé, c'est ça, c'est ce que c'est ici Et puis nous allons ajouter ces résultats à notre liste. Et puis je vais juste tracer ça et voir à quoi ça ressemble comme. Commençons avec seulement 100 enregistrements et exécutons-le. Et ce qu'on remarquera c'est que, dans ce cas, voici nos dés lance 1, 2, 3, 4, 5 et 6. Et puis c'est la fréquence. Et nous avons lancé un 1 à 20 fois. Nous avons lancé un 2 à 15 fois. Nous avons obtenu un 3, on dirait un peu plus que 17 fois probablement. Nous avons lancé un 4 à 15 fois. Nous le relançons, nous obtiendrons une réponse différente. Mais ce que nous commencerons à remarquer, c'est qu'il y a certainement un s'orienter Et cette tendance est qu’il s’agit d’une distribution uniforme. Et ce que je veux dire par là, c'est que lorsque vous lancez un dé, le les chances que vous obteniez un 1 sont exactement les mêmes que celles que vous obtenez un 6, qui équivaut exactement à un 4, et ainsi de suite. À quoi devraient ressembler ces données pendant que nous conduisons ? le nombre augmente, c'est pour que cela devienne une distribution évidemment uniforme et vous pouvez commencer à le voir maintenant avec 175 ou alors, comme le maximum, peut-être que 180 est le maximum, mais vous pouvez voir ici où sont définitivement les dés sort et ça a certainement l'air uniforme, c'est à dire Probabilité égale pour n’importe quelle réponse. Nous allons maintenant en atteindre 10 000, jetez un dernier coup d'oeil, et vous pourrez vraiment voir que nous le conduisons vraiment à ce look uniforme. Très bien, nous pouvons donc voir qu'il s'agit d'une distribution uniforme, c'est pourquoi vous utiliseriez un histogramme, c'est le type de informations que vous essayez de trouver lorsque vous utilisez un histogramme. Maintenant, allons augmentez cela d'un cran et regardez que se passe-t-il lorsque vous lancez deux dés. Alors maintenant, nous allons continuer avec la même approche sauf qu'on va lancer les dés une fois puis une seconde le moment où nous allons additionner ces dés ensemble et nous allons pour l'ajouter à notre nombre aléatoire. Maintenant, pourquoi faisons-nous cela ? Parce que c'est plutôt un lancer de dés. Maintenant, un lancer de dés avec deux dés est-il une distribution uniforme ? Non, cela ne devrait pas être le cas. Et la raison est qu'avec deux dés, il y a un certain nombre de façons dont vous pouvez lancer quatre et cinq et six et sept et huit, d'où certains des jeux qui se jouent autour de cela. Mais avec deux dés, les options vont de 1 à 12. Et ce que nous constaterons, c'est que la grande majorité d'entre eux sont je vais sortir au milieu de ça, dans la zone de distribution de 6, 7 et 8 et ainsi de suite. Nous pouvons déjà commencer à voir cette forme et nous pouvons certainement dites que ce n’est pas une distribution uniforme. Alors répétons-le maintenant une fois de plus et nous pouvons voir que ceci a définitivement pris forme. Ce que je veux dire par forme, c'est que voici un 2, ok, c'est le possibilité la plus basse, c'est arrivé cent fois. Voici un 8, ce qui représente une probabilité beaucoup plus élevée. Cela arrive 300 fois. Donc le 8 clairement est plus susceptible de se produire qu'un 2. Et la raison est qu'il n'y a qu'une seule façon d'obtenir un 2, un 1 et un 1. Il existe de nombreuses façons d'obtenir un 8. La leçon suivante concerne les diagrammes de dispersion.
Apprendre en déplacement
Apprenez partout — l'application KnowledgeCity vous permet de suivre les leçons en déplacement.