KnowledgeCity

Datenvisualisierung und Ausdruck/Narrativ

In diesen Lektionen werden wir uns auf die Beziehung zwischen Diagrammen und den zugrundeliegenden Datensätzen konzentrieren, die für ihre Erstellung…

In diesen Lektionen werden wir uns auf die Beziehung zwischen Diagrammen und den zugrundeliegenden Datensätzen konzentrieren, die für ihre Erstellung verwendet werden. Nicht alle Daten sind gleich, und einige Diagramme eignen sich in bestimmten Situationen besser als andere. Wir werden verschiedene Datensätze untersuchen, die sich für Histogramme, Streudiagramme und Heatmaps eignen. Für Histogramme verwenden wir Datensätze, die als Verteilung angesehen werden können - wie z. B. tausend Würfelwürfe und die entsprechenden Ergebnisse - und die es uns ermöglichen, diese Verteilung zu sehen.

Wir zeigen Ihnen, wie Sie Zufallszahlen, Numpy und matplotlib.pyplot kombinieren können, um Datensätze mit einer Verteilung zu erstellen, indem Sie Daten von einer NASA-Marsmission für ein Streudiagramm verwenden. Die NASA hat einen Satelliten, der den Mars umkreist und Bilder von der Marsoberfläche aufnimmt. In diesen Lektionen werden wir diesen Datensatz untersuchen, um Bereiche der Marsoberfläche darzustellen. Sie werden auch untersuchen, wie Wärmekarten funktionieren, einschließlich der Beziehung zwischen den verschiedenen Variablen einer Wärmekarte, wann sie sinnvoll sind und wann nicht.

Lernziele:

  • die Beziehung zwischen den zugrundeliegenden Daten und der entsprechenden Darstellung zu verstehen
  • Bewertung von Praktiken mit Numpy, Pandas und großen Datensätzen
  • die Beziehung zwischen Datensätzen und typischen Ausdrucksformen für Datensätze zu beschreiben

Autor: Bill Hood

Dauer: 19m · 3 Lektionen
Niveau: Intermediate
Sprache: Deutsch

Fähigkeiten, die du erwirbst

DatenvisualisierungInformationsvisualisierungStreudiagrammeStatistische GrafikenVisuelle SimulationenVisualisierung

Was Sie lernen werden

  • Verstehen Sie die Beziehung zwischen einem zugrunde liegenden Datensatz und dem am besten geeigneten Plottyp, um ihn auszudrücken
  • Erstellen Sie Verteilungsdatensätze durch Kombination von Zufallszahlen, Numpy und matplotlib.pyplot
  • Zeichnen Sie Histogramme für Datensätze, die eine Verteilung darstellen, wie z.B. die Ergebnisse von tausend Würfelwürfen
  • Erstellen Sie Streudiagramme aus einem NASA-Mars-Missionsdatensatz, um Bereiche der Marsoberfläche zu zeichnen
  • Konstruieren Sie Wärmekarten und bewerten Sie die Beziehungen zwischen ihren Variablen
  • Wenden Sie Praktiken mit Numpy, Pandas und großen Datensätzen an

Wichtige Erkenntnisse

  • Nicht alle Daten sind gleich, und einige Plots funktionieren besser als andere für bestimmte Situationen.
  • Histogramme eignen sich für Datensätze, die als Verteilung betrachtet werden können, wie z.B. tausend Würfelwürfe und ihre Ergebnisse.
  • Streudiagramme können aus realen Daten gezeichnet werden, wie z.B. aus Bildern eines NASA-Satelliten der Marsoberfläche.
  • Wärmekarten hängen von der Beziehung zwischen ihren Variablen ab, die bestimmt, wann sie sinnvoll sind und wann nicht.
  • Zufallszahlen, Numpy und matplotlib.pyplot können kombiniert werden, um Datensätze mit einer Verteilung zu erstellen.

Häufig gestellte Fragen

Was deckt dieser Kurs ab?

Er konzentriert sich auf die Beziehung zwischen Plots und den zugrunde liegenden Datensätzen, die zu ihrer Erstellung verwendet werden, und untersucht Histogramme, Streudiagramme und Wärmekarten sowie wann jeweils angemessen ist.

Welche Plot-Typen werde ich erstellen lernen?

Sie erlernen das Zeichnen mit Histogrammen, Streudiagrammen und Wärmekartediagrammen.

Welche Werkzeuge und Bibliotheken werden in diesem Kurs verwendet?

Die Lektionen verwenden Zufallszahlen, Numpy, Pandas und matplotlib.pyplot, um mit Datensätzen zu arbeiten und Plots zu erstellen.

Welche Datensätze werden als Beispiele verwendet?

Beispiele umfassen eine Verteilung wie tausend Würfelwürfe und ihre Ergebnisse sowie einen NASA-Mars-Missionsdatensatz von einem Satelliten, der die Marsoberfläche fotografiert.

Welche Fähigkeiten erwerbe ich?

Sie entwickeln Fähigkeiten in Datenvisualisierung, Informationsvisualisierung, Streudiagrammen, statistischen Grafiken, visuellen Simulationen und Visualisierung.

Transkript

Transkript

In dieser Lektion werden wir über Histogramme sprechen sie sind und wann Sie sie verwenden. Das Histogramm zeigt die Häufigkeitsverteilung und was ich damit meine Das ist, wie oft etwas passiert im Verhältnis zu Andere Ereignisse. Nehmen wir zum Beispiel einen Würfelwurf. Es gibt nur sechs mögliche Antworten. Von eins bis sechs würfeln wir. Wir werden eins bis sechs schaffen. Wir würfeln 1.000 Mal. Was würden wir in Bezug auf erwarten diese Würfelwürfe. Und lassen Sie uns einfach weitermachen und das simulieren. Stellen wir diese Frage. Stellen wir uns vor, dass dies ein Histogramm ist ist tatsächlich die richtige Antwort, wenn Sie versuchen herauszufinden, was die Daten sehen so aus. Und in diesem Fall wollen wir sehen, wie ein Würfelwurf aussieht. Wir werden also ein Histogramm verwenden. Wir werden gleich einsteigen. Ich glaube, diese drei Importe sind uns allen bekannt Punkt, also werden wir nicht zu viel Zeit damit verbringen, darüber zu reden. Wir werden eine Liste namens Rand mit der Nummer erstellen Fall r, setzen Sie es auf leer. Und dann werden wir sechs Bins erstellen und sie aufrufen bins mangels eines besseren Namens. Und dann in einem Bereich von 0 bis 100 werden wir X erstellen, was ist wird eine Zufallszahl zwischen 1 und 6 sein und das ist die Simulierter Würfelwurf, genau das ist es hier Und dann werden wir diese Ergebnisse an unsere anhängen Liste. Und dann werde ich das einfach planen und sehen, wie es aussieht wie. Beginnen wir mit nur 100 Datensätzen und führen wir diese aus. Und was uns auffallen wird, ist, dass es sich in diesem Fall um unsere Würfel handelt Würfelt 1, 2, 3, 4, 5 und 6. Und dann ist das die Frequenz. Und wir haben 20 Mal eine 1 gewürfelt. Wir haben 15 Mal eine 2 gewürfelt. Wir haben eine 3 gewürfelt, sieht aus wie etwas mehr als Wahrscheinlich 17 Mal. Wir haben 15 Mal eine 4 gewürfelt. Wenn wir es erneut ausführen, erhalten wir eine andere Antwort. Aber was wir bemerken werden, ist, dass es definitiv eine gibt Trend Und dieser Trend geht dahin, dass es sich um eine gleichmäßige Verteilung handelt. Und was ich damit meine, ist, wenn man würfelt Die Chancen, dass Sie eine 1 bekommen, sind genau die gleichen wie bei Ihnen eine 6, was genau das Gleiche ist, als würde man eine 4 bekommen, und so weiter. Wie würden wir also erwarten, dass diese Daten während der Fahrt aussehen? Die Zählung ist dafür, dass es offensichtlich zu einer gleichmäßigen Verteilung kommt und Sie können es jetzt mit 175 sehen Ungefähr als Maximum ist vielleicht 180 das Maximum, aber Sie können sehen Hier ist definitiv der Würfel herauskommt und es sieht auf jeden Fall einheitlich aus, d. h Gleiche Wahrscheinlichkeit für jede Antwort. Wir werden jetzt 10.000 erreichen, Werfen Sie einen letzten Blick darauf und Sie können wirklich sehen, dass wir es schaffen wirklich zu diesem einheitlichen Look. Okay, wir können also sehen, dass es sich um eine gleichmäßige Verteilung handelt. Aus diesem Grund würden Sie ein Histogramm verwenden. Dies ist die Art von Informationen, die Sie herausfinden möchten, wenn Sie a verwenden Histogramm. Jetzt lass uns Steigen Sie noch einen Schritt weiter und schauen Sie sich das an Was passiert, wenn man zwei Würfelwürfe hat? Jetzt werden wir mit dem gleichen Ansatz fortfahren außer wir würfeln einmal und dann noch einmal Es ist Zeit, dass wir diese Würfel zusammenfügen und los geht’s um das an unsere Zufallszahl anzuhängen. Warum machen wir das nun? Denn das ähnelt eher einem Würfelwurf. Ist nun ein Würfelwurf mit zwei Würfeln eine Gleichverteilung? Nein, das sollte nicht sein. Und der Grund dafür ist, dass es bei zwei Würfeln eine Menge gibt Möglichkeiten, wie man vier und fünf und sechs und sieben und acht würfeln kann, daher einige der Spiele, die darum herum gespielt werden. Aber mit zwei Würfeln gibt es eine Auswahl von 1 bis 12. Und wir werden feststellen, dass dies bei der überwiegenden Mehrheit der Fall ist werde mittendrin herauskommen, im Verbreitungsgebiet 6, 7 und 8 usw. Wir können diese Form bereits erkennen, und das können wir auf jeden Fall Sagen Sie, dass dies keine gleichmäßige Verteilung ist. Also lassen Sie es uns jetzt noch einmal ausführen und wir können sehen, dass dies der Fall ist hat definitiv Form. Was ich mit Form meine, ist, dass hier eine 2 ist, okay, das ist die geringste Wahrscheinlichkeit: Es ist hundertmal passiert. Hier ist eine 8, was einer viel höheren Wahrscheinlichkeit entspricht. Passiert 300 Mal. Also die 8 eindeutig ist wahrscheinlicher als eine 2. Und der Grund dafür ist, dass es nur einen Weg gibt, eine 2 zu bekommen, eine 1 und eine 1. Es gibt viele Möglichkeiten, eine 8 zu bekommen. Die nächste Lektion sind Streudiagramme.

Unterwegs lernen

Lerne überall — mit der KnowledgeCity-App schaust du Lektionen unterwegs.