Nestas lições, vamos concentrar-nos na relação entre os gráficos e os conjuntos de dados subjacentes utilizados para os criar.
Nestas lições, vamos concentrar-nos na relação entre os gráficos e os conjuntos de dados subjacentes utilizados para os criar. Nem todos os dados são iguais e alguns gráficos funcionam melhor do que outros em determinadas situações. Iremos explorar vários conjuntos de dados conducentes a histogramas, gráficos de dispersão e mapas de calor. Para os histogramas, utilizamos conjuntos de dados que podem ser considerados uma distribuição - como milhares de lançamentos de dados e os resultados correspondentes - o que nos permite ver essa distribuição.
Vamos mostrar-lhe como combinar números aleatórios, Numpy e matplotlib.pyplot para criar conjuntos de dados com uma distribuição, desenhando dados de uma missão da NASA a Marte para traçar um diagrama de dispersão. A NASA tem um satélite que orbita Marte e tira fotografias da superfície marciana; nestas lições, vamos explorar esse conjunto de dados para traçar áreas da superfície marciana. Também irá explorar o funcionamento dos mapas de calor, incluindo a relação entre as diferentes variáveis de um mapa de calor, quando fazem sentido e quando não fazem.
Objectivos de aprendizagem:
- Compreender a relação entre os dados subjacentes e o seu gráfico adequado
- Avaliar práticas com Numpy, Pandas e grandes conjuntos de dados
- Descrever a relação entre conjuntos de dados e formas típicas de expressar conjuntos de dados
Habilidades que você vai adquirir
Visualização de dadosVisualização de informaçõesPlano de dispersãoGráficos estatísticosSimulações visuaisVisualizaçãoO Que Você Vai Aprender
- Entender a relação entre um conjunto de dados subjacente e o tipo de gráfico mais adequado para expressá-lo
- Criar conjuntos de dados de distribuição combinando números aleatórios, Numpy e matplotlib.pyplot
- Plotar histogramas para conjuntos de dados que representam uma distribuição, como os resultados de mil lançamentos de dados
- Construir diagramas de dispersão de um conjunto de dados da missão Mars da NASA para plotar áreas da superfície marciana
- Construir diagramas de mapa de calor e avaliar as relações entre suas variáveis
- Aplicar práticas com Numpy, Pandas e grandes conjuntos de dados
Principais Conclusões
- Nem todos os dados são iguais, e alguns gráficos funcionam melhor do que outros para certas situações.
- Histogramas são adequados para conjuntos de dados que podem ser considerados uma distribuição, como mil lançamentos de dados e seus resultados.
- Diagramas de dispersão podem ser plotados a partir de dados reais, como as fotos de um satélite da NASA da superfície marciana.
- Os mapas de calor dependem da relação entre suas variáveis, o que determina quando faz sentido e quando não faz.
- Números aleatórios, Numpy e matplotlib.pyplot podem ser combinados para criar conjuntos de dados com uma distribuição.
Perguntas Frequentes
O que este curso cobre?
Ele se concentra na relação entre gráficos e os conjuntos de dados subjacentes usados para criá-los, explorando histogramas, gráficos de dispersão e mapas de calor e quando cada um é apropriado.
Quais tipos de gráficos vou aprender a criar?
Você aprenderá a plotar com histogramas, diagramas de dispersão e diagramas de mapa de calor.
Quais ferramentas e bibliotecas são usadas neste curso?
As aulas usam números aleatórios, Numpy, Pandas e matplotlib.pyplot para trabalhar com conjuntos de dados e criar gráficos.
Quais conjuntos de dados são usados como exemplos?
Os exemplos incluem uma distribuição como mil lançamentos de dados e seus resultados, e um conjunto de dados da missão Mars da NASA de um satélite que fotografa a superfície marciana.
Que habilidades vou ganhar?
Você desenvolverá habilidades em visualização de dados, visualização de informações, gráficos de dispersão, gráficos estatísticos, simulações visuais e visualização.
Transcrição
Transcrição
Nesta lição vamos falar sobre histogramas, o que eles são e quando você os usa. O histograma mostra a distribuição de frequência e o que quero dizer com que é com que frequência algo acontece em relação a outros eventos. Por exemplo, vamos usar um lançamento de dados. Existem apenas seis respostas possíveis. De um a seis, lançamos os dados. Nós vamos de um a seis. Lançamos os dados 1.000 vezes. O que esperaríamos em termos de esses dados rolam. E vamos seguir em frente e simular isso. Vamos fazer essa pergunta. Vamos enquadrar que é quando um histograma é na verdade a resposta certa, quando você está tentando ver o que os dados se parecem. E neste caso queremos ver como é o lançamento de um dado. Então, vamos usar um histograma. Nós vamos começar imediatamente. Acho que todos estamos familiarizados com essas três importações neste momento ponto, então não vamos perder muito tempo falando sobre isso. Vamos criar uma lista chamada rand com o número caso r, deixe-o em branco. E então vamos criar seis caixas e vamos chamá-las caixas por falta de um nome melhor. E então em um intervalo de 0 a 100 vamos criar X que é será um número aleatório entre 1 e 6 e este é o dados simulados rolam certo, é isso que está aqui E então vamos anexar quaisquer que sejam esses resultados ao nosso lista. E então vou traçar isso e ver o que parece como. Vamos começar com apenas 100 registros e executar isso. E o que vamos notar é que, neste caso, aqui estão os nossos dados rolos 1, 2, 3, 4, 5 e 6. E então esta é a frequência. E rolamos 120 vezes. Rolamos 2 15 vezes. Tiramos um 3, parece um pouco mais do que 17 vezes provavelmente. Rolamos 4 15 vezes. Executamos novamente e obteremos uma resposta diferente. Mas o que começaremos a notar é que há definitivamente uma tendência E essa tendência é que esta seja uma distribuição uniforme. E o que quero dizer com isso é que quando você está jogando um dado, o as chances de você obter 1 são exatamente as mesmas que você obteve um 6, que é exatamente o mesmo que obter um 4, e assim por diante. Então, como esperaríamos que esses dados fossem enquanto dirigimos aumentar a contagem é para que se torne uma distribuição obviamente uniforme e você pode começar a ver agora com 175 ou algo assim, como o máximo, talvez 180 seja o máximo, mas você pode ver aqui onde os dados estão definitivamente saindo e certamente parece uniforme, ou seja Probabilidade igual para qualquer resposta. Vamos aumentar agora 10.000, dê uma última olhada e você verá que estamos dirigindo realmente para esse visual uniforme. Tudo bem, então podemos ver que esta é uma distribuição uniforme, é por isso que você usaria um histograma, este é o tipo de informações que você está tentando descobrir ao usar um histograma. Agora vamos suba um degrau e veja o que acontece quando você joga dois dados. Então agora vamos continuar com a mesma abordagem exceto que vamos lançar os dados uma vez e depois uma segunda hora, vamos somar esses dados e vamos para anexar isso ao nosso número aleatório. Agora, por que estamos fazendo isso? Porque isso é mais como um lançamento de dados. Agora, um lançamento de dados com dois dados é uma distribuição uniforme? Não, não deveria ser. E a razão é porque com dois dados, há uma série de maneiras de rolar quatro e cinco e seis e sete e oito, daí alguns dos jogos que são jogados em torno disso. Mas com dois dados, as opções são de 1 a 12. E o que descobriremos é que a grande maioria deles são vai sair no meio disso, na área de distribuição de 6, 7 e 8 e assim por diante. Já podemos começar a ver essa forma e certamente podemos diga que esta não é uma distribuição uniforme. Então, vamos repetir agora mais uma vez e podemos ver que isso definitivamente tem forma para isso. O que quero dizer com forma é que aqui está um 2, certo, esse é o menor possibilidade, aconteceu cem vezes. Aqui está um 8, que é uma probabilidade muito maior. Acontece 300 vezes. Então o 8 claramente é mais provável de acontecer do que um 2. E a razão é porque só há uma maneira de obter um 2, um 1 e um 1. Há muitas maneiras de obter um 8. A próxima lição são diagramas de dispersão.
Aprender em qualquer lugar
Leve seu aprendizado para qualquer lugar — o app da KnowledgeCity permite assistir às lições em qualquer lugar.