Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Desafio 5: Correlação | Estatísticas
Desafio de Entrevista em Ciência de Dados
course content

Conteúdo do Curso

Desafio de Entrevista em Ciência de Dados

Desafio de Entrevista em Ciência de Dados

1. Python
2. NumPy
3. Pandas
4. Matplotlib
5. Seaborn
6. Estatísticas
7. Scikit-learn

book
Desafio 5: Correlação

Distinguir entre correlação e causalidade é um conceito fundamental em estatísticas. Embora a correlação denote uma relação entre duas variáveis, isso não implica que uma variável causa a outra. A causalidade, por outro lado, sugere uma relação direta onde uma mudança em uma variável resulta em uma mudança em outra.

Por exemplo, considere uma sorveteria que percebe um aumento nas vendas nos meses de verão e uma diminuição no inverno. Enquanto há uma correlação entre a temperatura e as vendas de sorvete, isso não significa que temperaturas mais altas causem um aumento nas vendas. Poderia haver variáveis ​​confundidoras, como as pessoas preferirem tratamentos frios em clima quente. As pessoas não compram sorvete apenas porque a temperatura aumentou; elas compram porque o acham refrescante no calor.

Portanto, embora haja uma correlação clara entre a temperatura e as vendas de sorvete, não podemos dizer definitivamente que temperaturas mais altas causem um aumento nas vendas sem considerar outros fatores. Fazer declarações causais exige um exame mais rigoroso e, idealmente, experimentos controlados para descartar ou considerar possíveis variáveis ​​confundidoras.

Aqui está o conjunto de dados que utilizaremos neste capítulo. Sinta-se à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

1234567
import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head())
copy
Tarefa
test

Swipe to show code editor

Utilizando o conjunto de dados tips do Seaborn, realize as seguintes tarefas:

  1. Determine o coeficiente de correlação de Pearson entre as colunas total_bill e tip, o qual fornece uma medida da associação linear entre as duas variáveis numéricas.
  2. Visualize a relação entre total_bill (para o eixo X) e tip (para o eixo Y) com um gráfico de regressão linear, permitindo observar como mudanças no total_bill podem prever alterações na tip.
  3. Crie uma matriz de correlações para as variáveis categóricas no conjunto de dados usando o V de Cramér, uma medida baseada na estatística qui-quadrado que quantifica a associação entre duas variáveis categóricas.
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 6. Capítulo 5
toggle bottom row

book
Desafio 5: Correlação

Distinguir entre correlação e causalidade é um conceito fundamental em estatísticas. Embora a correlação denote uma relação entre duas variáveis, isso não implica que uma variável causa a outra. A causalidade, por outro lado, sugere uma relação direta onde uma mudança em uma variável resulta em uma mudança em outra.

Por exemplo, considere uma sorveteria que percebe um aumento nas vendas nos meses de verão e uma diminuição no inverno. Enquanto há uma correlação entre a temperatura e as vendas de sorvete, isso não significa que temperaturas mais altas causem um aumento nas vendas. Poderia haver variáveis ​​confundidoras, como as pessoas preferirem tratamentos frios em clima quente. As pessoas não compram sorvete apenas porque a temperatura aumentou; elas compram porque o acham refrescante no calor.

Portanto, embora haja uma correlação clara entre a temperatura e as vendas de sorvete, não podemos dizer definitivamente que temperaturas mais altas causem um aumento nas vendas sem considerar outros fatores. Fazer declarações causais exige um exame mais rigoroso e, idealmente, experimentos controlados para descartar ou considerar possíveis variáveis ​​confundidoras.

Aqui está o conjunto de dados que utilizaremos neste capítulo. Sinta-se à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

1234567
import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head())
copy
Tarefa
test

Swipe to show code editor

Utilizando o conjunto de dados tips do Seaborn, realize as seguintes tarefas:

  1. Determine o coeficiente de correlação de Pearson entre as colunas total_bill e tip, o qual fornece uma medida da associação linear entre as duas variáveis numéricas.
  2. Visualize a relação entre total_bill (para o eixo X) e tip (para o eixo Y) com um gráfico de regressão linear, permitindo observar como mudanças no total_bill podem prever alterações na tip.
  3. Crie uma matriz de correlações para as variáveis categóricas no conjunto de dados usando o V de Cramér, uma medida baseada na estatística qui-quadrado que quantifica a associação entre duas variáveis categóricas.
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 6. Capítulo 5
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
We're sorry to hear that something went wrong. What happened?
some-alt