Conteúdo do Curso
Desafio de Entrevista em Ciência de Dados
Desafio de Entrevista em Ciência de Dados
Desafio 3: Teste de Hipóteses
O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.
Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.
Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
Swipe to show code editor
Neste exercício, utilizando o conjunto de dados tips
do Seaborn, você vai:
- Testar se há uma diferença significativa nos montantes da
total_bill
entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney. - Examinar a relação entre as colunas
sex
esmoker
, determinando se essas duas variáveis categóricas são independentes uma da outra.
Nota
Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como
0,1
, ao invés do convencional0,05
. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem0,01
,0,05
e0,1
.
Obrigado pelo seu feedback!
Desafio 3: Teste de Hipóteses
O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.
Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.
Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
Swipe to show code editor
Neste exercício, utilizando o conjunto de dados tips
do Seaborn, você vai:
- Testar se há uma diferença significativa nos montantes da
total_bill
entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney. - Examinar a relação entre as colunas
sex
esmoker
, determinando se essas duas variáveis categóricas são independentes uma da outra.
Nota
Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como
0,1
, ao invés do convencional0,05
. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem0,01
,0,05
e0,1
.
Obrigado pelo seu feedback!