Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Desafio 3: Teste de Hipóteses | Estatísticas
Desafio de Entrevista em Ciência de Dados
course content

Conteúdo do Curso

Desafio de Entrevista em Ciência de Dados

Desafio de Entrevista em Ciência de Dados

1. Python
2. NumPy
3. Pandas
4. Matplotlib
5. Seaborn
6. Estatísticas
7. Scikit-learn

Desafio 3: Teste de Hipóteses

O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.

Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.

Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

123456789101112131415161718
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
copy

Tarefa

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Tarefa

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Mude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo

Tudo estava claro?

Seção 6. Capítulo 3
toggle bottom row

Desafio 3: Teste de Hipóteses

O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.

Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.

Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

123456789101112131415161718
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
copy

Tarefa

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Tarefa

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Mude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo

Tudo estava claro?

Seção 6. Capítulo 3
toggle bottom row

Desafio 3: Teste de Hipóteses

O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.

Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.

Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

123456789101112131415161718
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
copy

Tarefa

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Tarefa

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Mude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo

Tudo estava claro?

O fascinante domínio da estatística abriga o intrincado processo de teste de hipóteses. Em sua essência, teste de hipóteses trata de fazer inferências a respeito de populações com base em dados amostrais. Formulamos hipóteses e as testamos, tirando conclusões sobre conjuntos de dados mais amplos ao analisar um subconjunto.

Por exemplo, se você estiver estudando o impacto de um novo método de ensino em uma sala de aula e observar uma melhoria significativa nas notas dos alunos, você pode dizer conclusivamente que o método é eficaz? A resposta está no teste de hipóteses.

Aqui está o conjunto de dados que usaremos neste capítulo. Fique à vontade para mergulhar e explorá-lo antes de enfrentar a tarefa.

123456789101112131415161718
import matplotlib.pyplot as plt import seaborn as sns # Load the dataset data = sns.load_dataset('tips') # Sample of data display(data.head()) # Total bill amounts grouped by smoking status sns.boxplot(x='smoker', y='total_bill', data=data) plt.title('Total Bill Amounts Grouped by Smoking Status') plt.show() # Number of smokers vs. non-smokers by gender sns.countplot(x='sex', hue='smoker', data=data) plt.title('Number of Smokers vs. Non-Smokers by Gender') plt.show()
copy

Tarefa

Neste exercício, utilizando o conjunto de dados tips do Seaborn, você vai:

  1. Testar se há uma diferença significativa nos montantes da total_bill entre fumantes e não fumantes. Utilize o teste U de Mann-Whitney.
  2. Examinar a relação entre as colunas sex e smoker, determinando se essas duas variáveis categóricas são independentes uma da outra.

Nota

Nesta tarefa, o nível de significância (alfa) para o valor-p está definido como 0,1, ao invés do convencional 0,05. A escolha do alfa pode variar entre tarefas baseado no contexto, no nível de rigor necessário, ou práticas específicas da indústria; valores comumente adotados incluem 0,01, 0,05 e 0,1.

Mude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Seção 6. Capítulo 3
Mude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
We're sorry to hear that something went wrong. What happened?
some-alt