



Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Este documento explica as principais diferenças entre testes paramétricos e não-paramétricos, com ênfase no teste t para duas amostras independentes com variâncias iguais e desiguais. O texto aborda as hipóteses, a estatística do teste, a decisão de rejeitar ou não a hipótese nula e o uso de testes alternativos. Além disso, são apresentados exemplos de aplicação do teste t.
Tipologia: Notas de estudo
1 / 7
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Diferenças entre testes
paramétricos e não-paramétricos
Transformar os dados (ex. calculando o logaritmo ou
a raiz quadrada) em uma tentativa de obter uma
distribuição aproximadamente Normal;
Desvantagem: a interpretação dos resultados fica mais
complexa.
Utilizar um teste não-paramétrico adequado. Os
testes não-paramétricos não fazem suposições sobre
a distribuição dos dados.
Implicações do tamanho da
amostra
Teste t para 2 amostras
1 1 2
0 1 2
1 1 2
0 1 2
ou
s : desvio padrão conjugado
2
2 2
1
2 1
1 2
com 2 grausdeliberdade
1 2
1 2
2
1 2
n n
n n
s
x x t
2
1 2
2 2 2
2 2 1 1
n n
n s n s s
1 2
x x
Teste t para 2 amostras independentes (e
variâncias iguais)
indivíduos sorteados aleatoriamente da população
duas amostras devem ser independentes
a variável de interesse deve se distribuir de forma Normal
em cada uma das populações (das quais as amostras
foram colhidas)
Deve-se saber se as variâncias são aproximadamente
iguais ou não
Voltando ao nosso exemplo...
Nesse caso: t =2,
1 2
1 2
2
1 2
1 2
2 2 2
2 (^211)
Há uma chance de 1,8% de obter uma
diferença entre os pesos médios de 1,59 kg
ou superior, se a hipótese nula for verdadeira.
s : desvio padrão conjugado
Two-Sample T-Test and CI: dieta; controle
Two-sample T for dieta vs controle
N Mean StDev SE Mean
dieta 24 67,37 2,25 0,
controle 30 65,77 2,50 0,
Difference = mu dieta - mu controle
Estimate for difference: 1,
95% CI for difference: (0,279; 2,908)
T-Test of difference = 0 (vs not =): T-Value = 2,43 P-Value = 0,
DF = 52
Both use Pooled StDev = 2,
É pouco provável que a hipótese nula – que é a hipótese de que
não há diferença entre os pesos – seja verdadeira. Assim,
rejeitamos a hipótese nula em favor da hipótese alternativa,
de que há diferença entre os pesos médios. Além disso, o
peso das ovelhas que passaram pelo processo de flushing é,
em média, 1,59kg superior ao das ovelhas do grupo-controle.
médias:
IC 95% para a diferença: (0,279; 2,908)
IC 95% não inclui o valor 0 (zero). Portanto, a diferença entre
as médias não é compatível com 0, o que confirma a rejeição
da hipótese nula.
Teste t para 2 amostras independentes
(variâncias desiguais)
Nesse caso, utiliza-se um
teste t modificado, com a
seguinte estatística:
Como esse teste não segue
uma distribuição t , o cálculo
do valor de p não é direto.
No entanto, os pacotes
estatísticos (como o
Minitab) incluem essa
opção de teste, e fazem a
estimativa de p.
2
2
2
1
2
1
1 2
15 20 25 30
40
30
20
10
0
Período de pré-muda (dias)
Freqüência absoluta
o
o
15 20 25 30
40
30
20
10
0
Período de pré-muda (dias)
Freqüência absoluta
Exemplo – Teste t para amostras
independentes (variâncias desiguais)
1 1 2
0 1 2
Descriptive Statistics: t25; t
Variable N Mean Median TrMean StDev SE Mean t25 100 18,766 18,771 18,742 0,889 0, t23 100 24,996 25,036 24,943 2,016 0,
Variable Minimum Maximum Q1 Q t25 16,912 21,241 18,057 19, t23 20,376 30,891 23,863 26,
17,25 18,00 18,75 19,50 20,25 21,
95% Confidence Interval for Mu
18,55 18,65 18,75 18,85 18,95 19,
95% Confidence Interval for Median
Variable: t
A-Squared: P-Value: Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum
18,
0,
18,
0, 0, 18, 0, 0, 0, 4,28E- 100 16, 18, 18, 19, 21,
18,
1,
19,
Anderson-Darling Normality Test
95% Confidence Interval for Mu
95% Confidence Interval for Sigma
95% Confidence Interval for Median
Descriptive Statistics
20 22 24 26 28 30
95% Confidence Interval for Mu
24,6 24,8 25,0 25,2 25,
95% Confidence Interval for Median
Variable: t
A-Squared: P-Value: Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum
24,
1,
24,
0, 0, 24, 2, 4, 0, 0, 100 20, 23, 25, 26, 30,
25,
2,
25,
Anderson-Darling Normality Test
95% Confidence Interval for Mu
95% Confidence Interval for Sigma
95% Confidence Interval for Median
Descriptive Statistics
p =0,
p =0,
1,0 1,5 2,0 2,
95% Confidence Intervals for Sigmas
t
t
20 25 30
Boxplots of Raw Data
P-Value : 0,
Test Statistic: 33,
Levene's Test
P-Value : 0,
Test Statistic: 5,
F-Test
Factor Levels
t
t
Test for Equal Variances
p < 0,001 variâncias desiguais
considerando variâncias desiguais
Two-Sample T-Test and CI: t23; t
Two-sample T for t23 vs t
N Mean StDev SE Mean t23 100 25,00 2,02 0, t25 100 18,766 0,889 0,
Difference = mu t23 - mu t Estimate for difference: 6, 95% CI for difference: (5,794; 6,665)
T-Test of difference = 0 (vs not =): T-Value = 28,27 P-Value = 0,000 DF = 136
O valor de p é muito pequeno ( p <0,001), e, portanto,
rejeitamos a hipótese nula de igualdade. Ou seja, os
tempos médios de pré-muda para as temperaturas de
23 °C e 25 °C são significativamente diferentes, com base
nas informações dessas amostras.
t23 t
30
25
20
Boxplots of t23 and t (means are indicated by solid circles)
O teste t pareado é utilizado quando selecionamos duas
amostras com observações dependentes ou pareadas.
auto-pareamento: cada animal selecionado da população é seu
próprio controle;
pareamento natural (filhotes da mesma ninhada, gêmeos);
pareamento de animais idênticos.
É baseado na hipótese de que diferenças entre pares de
observações se distribuem de forma aproximadamente Normal,
embora as observações originais nos grupos possam não
apresentar distribuição Normal.
Porém, nos casos em que se suspeita que as diferenças não sigam a Normal, podem ser utilizados: transformação dos dados;
teste não-paramétrico.
Para validar esta premissa, é possível testar a normalidade das
amostras separadamente, ao invés de testar as diferenças
Se a hipótese nula for verdadeira, há uma chance de apenas
0,1% (p=0,001) de observarmos uma diferença média tão
grande quanto 3,81 mmol/l. Como a diferença média é
significativamente diferente de zero, rejeitamos H 0
. A dieta
com fibra altamente insolúvel reduz de modo significativo o
nível de glicose em relação à dieta com fibra pouco insolúvel.
IC 95% para a diferença: (1,866; 5,751)
IC 95% não inclui o 0 (zero), o que confirma a rejeição de H 0
0 1 2 3 4 5 6 7 8 9 Differences
Dotplot of Differences (with Ho and 95% t-confidence interval for the mean)
[ ] X _ Ho