Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Diferenças entre testes paramétricos e não-paramétricos: Testes t para duas amostras, Notas de estudo de Estatística

Este documento explica as principais diferenças entre testes paramétricos e não-paramétricos, com ênfase no teste t para duas amostras independentes com variâncias iguais e desiguais. O texto aborda as hipóteses, a estatística do teste, a decisão de rejeitar ou não a hipótese nula e o uso de testes alternativos. Além disso, são apresentados exemplos de aplicação do teste t.

Tipologia: Notas de estudo

2022

Compartilhado em 07/11/2022

Tucupi
Tucupi 🇧🇷

4.6

(74)

401 documentos

1 / 7

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
1
Comparação de duas
médias amostrais
Tratamento Paramétrico
Aula de hoje
Diferenças entre testes
paramétricos e não-paramétricos
Testes paramétricos:
Baseados em parâmetros da amostra (média e
desvio-padrão).
Fazem pressupostos sobre a distribuição dos
dados (distribuição normal)
Testes não-paramétricos:
Baseiam-se em postos (ranks) dos dados.
Pouco influenciados por valores extremos
Não fazem pressupostos sobre a distribuição dos
dados
Transformação
E quando houver uma clara discrepância dos
dados em relação à distribuição Normal?
Duas saídas possíveis:
Transformar os dados (ex. calculando o logaritmo ou
a raiz quadrada) em uma tentativa de obter uma
distribuição aproximadamente Normal;
Desvantagem: a interpretação dos resultados fica mais
complexa.
Utilizar um teste não-paramétrico adequado. Os
testes não-paramétricos não fazem suposições sobre
a distribuição dos dados.
Implicações do tamanho da
amostra
Amostras muito pequenas (< 6 observações):
Testes de normalidade e variância se tornam
pouco confiáveis nessas situações,
comprometendo a validação das premissas,
e portanto sugere-se utilizar testes não-
paramétricos.
pf3
pf4
pf5

Pré-visualização parcial do texto

Baixe Diferenças entre testes paramétricos e não-paramétricos: Testes t para duas amostras e outras Notas de estudo em PDF para Estatística, somente na Docsity!

Comparação de duas

médias amostrais

Tratamento Paramétrico

Aula de hoje

Diferenças entre testes

paramétricos e não-paramétricos

 Testes paramétricos:

 Baseados em parâmetros da amostra (média e

desvio-padrão).

 Fazem pressupostos sobre a distribuição dos

dados (distribuição normal)

 Testes não-paramétricos:

 Baseiam-se em postos ( ranks ) dos dados.

 Pouco influenciados por valores extremos

 Não fazem pressupostos sobre a distribuição dos

dados

Transformação

 E quando houver uma clara discrepância dos

dados em relação à distribuição Normal?

 Duas saídas possíveis:

 Transformar os dados (ex. calculando o logaritmo ou

a raiz quadrada) em uma tentativa de obter uma

distribuição aproximadamente Normal;

 Desvantagem: a interpretação dos resultados fica mais

complexa.

 Utilizar um teste não-paramétrico adequado. Os

testes não-paramétricos não fazem suposições sobre

a distribuição dos dados.

Implicações do tamanho da

amostra

 Amostras muito pequenas (< 6 observações):

Testes de normalidade e variância se tornam

pouco confiáveis nessas situações,

comprometendo a validação das premissas,

e portanto sugere-se utilizar testes não-

paramétricos.

Teste t para 2 amostras

Hipóteses do teste:

 Hipótese nula : média das duas populações são

iguais.

 Hipótese alternativa : média das duas populações

são diferentes.

1 1 2

0 1 2

 

 

H

H

1 1 2

0 1 2

 

 

H

H

ou

 Variâncias iguais:

 Variâncias diferentes:

Funcionamento do teste t para

2 amostras independentes

s : desvio padrão conjugado

2

2 2

1

2 1

1 2

n

s

n

s

x x

t

com 2 grausdeliberdade

1 2

1 2

2

1 2

n n

n n

s

x x t

2

1 2

2 2 2

2 2 1 1

 

n n

n s n s s

Cálculo do valor de p e

distribuição t de student

 O valor de p é a probabilidade de obter uma

dada diferença entre as médias

dado que H0 é verdadeira.

1 2

xx

Teste t para 2 amostras independentes (e

variâncias iguais)

 O teste t para 2 amostras independentes também é

conhecido como teste t não-pareado

 Comparação de médias de 2 grupos

independentes de observações usando amostras

representativas.

 Premissas (suposições):

 indivíduos sorteados aleatoriamente da população

 duas amostras devem ser independentes

 a variável de interesse deve se distribuir de forma Normal

em cada uma das populações (das quais as amostras

foram colhidas)

 Deve-se saber se as variâncias são aproximadamente

iguais ou não

Premissas

 Distribuição normal: Adequado a dados com

distribuição simétrica, o que levou à

simplificação de que o teste é mais

adequado para dados com distribuição

normal.

 Variâncias iguais (homocedasticidade) ou

variâncias diferentes (heterocedasticidade):

Necessário saber se as variâncias das

populações estudadas são iguais ou

diferentes entre si

Exemplo (Teste t – 2 amostras

independentes)

 Comparação do peso médio de um grupo de

24 ovelhas que passou por um processo de

flushing (recebeu nutrição altamente calórica

algumas semanas antes do acasalamento)

com um grupo-controle de 30 ovelhas.

Voltando ao nosso exemplo...

  1. Calcular a estatística (fórmula) do teste t.

Nesse caso: t =2,

com 2 grausdeliberdade

1 2

1 2

2

1 2

n n

n n

s

x x

t

1 2

2 2 2

2 (^211)

n n

n s n s

s

  1. Obter o valor de p: p =0,

Há uma chance de 1,8% de obter uma

diferença entre os pesos médios de 1,59 kg

ou superior, se a hipótese nula for verdadeira.

s : desvio padrão conjugado

Two-Sample T-Test and CI: dieta; controle

Two-sample T for dieta vs controle

N Mean StDev SE Mean

dieta 24 67,37 2,25 0,

controle 30 65,77 2,50 0,

Difference = mu dieta - mu controle

Estimate for difference: 1,

95% CI for difference: (0,279; 2,908)

T-Test of difference = 0 (vs not =): T-Value = 2,43 P-Value = 0,

DF = 52

Both use Pooled StDev = 2,

  1. Decidir se rejeita ou não H 0

É pouco provável que a hipótese nula – que é a hipótese de que

não há diferença entre os pesos – seja verdadeira. Assim,

rejeitamos a hipótese nula em favor da hipótese alternativa,

de que há diferença entre os pesos médios. Além disso, o

peso das ovelhas que passaram pelo processo de flushing é,

em média, 1,59kg superior ao das ovelhas do grupo-controle.

  1. Intervalo de confiança de 95% para a diferença entre as

médias:

IC 95% para a diferença: (0,279; 2,908)

IC 95% não inclui o valor 0 (zero). Portanto, a diferença entre

as médias não é compatível com 0, o que confirma a rejeição

da hipótese nula.

Teste t para 2 amostras independentes

(variâncias desiguais)

 Nesse caso, utiliza-se um

teste t modificado, com a

seguinte estatística:

 Como esse teste não segue

uma distribuição t , o cálculo

do valor de p não é direto.

No entanto, os pacotes

estatísticos (como o

Minitab) incluem essa

opção de teste, e fazem a

estimativa de p.

2

2

2

1

2

1

1 2

n

s

n

s

x x

t

15 20 25 30

40

30

20

10

0

Período de pré-muda (dias)

Freqüência absoluta

o

C

o

C

Período de pré-muda

de ninfa de carrapatos

(Dados hipotéticos)

15 20 25 30

40

30

20

10

0

Período de pré-muda (dias)

Freqüência absoluta

Histogramas

Exemplo – Teste t para amostras

independentes (variâncias desiguais)

 Exemplo: Comparar os tempos médios

de pré-muda (em dias) de ninfa do

carrapato Amblyomma cajennense , em

laboratório, nas temperaturas de 23°C e

25 °C.

1) Hipóteses:

1 1 2

0 1 2

H

H

Descriptive Statistics: t25; t

Variable N Mean Median TrMean StDev SE Mean t25 100 18,766 18,771 18,742 0,889 0, t23 100 24,996 25,036 24,943 2,016 0,

Variable Minimum Maximum Q1 Q t25 16,912 21,241 18,057 19, t23 20,376 30,891 23,863 26,

17,25 18,00 18,75 19,50 20,25 21,

95% Confidence Interval for Mu

18,55 18,65 18,75 18,85 18,95 19,

95% Confidence Interval for Median

Variable: t

A-Squared: P-Value: Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum

18,

0,

18,

0, 0, 18, 0, 0, 0, 4,28E- 100 16, 18, 18, 19, 21,

18,

1,

19,

Anderson-Darling Normality Test

95% Confidence Interval for Mu

95% Confidence Interval for Sigma

95% Confidence Interval for Median

Descriptive Statistics

Confirmando a

Normalidade dos

dados

20 22 24 26 28 30

95% Confidence Interval for Mu

24,6 24,8 25,0 25,2 25,

95% Confidence Interval for Median

Variable: t

A-Squared: P-Value: Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum

24,

1,

24,

0, 0, 24, 2, 4, 0, 0, 100 20, 23, 25, 26, 30,

25,

2,

25,

Anderson-Darling Normality Test

95% Confidence Interval for Mu

95% Confidence Interval for Sigma

95% Confidence Interval for Median

Descriptive Statistics

p =0,

p =0,

  1. Verificando se as variâncias são iguais (teste F)

1,0 1,5 2,0 2,

95% Confidence Intervals for Sigmas

t

t

20 25 30

Boxplots of Raw Data

P-Value : 0,

Test Statistic: 33,

Levene's Test

P-Value : 0,

Test Statistic: 5,

F-Test

Factor Levels

t

t

Test for Equal Variances

p < 0,001  variâncias desiguais

  1. Resultados do teste t para 2 médias amostrais

considerando variâncias desiguais

Two-Sample T-Test and CI: t23; t

Two-sample T for t23 vs t

N Mean StDev SE Mean t23 100 25,00 2,02 0, t25 100 18,766 0,889 0,

Difference = mu t23 - mu t Estimate for difference: 6, 95% CI for difference: (5,794; 6,665)

T-Test of difference = 0 (vs not =): T-Value = 28,27 P-Value = 0,000 DF = 136

  1. Decidir se rejeita ou não a hipótese nula:

O valor de p é muito pequeno ( p <0,001), e, portanto,

rejeitamos a hipótese nula de igualdade. Ou seja, os

tempos médios de pré-muda para as temperaturas de

23 °C e 25 °C são significativamente diferentes, com base

nas informações dessas amostras.

t23 t

30

25

20

Boxplots of t23 and t (means are indicated by solid circles)

Teste t pareado

 O teste t pareado é utilizado quando selecionamos duas

amostras com observações dependentes ou pareadas.

 auto-pareamento: cada animal selecionado da população é seu

próprio controle;

 pareamento natural (filhotes da mesma ninhada, gêmeos);

 pareamento de animais idênticos.

 É baseado na hipótese de que diferenças entre pares de

observações se distribuem de forma aproximadamente Normal,

embora as observações originais nos grupos possam não

apresentar distribuição Normal.

 Porém, nos casos em que se suspeita que as diferenças não sigam a Normal, podem ser utilizados: transformação dos dados;

teste não-paramétrico.

 Para validar esta premissa, é possível testar a normalidade das

amostras separadamente, ao invés de testar as diferenças

Exemplo (teste t pareado)

 Um grupo de pesquisadores (Nelson et al. , 1998)

fez uma comparação de duas diferentes dietas em

11 cães diabéticos, medindo o nível sérico de

glicose como uma variável indicadora da qualidade

do controle de diabetes. As dietas ou continham

fibra pouco insolúvel (LF) ou fibra altamente

insolúvel (HF). Os cães foram alocados de modo

aleatório para receber uma das dietas primeiro.

 Esse tipo de delineamento é conhecido como

“cross-over” ( randomized cross-over trial ).

  1. Decidir se rejeita ou não H 0

Se a hipótese nula for verdadeira, há uma chance de apenas

0,1% (p=0,001) de observarmos uma diferença média tão

grande quanto 3,81 mmol/l. Como a diferença média é

significativamente diferente de zero, rejeitamos H 0

. A dieta

com fibra altamente insolúvel reduz de modo significativo o

nível de glicose em relação à dieta com fibra pouco insolúvel.

  1. Intervalo de confiança de 95% para a diferença média:

IC 95% para a diferença: (1,866; 5,751)

IC 95% não inclui o 0 (zero), o que confirma a rejeição de H 0

0 1 2 3 4 5 6 7 8 9 Differences

Dotplot of Differences (with Ho and 95% t-confidence interval for the mean)

[ ] X _ Ho