<<Conteúdo

Duas amostras com variâncias iguais e diferentes


1. Introdução e manipulação de dados:
  • criar objeto data frame;
  • ver conteúdo de objeto;
  • ver sumário dos dados do objeto;
  • criar gráfico de caixa;
  • adicionar objeto no caminho de procura;
  • retirar objeto do caminho de procura;
  • salvar/criar arquivo;
  • limpar a área de trabalho da seção ativa.

  • 2. Teste de normalidade dos dados:
  • teste de Shapiro-Wilk.
  • teste de Kolmogorov-Smirnov.

  • 3. Teste de homogeneidade das variâncias para duas amostras:
  • teste F;

  • 4. Teste de homogeneidade das variâncias para mais de duas amostras:
  • teste de Bartlett;

  • 5. Teste t de Student's para duas amostras com variâncias semelhantes.

    6. Teste t de Student's para duas amostras com variâncias diferentes.

    Arquivo: ar_ex_4.RData.
    objetos: ob_tp1, ob_tp2, ob_tp3.

    OBS:
    - exemplo com dados do arquivo Estadistica_R.pdf: Cartas sobre Estadística página 17 Estadistica_R.pdf;
    - neste exemplo as variâncias são diferentes e, os grupos também são diferentes na comparação do teste de média.

    Criar objeto data.frame:
    ob_tp1 <- edit(data.frame())

    Ver o objeto ob_tp1:
    > ob_tp1
    imcc imcp
    1 23.6 25.6
    2 22.7 22.7
    3 21.2 25.9
    4 21.7 24.3
    5 20.7 25.2
    6 22.0 29.6
    7 21.8 21.3
    8 24.2 25.5
    9 20.1 27.4
    10 21.3 22.3
    11 20.5 24.4
    12 21.1 23.7
    13 21.4 20.6
    14 22.2 22.8
    15 22.6 NA
    16 20.4 NA
    17 23.3 NA
    18 24.8 NA

    Ver sumário do objeto ob_tp1:
    summary(ob_tp1)
    imcc imcp
    Min. :20.10 Min. :20.60
    1st Qu. :21.12 1st Qu.:22.73
    Median :21.75 Median :24.35
    Mean :21.98 Mean :24.38
    3rd Qu. :22.68 3rd Qu.:25.57
    Max. :24.80 Max. :29.60
    NA's : 4.00

    Criar gráfico de caixa:
    > boxplot(ob_tp1)

    OBS: teste de normalidade dos dados, Shapiro-Wilk.

    Teste de Shapiro-Wilk:
    > shapiro.test(ob_tp1$imcc)
    >
    Shapiro-Wilk normality test

    data: ob_tp1$imcc)
    W = 0.9532, p-value = 0.4776

    OBS: teste de normalidade dos dados, Kolmogorov-Smirnov.

    Teste de Kolmogorov-Smirnov:
    ks.test(ob_tp1$imcc,"pnorm",mean=mean(ob_tp1$imcc),sd=sd(ob_tp1$imcc))

    One-sample Kolmogorov-Smirnov test

    data: ob_tp1$imcc
    D = 0.1117, p-value = 0.9595
    alternative hypothesis: two-sided

    OBS: teste de homogeneidade das variâncias para duas amostras, Teste F.
    Teste F:
    >var.test(ob_tp1$imcc, ob_tp1$imcp)

    F test to compare two variances

    data: ob_tp1$imcc and ob_tp1$imcp
    F = 0.3055, num df = 17, denom df = 13, p-value = 0.02401
    alternative hypothesis: true ratio of variances is not equal to 1
    95 percent confidence interval:
    0.1016868 0.8510901
    sample estimates:
    ratio of variances
    0.3054565

    OBS: teste de homogeneidade das variâncias em mais de duas amostras, Bartlett.

    Teste de Bartlett:
    > bartlett.test(ob_tp1)

    Bartlett test of homogeneity of variances

    data: ob_tp1
    Bartlett's K-squared = 4.9857, df = 1, p-value = 0.02556

    OBS: 1. teste de homogeneidade das variâncias em duas amostras, Teste F (testa a igualdade das variâncias de duas amostras/populações), bicaudal testa se as variâncias das duas amostras são diferentes, unicaudal testa se uma variância e maior que a outra.
    2. Em um estudo experimental ou observacional, no qual o objetivo é comparar o efeito de uma tratamento ou fator atuado sobre as unidades experimentais de uma mesma população, da qual estão sendo retiradas amostras, o esperado e ter variâncias iguais.
    3. Uso de teste de verificação da igualdade de variâncias tem sido questionado por ser muito sensível à suposição de normalidade e ter baixo poder de detectar situações em que o teste t deve ser evitado. Em substituição autores recomendam, quando a dúvidas sobre a iguadade das variâncias, utilizar o teste t de Student's para variâncias diferentes. Para detalhes consultar Markowski e Markowski (1990); Moser e Stevens (1992); Pagano e Gauvreau (2004).

    Teste t de Student's para duas amostras com variância diferentes:
    t.test(ob_tp1$imcc, ob_tp1$imcp , var.eq=F)

    Welch Two Sample t-test

    data: ob_tp1$imcc and ob_tp1$imcp
    t = -3.34, df = 19.087, p-value = 0.003424
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:
    -3.9048035 -0.8967838
    sample estimates:
    mean of x mean of y
    21.97778 24.37857

    Valores de p = 0,003424, rejeita-se a hipote nula, ou seja os dois grupos são diferentes, a média do grupo imcc e menor que a do grupo imcp. Os pacientes com diabéticos e outras complicações(imcp) têm estatisticamente maior IMC.

    OBS:
    - exemplo com dados do livro Curso de estatística aplicada à biologia, página 83;
    - neste exemplo as variâncias são iguais, mas os grupos são diferentes, na comparação do teste de média.

    Criar objeto data frame:
    ob_tp2 <- edit(data.frame())

    Ver o conteúdo do objeto ob_tp2:
    > ob_tp2
    a b
    1 9 14
    2 4 9
    3 7 13
    4 10 12
    5 9 13
    6 10 8
    7 NA 10

    Ver o sumário dos dados:
    > summary(ob_tp2)
    a b
    Min. : 4.000 Min. : 8.00
    1st Qu.: 7.500 1st Qu.: 9.50
    Median : 9.000 Median :12.00
    Mean : 8.167 Mean :11.29
    3rd Qu.: 9.750 3rd Qu.:13.00
    Max. :10.000 Max. :14.00
    NA's : 1.000

    Criar gráfico de caixa:
    > boxplot (ob_tp2)

    Anexar objeto no caminho de procura:
    > attach(ob_tp2)

    > shapiro.test(b)

    Shapiro-Wilk normality test

    data: b
    W = 0.9189, p-value = 0.4612

    Teste Kolmogorov-Smirnov:
    ks.test(b,"pnorm",mean=mean(b),sd=sd(b))

    One-sample Kolmogorov-Smirnov test

    data: b
    D = 0.2017, p-value = 0.9384
    alternative hypothesis: two-sided

    Warning message:
    cannot compute correct p-values with ties in: ks.test(b, "pnorm", mean = mean(b), sd = sd(b))

    Os valores de p nos testes de Shapiro-Wilk e Kolmogorov-Smirnov foram maior que 0,05, aceita-se a hipotese nula, a distribuição é normal.

    Teste F:
    > var.test(a, b)

    F test to compare two variances

    data: a and b
    F = 1.0245, num df = 5, denom df = 6, p-value = 0.9573
    alternative hypothesis: true ratio of variances is not equal to 1
    95 percent confidence interval:
    0.1711122 7.1489727
    sample estimates:
    ratio of variances
    1.024545

    Teste Bartlett:
    > bartlett.test(ob_tp2)

    Bartlett test of homogeneity of variances

    data: ob_tp2
    Bartlett's K-squared = 7e-04, df = 1, p-value = 0.9784

    Os valores de p nos testes F, Bartlett, foram maior que 0,05, aceita-se a hipotese nula, as variâncias são iguais.

    Teste t de Student's para duas amostras com variâncias iguais:
    > t.test(a, b, var.eq=T)

    Two Sample t-test

    data: a and b
    t = -2.436, df = 11, p-value = 0.03306
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:
    -5.9371719 -0.3009233
    sample estimates:
    mean of x mean of y
    8.166667 11.285714

    Valores de p = 0,03306, rejeita-se a hipotese nula, ou seja, os dois grupos são diferentes, a média do grupo a é estatisticamente menor que a do grupo b.

    Retirar objeto do caminho de procura:
    > detach(ob_tp2)

    OBS:
    - exemplo com dados do arquivo Rembrapa.pdf: Introdução ao sistema estatística R Mini-curso EMBRAPA, página 137; Rembrapa.pdf
    - neste exemplo as variâncias são iguais, e também os grupos são iguais, na comparação do teste de média.

    Criar objeto data frame:
    > ob_tp3 <- edit(data.frame())

    Ver o conteúdo de objeto:
    > ob_tp3
    ma mb
    1 145 143
    2 127 128
    3 136 132
    4 142 138
    5 141 142
    6 137 132

    Ver o sumário dos dados:
    > summary(ob_tp3)
    ma mb
    Min. :127.0 Min. :128.0
    1st Qu.:136.2 1st Qu.:132.0
    Median :139.0 Median :135.0
    Mean :138.0 Mean :135.8
    3rd Qu.:141.8 3rd Qu.:141.0
    Max. :145.0 Max. :143.0

    Fazer gráfico de caixa:
    > boxplot(ob_tp3)

    Anexar objeto no caminho de procura:
    > attach(ob_tp3)

    Teste Shapiro-Wilk:
    > shapiro.test(mb)

    Shapiro-Wilk normality test

    data: mb
    W = 0.9117, p-value = 0.4476

    > shapiro.test(ma)

    Shapiro-Wilk normality test

    data: ma
    W = 0.9263, p-value = 0.5516

    Teste de Kolmogorov-Smirnov:
    ks.test(ma,"pnorm",mean=mean(ma),sd=sd(ma))

    One-sample Kolmogorov-Smirnov test

    data: ma
    D = 0.2092, p-value = 0.9094
    alternative hypothesis: two-sided

    > ks.test(mb,"pnorm",mean=mean(mb),sd=sd(mb))

    One-sample Kolmogorov-Smirnov test

    data: mb
    D = 0.2358, p-value = 0.8925
    alternative hypothesis: two-sided

    Warning message:
    cannot compute correct p-values with ties in: ks.test(mb, "pnorm", mean = mean(mb), sd = sd(mb)

    Os valores de p nos testes de Shapiro-Wilk e Kolmogorov-Smirnov foram maior que 0,05, aceita-se da hipotese nula, a distribuição é normal.

    Teste F:
    > var.test(ma,mb)

    F test to compare two variances

    data: ob_tp3$ma and ob_tp3$mb
    F = 1.0821, num df = 5, denom df = 5, p-value = 0.9331
    alternative hypothesis: true ratio of variances is not equal to 1
    95 percent confidence interval:
    0.1514131 7.7327847
    sample estimates:
    ratio of variances
    1.082056

    Teste de Bartlett:
    > bartlett.test(ob_tp3)

    Bartlett test of homogeneity of variances

    data: ob_tp3
    Bartlett's K-squared = 0.0071, df = 1, p-value = 0.933

    Os valores de p nos testes F e Bartlett,foram maior que 0,05, aceita-se da hipotese nula, as variâncias são iguais. As amostras são de uma mesma população.

    Teste t de student's para duas amostras com variância iguais:
    > t.test(ma, mb, var.eq=T)

    Welch Two Sample t-test

    data: ma and mb
    t = 0.6049, df = 9.984, p-value = 0.5587
    alternative hypothesis: true difference in means is not equal to 0
    95 percent confidence interval:
    -5.815291 10.148624
    sample estimates:
    mean of x mean of y
    138.0000 135.8333

    Valores de p = 0,5587, aceita-se a hipotese nula, ou seja, os dois grupos são iguais, a média do grupo ma é estatisticamente igual a média do grupo mb.

    Retirar objeto do caminho de procura:
    > detach(ob_tp3)

    Gravar/criar arquivo:
    > save.image ("ar_ex_4.RData")
    > save.image ("ar_ex_4.Rhistory")

    Limpar a área de trabalho da seção ativa:
    >rm(list = ls(all = TRUE))

    CENTENO, A. J. Curso de estatística aplicada à biologia. Goiânia: UFG, 1982. 188p.

    MARKOWSKI, C. A.; MARKOWSKI, E. P. conditions for the Effectiveness of a preliminary test of variance. The American Statistic. v.44, n. p.322-326. 1990.

    MOSER, B.K.; STEVENS, G.R. Homogenetity of variance in the two-sample means test. The American Statistic. v.46, n. p.19-21. 1992

    PAGANO, M.; GAUVREAU, K. Princípios de bioestatística. Tradução Luiz Sérgio de Castro Paiva. São Paulo: Pioneira, 2004. 506p.

    RIBEIRO Jr, P. J. Introdução ao sistema estatística R Mini-curso EMBRAPA, Paulo Justiniano Ribeiro Junior

    RISK, M. R, Cartas sobre Estadística de la Revista Argentina de Bioingeniería, Estadistica_R.pdf