Determinando o tamanho amostral com R

Ao planejar um experimento o pesquisador defronta-se com uma série de questões. Unidades experimentais devem esta adequadas ao objetivo do trabalho, a correta aleatorização dos tratamentos, definição da resposta medida, desenho experimental, custo do experimento. Somado a todas as questões acima surge a seguinte questão: Quantas observações são necessárias para realizar esse experimento?

Um experimento eficiente deve ter uma amostra grande o suficiente para que um efeito de “significância estatística” tenha “significância científica“. Experimentos onde pequenos efeitos possuem significância científica podem não apresentar significancia estatística devido ao pequeno tamanho amostral. Por outro lado experimentos onde  grandes efeitos são observados, uma amostra muito grande é desnecessária. A determinação correta do tamanho amostral evita o desperdício de recursos financeiros, humanos e complicações com questões relacionadas a ética na experimentação, uma vez que evita o uso de excesso de animais que não agregam ganhos significativos de conhecimento.

A abordagem frequentista, baseada em encontrar o menor número amostral que permita ao teste estatístico atingir o “poder de analise”  esperado pelo pesquisador é uma das aproximações mais comuns na solução deste tipo de problema. O poder de um teste é definido como a probabilidade de rejeitar a hipótese nula quando ela é falsa. Em outras palavras é a probabilidade detectar um efeito estatístico quando ele realmente existir.

CodeCogsEqn

onde β é o erro tipo II (probabilidade de falsamente rejeitar H0 )

O R calcula o poder do teste baseado na seguinte probabilidade (Você pode aprofundar um pouco mais sobre o conceito de poder e tamanho amostral aqui  – disponivel via periódicos capes -)

onde K é o número de grupos,  N o tamanho amostral e é o parâmetro de não centralidade calculado como

Onde N = Tamanho amostral ; k= número de grupos ; = = é a diferença entre as média atual e a média da hipotese nula a qual o pesquisado deseja detectar

Generalizando quanto maior for o valor do parâmetro de não centralidade maior será o poder do teste. Conforme podemos observar esse valor  eleva-se com o aumento do tamanho amostral (N), aumento da diferença entre médias a ser detectada (), aumento do nível de significância (α) e redução da variância da resposta medida ().

Em geral o pesquisador pode definir todos esses parâmetros baseado em sua experiência ou através de pesquisas da literatura científica e experimentos piloto, levando em conta qual o tamanho do efeito é biologicamente significante e a quantidade de recursos a disposição. Experimentos devem possuir  poder mínimo de 80% para ser aceitável.

O R  fornece funções  que permitem estimar o tamanho amostral e o poder do teste.  vamos ver um exemplo de seu uso.

#Ex: 1: Um experimento esta  sendo planejado para comparar o efeito
#de dois tratamentos (A e B) sobre o consumo de ovinos.O pesquisador espera que o
#tratamento A  aumente o consumo em 100 g/dia em relação ao tratamento B (controle)
#para que o efeito científico seja significativo.Qual o tamanho amostral deverá o
#pesquisador utilizar para detectar um efeito estatístico significativo de 100 g/dia
#com um poder de 90% em um teste de hipótese a α=0,05, sabendo
#que a resposta consumo possui um desvio padrão de 50 gramas/dia.
#----------------------------------------
#Utilizando a função power.t.test {base}
#*******************************************************************

# Utilizadno a função básica do "power.t.test()"
power.t.test(  delta=100 ,sd =50, sig.level = 0.05,
             power = .90,type = "two.sample", alternative = "two.sided",
             strict = FALSE)
#Utilizando 7 animais em cada grupo (ou 14 animais ao todo)permitirá a detecção
#de resultados significantivos em 90% das vezes em que o aumento do consumo for maior
#que 100g/dia.
#********************************************************************

#Para experimentos ja realizados ( ou seja, conhecemos o tamanho amostral)
#ou quando por alguma limitação (p.ex financeira,espaço,etc..)definimos arbitraria-
#mente o tamanho da amostra, é possível averiguar o poder do teste e assim decidir
#sobre a confiança ou viabilidade de uso do experimento.
# Assim se no exemplo acima tivesse sido realizado com 4 animais, sem planejamento prévio
# e desejássemos saber a precisão do teste (ou seu Poder):

#power.t.test(  delta=100 ,sd =50, sig.level = 0.05,
               n=4,type = "two.sample", alternative = "two.sided",
               strict = FALSE)

#repare que podemos estimar cada uma das variáveis (power,delta, n) simplesmente por omitir uma
#destas variáveis nos argumentos da função  e fornecer as informações dos demais.
#É possível aumentar o poder do teste reduzindo a dispersão das observações.Isso pode ser obtido através
#através das estruturas de controle de fatores (p.ex blocagem).

O pacote OPDOE(OPtimal Design Of Experiments) (Petr Simecek, Juergen Pilz, Mingui Wang and Albrecht Gebhardt, 2014) fornece algumas funções mais específicas que permitem a determinação do tamanho amostral para ANOVA de experimentos Cruzados, Hierárquicos e Mistos contendo 1,2 e 3 fatores (one-way, two-way e three-way), experimentos sequenciais.  Vamos ver um pequeno exemplo através da função “size.anova”, uma função generalista que permite aplicação para diversos experimentos contendo fatores fixos

A especificação do modelo na função “size.anova” é feita através do argumento “model” o qual pode receber os valores “a”,”b”,”c” para indicar o fator A,B e C ; “axb” , “a>b” ou “b<a” o qual indica interação entre fatores e fatores aninhados (“b” inferior a “a” ou “a” superior a “b”) respectivamente.

Outra característica interessante nas funções do pacote OPDOE é o argumento presente “cases” o qual pode receber os valores “minimim” ou “maximin” o qual indica se o minimo ou o maximo tamanho amostral será determinado.

Há outras funções para diferentes experimentos que não serão apresentadas aqui devido a complexidade  do nome de cada função e da quantidade de funções disponíveis  . Mas recomendo que consulte o manual do pacote (disponível no link acima) para que possa se familiarizar. Uma lista de todos os desenhos esperimentais disponíveis pode ser vista aqui.

install.packages("OPDOE")
library(OPDOE)
#----------------------------------------------------------
#veja o funcionamento da função 

#----------------------------------------------------------
# experimento com um fator (one-way), com 4 tratamentos com poder de 90% (1-beta)
size.anova(model="a",a=4,
      alpha=0.05,beta=0.1, delta=2, case="maximin")
size.anova(model="a",a=4,
      alpha=0.05,beta=0.1, delta=2, case="minimin")
#-------------------------------------------------------------------
#Experimento fatorial AxB (6 x 4) cujo hipotese nula é que não há efeito
# do tratamento A com um poder de 90% (beta =0.1) (O argumento "hypothesis" pode ser omitido, veja documentação
size.anova(model="axb", hypothesis="a", a=6, b=4,
           alpha=0.05,beta=0.1, delta=1, cases="maximin")

# Quando o objetivo é testar o efeito da interação
size.anova(model="axb", hypothesis="axb", a=6, b=4,
           alpha=0.05,beta=0.1, delta=1, cases="maximin")
#--------------------------------------------------------------------
# Experimento  hierárquico tres fatores (c dentro de B dentro de A) cujo objetivo é avaliar a
# hipótese nula sobre o nível c.
size.anova(model="a>B>c", hypothesis="c",a=6, b=2, <a href="http://inside-r.org/r-doc/base/c">c</a>=4,
           alpha=0.05, beta=0.1, delta=0.5, case="maximin")
size.anova(model="a>B>c", hypothesis="c",a=6, b=20, <a href="http://inside-r.org/r-doc/base/c">c</a>=4,
           alpha=0.05, beta=0.1, delta=0.5, case="maximin")
Anúncios
Esse post foi publicado em Experimentos e marcado . Guardar link permanente.

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s