Variância da Média da Amostra

 

Uma medida do grau de concentração da estimativa da média da amostra entorno da média da população é fornecida pela variância da média da amostra, que é a soma dos quadrados dos desvios (diferença entre a média da amostra e a média da população) dividida pelo número de amostras possíveis. Representando  a variância da média:

 

 

Se todas as médias das amostras fossem iguais, o valor da variância da média seria igual a zero. Quanto maior for a variância menor é o grau de concentração.

 

Realmente não é necessário selecionar todas as amostras possíveis de modo a obter a variância da média da amostra. Com ajuda da teoria é possível mostrar que a variância da média da amostra, , de uma amostra aleatória simples de tamanho n, selecionada sem reposição é dada por:

 

Onde:         ;           e  N é o tamanho da população

 

 

Com os dados da Tabela 1, obtemos:

 

N=100 ;   e 

 

Assim a variância da média da amostra, , pode ser calculada para os diferentes valores de n. Quando o tamanho da amostra é igual a 1, a variância da amostra é denominada de variância da população, representada por :

                                              

 

Para uma amostra de tamanho dois, n=2, temos:

 

 

 

Esse valor  é igual ao obtido anteriormente quando usamos todos os 45 possíveis valores das amostras de tamanho dois.

A raiz quadrada da variância é denominada de desvio padrão. A Tabela 4, apresenta a variância   e o desvio padrão , referente a amostra aleatória simples, selecionada sem reposição, da população hipotética apresentada na Tabela 1.

 

Tabela 4

Tamanho

1

287,60

16,90

0,63

2

127,82

11,30

0,42

3

74,56

8,60

0,32

4

47,93

6,90

0,26

5

31,95

5,60

0,21

6

21,30

4,60

0,17

7

13,70

3,70

0,14

8

7,99

2,80

0,10

9

3,55

1,90

0,07

 

 

É lógico que a variância da média da amostra decresce com o aumento do tamanho da amostra, o que é totalmente coerente com os resultados da Tabela 3, ou seja, que o grau de concentração das estimativas da média da amostra aumenta, quando aumentamos o tamanho das amostras. O desvio padrão, , é uma medida de dispersão da média da amostra entorno da média da população.

 

A última coluna da Tabela 4 apresenta o coeficiente de variação da média da amostra, , que é a divisão do desvio padrão, , pelo valor esperado ,

O coeficiente de variação é um número que não é afetado pelo valor da unidade de medida empregada para obter a informação. Para esclarecer esse assunto vamos fazer uso de um exemplo.

 

Suponha que um grupo de estudantes faz duas provas. A média da primeira prova foi de 60 de um total de 100 pontos e apresentou um desvio padrão de 6 pontos. A média da segunda prova foi de 100 pontos em uma prova que valia no máximo 700 pontos e apresentou um desvio padrão de 7 pontos.

 

Em termos de valores absolutos a segunda prova apresentou um desvio padrão maior que da primeira, no entanto, em termos relativos os estudantes apresentaram uma menor dispersão na segunda prova. O coeficiente de variação da primeira prova é igual a 1/10, ao passo que da segunda prova é igual a 1/100, que é bem menor.  

A Tabela 5, apresenta a proporção do número de amostras cuja diferença entre a média da amostra e a média da população é menor que 1, 2 ou 3 desvios padrão da média estimada.

 

 

Tabela 5

 

Tamanho

Proporção do número de amostras com estimativas menores que

1

70

90

100

2

64

98

100

3

65

96

100

4

62

97

100

5

62

98

100

6

62

97

100

7

68

97

100

8

67

98

100

9

70

100

100

 

Para melhor interpretação da Tabela 4, vamos mostrar como a mesma foi elaborada quando o tamanho da amostra é igual a dois. O mesmo procedimento é adotado para os demais tamanhos.

 

Para n=2, a variância da média da amostra  será:

A diferença em valor absoluto, entre a média da amostra e a média da população de modo a ser menor que um desvio padrão da média estimada é dada pela expressão

 

Dessa forma para as amostras cujas médias são maiores que  , ou cujas médias sejam menores que , diferem de um desvio padrão da média estimada, no caso:

 

No caso em foco existem 16 amostras cujas médias satisfazem as condições acima, ou ainda 29 amostras (45-16) que apresentam diferenças (média da amostra menos média da população) menores ou iguais que um desvio padrão da média estimada, ou seja aproximadamente 64% (29/45).

 

Para amostras relativamente grandes a média da amostra , tem distribuição normal com média  e desvio padrão , ou seja, . De acordo com a distribuição normal aproximadamente 68% das médias das amostras estimadas diferem de 1 desvio padrão: , 95% diferem de 2 desvios padrões:  e  99,7% diferem de 3 desvios padrões:

Os resultados da Tabela 5 se aproximam desses percentuais apesar do tamanho da nossa população hipotética não permitir a seleção de amostras grandes.

Conhecendo o desvio padrão da média da amostra nós podemos afirmar que temos cerca de 68% de probabilidade da média da população estar contida dentro do intervalo   enquanto que 95% de probabilidade da média da população estar contida no intervalo  e 99% de probabilidade da média da população estar contida no intervalo . Esses intervalos são chamados de intervalo de confiança e as probabilidades associadas ao mesmo são denominadas de nível de confiança.

 

Exemplo – Suponha que uma população com N=100 000 unidades e . Se selecionarmos uma amostra aleatória simples, sem reposição, de 100 unidades a variância da média da amostra será: 

e o desvio padrão igual a