Variância
da Média da Amostra
Uma medida do grau de concentração da
estimativa da média da amostra entorno da média da população é fornecida pela
variância da média da amostra, que é a soma dos quadrados dos desvios (diferença entre
a média da amostra e a média da população) dividida pelo número de amostras
possíveis. Representando
a variância da média:

![]()
![]()
Se todas as médias das amostras fossem iguais, o valor da variância da média seria igual a zero. Quanto maior for a variância menor é o grau de concentração.
Realmente não é necessário selecionar
todas as amostras possíveis de modo a obter a variância da média da amostra. Com ajuda
da teoria é possível mostrar que a variância da média da amostra,
, de uma amostra aleatória simples de tamanho n,
selecionada sem reposição é dada por:
![]()
Onde:
;
e N é o tamanho da população
Com os dados da Tabela 1, obtemos:
N=100 ;
e ![]()
Assim a variância da média da amostra,
, pode ser calculada para os diferentes valores de n.
Quando o tamanho da amostra é igual a 1, a variância da amostra é denominada de
variância da população, representada por :
![]()
Para uma amostra de tamanho dois, n=2, temos:
Esse valor é igual ao obtido anteriormente quando usamos todos os 45 possíveis valores das amostras de tamanho dois.
A raiz quadrada da variância é
denominada de desvio padrão. A Tabela 4, apresenta a variância
e o desvio padrão
,
referente a amostra aleatória simples, selecionada sem reposição, da população
hipotética apresentada na Tabela 1.
Tabela 4
Tamanho |
|
|
|
1 |
287,60 |
16,90 |
0,63 |
2 |
127,82 |
11,30 |
0,42 |
3 |
74,56 |
8,60 |
0,32 |
4 |
47,93 |
6,90 |
0,26 |
5 |
31,95 |
5,60 |
0,21 |
6 |
21,30 |
4,60 |
0,17 |
7 |
13,70 |
3,70 |
0,14 |
8 |
7,99 |
2,80 |
0,10 |
9 |
3,55 |
1,90 |
0,07 |
É lógico que a variância da média da
amostra decresce com o aumento do tamanho da amostra, o que é totalmente coerente com os
resultados da Tabela 3, ou seja, que o grau de concentração das estimativas da média da
amostra aumenta, quando aumentamos o tamanho das amostras. O desvio padrão,
, é uma medida de dispersão da média da amostra entorno
da média da população.
A última coluna da Tabela 4 apresenta o
coeficiente de variação da média da amostra,
,
que é a divisão do desvio padrão,
,
pelo valor esperado
, ![]()
O coeficiente de variação é um número que não é afetado pelo valor da unidade de medida empregada para obter a informação. Para esclarecer esse assunto vamos fazer uso de um exemplo.
Suponha que um grupo de estudantes faz duas provas. A média da primeira prova foi de 60 de um total de 100 pontos e apresentou um desvio padrão de 6 pontos. A média da segunda prova foi de 100 pontos em uma prova que valia no máximo 700 pontos e apresentou um desvio padrão de 7 pontos.
Em termos de valores absolutos a segunda prova apresentou um desvio padrão maior que da primeira, no entanto, em termos relativos os estudantes apresentaram uma menor dispersão na segunda prova. O coeficiente de variação da primeira prova é igual a 1/10, ao passo que da segunda prova é igual a 1/100, que é bem menor.
A Tabela 5, apresenta a proporção do número de amostras cuja diferença entre a média da amostra e a média da população é menor que 1, 2 ou 3 desvios padrão da média estimada.
Tabela 5
Tamanho |
Proporção do número de amostras com
estimativas menores que |
||
|
|
|
|
1 |
70 |
90 |
100 |
2 |
64 |
98 |
100 |
3 |
65 |
96 |
100 |
4 |
62 |
97 |
100 |
5 |
62 |
98 |
100 |
6 |
62 |
97 |
100 |
7 |
68 |
97 |
100 |
8 |
67 |
98 |
100 |
9 |
70 |
100 |
100 |
Para melhor interpretação da Tabela 4, vamos mostrar como a mesma foi elaborada quando o tamanho da amostra é igual a dois. O mesmo procedimento é adotado para os demais tamanhos.
Para n=2, a variância da média da
amostra
será:
![]()
A diferença em valor absoluto, entre a
média da amostra e a média da população de modo a ser menor que um desvio padrão da
média estimada é dada pela expressão ![]()
Dessa forma para as amostras cujas médias
são maiores que
, ou cujas médias sejam menores que
, diferem de um desvio padrão da média estimada, no caso:
No caso em foco existem 16 amostras cujas médias satisfazem as condições acima, ou ainda 29 amostras (45-16) que apresentam diferenças (média da amostra menos média da população) menores ou iguais que um desvio padrão da média estimada, ou seja aproximadamente 64% (29/45).
Para amostras relativamente grandes a
média da amostra
,
tem distribuição normal com média
e desvio padrão
,
ou seja,
.
De acordo com a distribuição normal aproximadamente 68% das médias das amostras
estimadas diferem de 1 desvio padrão:
,
95% diferem de 2 desvios padrões:
e 99,7%
diferem de 3 desvios padrões: ![]()
Os resultados da Tabela 5 se aproximam desses percentuais apesar do tamanho da nossa população hipotética não permitir a seleção de amostras grandes.
Conhecendo o desvio padrão da média da
amostra nós podemos afirmar que temos cerca de 68% de probabilidade da média da
população estar contida dentro do intervalo
enquanto que 95% de probabilidade da média
da população estar contida no intervalo
e 99% de probabilidade da média da população
estar contida no intervalo
.
Esses intervalos são chamados de intervalo de confiança e as probabilidades associadas
ao mesmo são denominadas de nível de confiança.
Exemplo Suponha que uma população
com N=100 000 unidades e
.
Se selecionarmos uma amostra aleatória simples, sem reposição, de 100 unidades a
variância da média da amostra será:
e o desvio padrão igual a ![]()