Estimação
de Proporções
Considere uma
população com N unidades dividida em duas classes: a primeira classe A, constituída
pelas unidades que possuem um determinado atributo, enquanto que na segunda classe ?
(lê-se não A), estão as unidades que não possuem o atributo. Por exemplo, se a
população é de domicílios:
·
Na
classe A estão os domicílios próprios, enquanto que na classe ? estão os não
próprios
·
Na
classe A estão os domicílios que possuem DVD, enquanto que na classe ? estão os que
não possuem.
Seja N1 o
número de unidades da classe A, ou seja que possuem um determinado atributo, e N2
o número de unidades da classe ?, ou seja que não possuem o atributo. Dessa forma N=N1+N2,
donde se obtém:
, proporção
da classe A
Q= 1 P , proporção da classe ?
Devido ao fato da variável Xi assumir apenas dois valores: um ou zero,
Xi = 1 quando a unidade possui o atributo e
Xi = 0 quando não possui o atributo.
É fácil provar que a média da
população,
, é
igual a P e que a média da amostra,
, é
igual a proporção de unidades na amostra com atributo, p. Assim temos:
Proporção
na população: 
Proporção
da população: 
A variância da proporção estimada, p, é dada por:
, onde ![]()
E a variância relativa:
![]()
Quando N é relativamente grande,
é
aproximadamente igual a 1, e ![]()
Para o emprego das fórmulas acima é necessário o conhecimento da variância da população. Esse valor pode ser obtido com base nos dados de um levantamento censitário ou com base nos resultados de pesquisa por amostragem realizada anteriormente. Para melhor interpretação dos conceitos introduzidos vamos nos valer de alguns exemplos.
Suponha que desejamos estimar o consumo médio mensal de um produto em uma determinada área. Se dispusermos de um cadastro atualizado de domicílios e sabemos que o consumo desse produto apresenta um alto grau de correlação com a renda domiciliar, podemos fazer uso da variância relativa da renda domiciliar obtida com base no censo demográfico, para se calcular o tamanho da amostra.
Se segundo o censo demográfico o número de domicílios, N, é igual a 100 000 e a variância relativa da renda domiciliar é igual a 1,84, e desejamos um erro relativo de amostragem, Er, da ordem de 5%, a um nível de confiança de 68%, o tamanho da amostra é dado por:

Nesse caso k=1,
, N= 100 000 e Er
=0,05 ou
=0,0025.
Substituindo esses valores na expressão acima temos um tamanho de amostra, n, igual a 730
domicílios.
Vamos agora analisar alguns aspectos relativos a estimativas de proporções. Para populações relativamente grandes o tamanho da amostra é dado pela expressão:
onde: ![]()
A Tabela 6, apresenta para diferentes valores de P a variância relativa e o tamanho da amostra aleatória simples, n, quando fixamos um erro de amostragem da ordem de 10%, para um nível de confiança da ordem de 68%.
Podemos notar que a variância relativa decresce quando o valor de P aumenta, conseqüentemente para valores pequenos de P necessitamos de tamanhos de amostra relativamente grandes.
Tabela
6
P |
|
n |
0,01 |
99,000 |
9 900 |
0,05 |
19,000 |
1 900 |
0,10 |
9,000 |
900 |
0,20 |
4,000 |
400 |
0,25 |
3,000 |
300 |
0,30 |
2,333 |
233 |
0,35 |
1,875 |
186 |
0,40 |
1,500 |
150 |
0,45 |
1,222 |
122 |
0,50 |
1,000 |
100 |
0,55 |
0,818 |
82 |
0,60 |
0,667 |
67 |
0,65 |
0,538 |
54 |
0,70 |
0,429 |
43 |
0,75 |
0,333 |
33 |
0,80 |
0,250 |
25 |
0,85 |
0,176 |
18 |
0,90 |
0,111 |
11 |
A Tabela 6, permite que se faça especulações com o erro de amostragem quando fixamos um determinado tamanho de amostra. Suponha um tamanho de amostra igual a 100. Assim o erro relativo da estimativa quando a proporção P é igual a 0,30 será da ordem de 15,27 que é obtido da seguinte forma:
ou ![]()
V2 (p) = 0,0021 ou V(p)=0,0458
, ou em termos relativo é igual a 15,27%
De uma maneira geral quando estamos estimando valores pequenos de P, por exemplo P=0,10 a solução é aumentar o erro de amostragem. Como foi visto na Tabela 7, para se ter um erro relativo da ordem de 10%, a um nível de 68% ou seja k=1, era necessário uma amostra com 900 elementos. No entanto se aumentarmos o erro para 20%, mantendo o mesmo nível de confiança, o tamanho da amostra é igual a 225.

Vale ressaltar que não devemos fazer confusão entre tamanho da amostra com o objetivo de estimar a média e tamanho da amostra com a finalidade de estimar proporção, que é um caso particular em que a variável de observação Xi, assume apenas dois valores: zero ou um, enquanto que no caso da média a variável assume valores maiores ou igual a zero, ou seja, Xi=0.
O tamanho da amostra para efeito de estimar proporção é menor ou igual que o tamanho da amostra para estimativa da média. Para melhor entendimento, vamos fazer uso de um exemplo.
Suponha que em uma determinada localidade existem 100 000 domicílios. Uma pesquisa por amostragem realizada anteriormente revelou que 20% desses domicílios faziam uso de derivados de leite e a variância relativa da despesa mensal com derivados de leite foi da ordem de 17,00. Deseja-se calcular o tamanho de uma amostra aleatória simples, de modo a se ter um erro de amostragem de 5%, a um nível de confiança de 95%, para estimar:
a) a despesa média com derivado de leite
b) a proporção de domicílios que fazem uso de derivado de leite.
Para o caso da média da despesa com derivado de leite, o tamanho da amostra é dado pela expressão:
, onde ![]()
Substituindo: K=2 ;
=17,00 ;
N=100 000 e Er =0,05 ou
=0,0025, na expressão acima temos um tamanho de amostra ,
n, igual a 21 383 domicílios.
O tamanho da amostra para estimar a proporção de domicílios que fazem uso de derivado de leite, é dado pela expressão:
, onde ![]()
Nesse caso K=2;
;
N= 100 000 e Er =0,05 ou
=0,0025, que substituindo na expressão nos proporciona um
tamanho de amostra, n, igual a 6 015 domicílios.
Até o presente fizemos uso da variância da população para obter a variância do parâmetro estimando média ou proporção, contudo se demonstrar que a variância da amostra, s2, é um estimador não tendencioso da população. Dessa forma basta substituir nas expressões o valor de S2 por s2, ou seja:
, onde
e a média da amostra:
, onde
e
, a proporção
na amostra p, onde n1 é o número de elementos na amostra com o atributo q=1-p.
Exercício : Suponha que numa área existem N=500 domicílios e nós desejamos estimar o consumo médio mensal por domicílio de um produto. Uma amostra aleatória simples de n=30 domicílios foi selecionada com os seguintes resultados.
23 |
14 |
38 |
11 |
7 |
31 |
9 |
16 |
12 |
25 |
11 |
15 |
36 |
24 |
10 |
16 |
26 |
12 |
25 |
28 |
34 |
25 |
11 |
7 |
9 |
33 |
25 |
9 |
4 |
19 |
Calcule : a) A média
c) O coeficiente de variação da estimativa
d) O intervalo de confiança para um nível de confiança igual a 95% ou seja k=2.