A Mágica dos Números

Regina Sadownik, PhD em Estatística, Professora universitária e pesquisadora, integrante do ILUMINA


E-mail: SADOW@TRIP.COM.BR


Os números ocupam lugar de destaque na mídia em função do ano eleitoral. Em resultados de pesquisas, promessas eleitorais, decisões políticas, cada vez mais os números, em forma de estatísticas, buscam oferecer uma certa imparcialidade em tomadas de decisão. Afinal, as estatísticas formam um espelho da opinião média da população.


A transparência das informações contidas nos jornais e noticiários televisivos dão credibilidade às instituições de pesquisa. A mídia, muitas vezes, não menciona o tamanho da amostra, o número de municípios pesquisados e/ou a margem de erro das estatísticas provenientes de algumas instituições, insinuando uma imagem enganosa de exatidão nas previsões obtidas.


Ao mesmo tempo, as comparações entre os resultados provenientes de pesquisas que utilizam margens de erro diferentes também parecem frágeis, assim como a generalização para o âmbito nacional de resultados obtidos em pesquisa estadual. Dificilmente – em função de suas especificidades – um determinado Estado brasileiro será o reflexo preciso do comportamento nacional.


Para sermos específicos, consideremos o problema da previsão da proporção de eleitores que apoiará determinado candidato na próxima eleição presidencial. Como é impossível consultar toda a população de eleitores, o máximo que se pode fazer é extrair uma amostra, na esperança de que a proporção amostral constitua uma boa estimativa da proporção populacional.


Para evitar trabalharmos com amostra tendenciosa, todo eleitor deve ter a mesma chance de figurar na amostra. E para evitar desprezarmos qualquer eleitor, mesmo sem intenção, a amostra deve ser aleatória.


Em amostras grandes, pode-se afirmar, com certa segurança, que a proporção amostral é uma estimativa da proporção populacional, pois o erro correspondente será pequeno. De fato, a maneira mais fácil de mostrar quão bem a proporção populacional é estimada através da proporção amostral, consiste em estabelecer o chamado intervalo de confiança:


Proporção populacional = Proporção amostral ± um pequeno erro


As questões cruciais são: ” Quão pequeno é este erro?”, ” Qual a nossa margem de certeza?” e “Qual é o tamanho adequado da amostra?”. Certamente, esta última é respondida através da metodologia empregada.


Ilustremos nosso problema com os resultados para o 1o turno da eleição presidencial, obtidos por algumas instituições de pesquisa (mês de junho).






















Gerp % Ibope % Vox Pop % Datafolha %
FHC 31 36 36 33
Lula 29 28 29 30


Gerp ouviu 3.780 eleitores em 143 municípios, de 20 a 23 de junho.


Ibope ouviu 2.000 eleitores, de 18 a 22 de junho.


Vox Populi ouviu 3.000 eleitores em 217 municípios, de 14 a 16 de junho.


Datafolha ouviu 12.592 eleitores em 322 municípios, em 8 e 9 de junho.



Sabemos que essa estimativa nunca é feita na base da certeza absoluta. Temos, na verdade, 95% de confiança na estimativa calculada. Assim, essa confiança indica o grau de incerteza em jogo: devemos admitir 5% de possibilidade de a amostra ser enganosa. Partindo da premissa que a amostra é aleatória, busquemos uma comparação dos valores obtidos pelas instituições.


Em termos estatísticos, considerando-se o valor estimado pela instituição de pesquisa como proporção de cada candidato em relação ao total de entrevistados, pode-se afirmar com 95% de confiança, segundo cada instituição indicada, que:


Gerp: FHC está entre 29% e 32% do eleitorado e Lula entre 27% e 30%;


Ibope: FHC está entre 34% e 38% e Lula entre 26% e 30%;


Vox Populi: FHC está entre 34% e 38% e Lula entre 27% e 31%; e


Datafolha: FHC está entre 32% e 34% e Lula entre 29% e 31%.


Ou seja, podemos afirmar com 95% de segurança que cada candidato obterá para o 1o turno um resultado que se inclui no intervalo indicado abaixo, formado pelos valores percentuais máximos e mínimos possíveis de serem obtidos pelos candidatos, por instituição:






















Gerp Ibope Vox Populi Datafolha
FHC [29;32] [34;38] [34;38] [32;34]
Lula [27;30] [26;30] [27;31] [29;31]


Assim, para amplitude do intervalo ( diferença entre os valores máximo e mínimo) da estimativa, valor este correspondente ao dobro da quantidade de erro numa estimativa, em comparação com o tamanho da amostra, temos o seguinte quadro:

























Instituição Tamanho da Amostra Amplitude do Intervalo (%)
Ibope 2000 4
Vox Populi 3000 4
Gerp 3780 3
Datafolha 12592 2


Verificamos que a margem de erro da estimativa ( correspondente à metade da amplitude do intervalo) diminuiu à medida que cresceu o tamanho da amostra. Também, estamos trabalhando com 95% de confiança. Se aumentarmos a confiança, aumentará o erro.


Nessa pesquisa, a menor margem de erro correspondente a 95% de confiança foi atingida pela instituição Datafolha, que utilizou amostra de 12.592 eleitores. Portanto, segundo a pesquisa da Datafolha, pode-se afirmar com 95% de confiança que o resultado do 1o turno das eleições presidenciais, caso fossem em junho, estaria entre 32% e 34% para FHC e entre 29% e 31% para Lula.


O resultado mais próximo ao da Datafolha corresponde ao da Gerp, com amostra maior que das instituições Ibope e Vox Populi. Os valores da Gerp, porém, indicam que existe possibilidade de empate entre os dois candidatos, o que não ocorre com as demais instituições.


Com os novos valores encontrados na mídia, obtidos por Ibope e Datafolha,
















Ibope% Datafolha %
FHC 42 40
Lula 25 28


Datafolha ouviu 4.380 eleitores em 226 municípios, em 8 e 9 de julho. Ibope ouviu 2.000 eleitores, de 2 a 5 de julho.



atualizamos nossa análise, obtendo, com 95% de confiança, os valores máximos e mínimos possíveis de serem obtidos pelos candidatos:
















Datafolha Ibope
FHC [38;41] [40;44]
Lula [26;29] [23;27]


Portanto, como agora o tamanho da amostra utilizada por Datafolha diminuiu:
















Instituição Tamanho da Amostra Amplitude do Intervalo %
Ibope 2000 4
Datafolha 4380 3


verificamos que a amplitude do intervalo aumentou; ou seja, observamos que o tamanho da amostra, assim como a confiança desejada influem nas estimativas obtidas pelas instituições de pesquisa.


Os erros e omissões aqui apresentados explicam de forma suscinta a diferença resultante da comparação de pesquisas provenientes de instituições distintas e a fragilidade das análises das previsões eleitorais muitas vezes encontradas na mídia. Certamente, esses resultados refletem a opção de hoje do eleitor, na qual se incluem os que já se decidiram e os indecisos. Como o total de indecisos e branco/nulo ainda é grande, e só agora inicia-se a campanha eleitoral, será que podemos afirmar, com 95% de segurança, que as diversas instituições de pesquisa obterão valores convergentes, e próximos ao verdadeiro, à medida que se aproximarem as eleições?

Compartilhe

    Deixe uma resposta

    O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *