Margem de Erro e o Tamanho da Amostra

Alinne Veiga
4 min readNov 25, 2020

--

O que acontece se quebramos a análise para subgrupos menores?

No artigo anterior (sobre margem de erro) expliquei a relação que existe entre o tamanho da amostra e a margem de erro. Por exemplo: quer-se fazer uma pesquisa para estimar a proporção (ou percentual) de votos no candidato A; se a margem de erro tolerada for de 4%, para esse percentual, pode-se selecionar uma amostra de 625 eleitores.

Pois bem: esses 4 pontos percentuais é a a margem de erro esperada para o percentual de votos no candidato A, considerando as respostas de todos os 625 eleitores conjuntamente. Para esse percentual podemos dizer que o erro de estimação tolerado é de 4% (para mais ou menos) com 95% de confiança — na fase de planejamento da pesquisa.

O que ainda não foi dito (e as pesquisas eleitorais não falam) é que podemos calcular a margem de erro de cada estimativa gerada pela pesquisa — ou seja, após realizadas as entrevistas e calculadas as proporções, estima-se a margem de erro para cada proporção e, sim, ainda mantemos a relação que diz quanto menor o tamanho da amostra, maior a margem de erro de uma estimativa.

O que acontece com a margem de erro, se utilizarmos a mesma amostra, gerando percentuais de votos no candidato A para eleitores do sexo feminino e masculino? Ou por grupos etários?

Veremos o exemplo hipotético: uma pesquisa realizada com 625 eleitores (uma amostra aleatória simples — AAS), planejada para tolerar erro máximo de 4% com 95% de confiança.

  • Suponha que o percentual de votos no candidato A seja de 54% , considerando o conjunto de todos os eleitores entrevistados;
  • Suponha agora que, entre as 343 mulheres entrevistadas, o percentual de votos no candidato A seja de 58%;
  • Suponha também que, entre os 175 eleitores com 60 anos ou mais de idade, 62% votará no candidato A.

Como podemos estimar a margem de erro das estimativas acima?

Um pouquinho de teoria.

Numa pesquisa por amostragem, chamamos as quantias calculadas de estimativas, e colocamos um “chapéu” nelas! Vamos chamar a proporção de votos estimada numa amostra de:

Proporção estimada.

Se multiplicarmos essa proporção estimada por 100, temos o percentual de votos estimados pela pesquisa:

Percentual estimado.

Para calcularmos a margem de erro de cada estimativa, precisamos ter a noção de intervalos de confiança — pela teoria da amostragem, para algumas condições de regularidade, podemos aproximar a semiamplitude do intervalo de confiança de uma proporção para:

Semiamplitude aproximada do intervalo de confiança, pra uma proporção estimada numa AAS.

Mantendo a mesma aproximação mencionada no artigo anterior, e o nível de confiança de 95%, podemos determinar a margem de erro para uma proporção seguindo a equação:

Semiamplitude aproximada do intervalo de confiança de 95%, pra uma proporção estimada numa AAS.

Finalmente, para o exemplo hipotético, chegamos aos seguintes resultados — expressos em percentual:

Percentual estimado, tamanho da amsotra e margem de erro estimada.

O que podemos falar sobre esses resultados?

  • O percentual de votos para o candidato A, considerando o conjunto de todos os eleitores entrevistados, é de 54% com margem de erro estimada de 5,5% — não mais os 4 pontos percentuais usados na fase de planejamento da pesquisa;
  • Quando investigamos esse percentual considerando apenas as mulheres, temos que 58% delas votariam no candidato A e a margem de erro é de 5,3%;
  • 62% dos eleitores com 60 anos ou mais votam no candidato A, mas a margem de erro desta estimativa é de 7 pontos percentuais!

O aumento da margem de erro para a estimativa do grupo de eleitores com 60 anos ou mais reflete o tamanho desse subgrupo — de 175 eleitores apenas.

Quanto mais quebrarmos a amostra em subgrupos ainda menores, maior será a margem de erro das estimativas desses subgrupos!

As pesquisas eleitorais têm exibido seus resultados quebrando por sexo, grupo etário, religião, faixas de rendimento… é preciso ter cuidado na interpretação dessas estimativas. Se a margem de erro de uma estimativa é muito alta, não há precisão.

Sem dizer, mas dizendo, que todos os cálculos acima são apenas válidos supondo que uma amostragem aleatória foi realizada. Não são válidos para amostras de conveniência. Não são válidos para amostras por cotas — método efetivamente adotado em pesquisas eleitorais.

Ainda estou devendo o artigo sobre pesquisas não-probabilísticas!

--

--

Alinne Veiga
Alinne Veiga

Written by Alinne Veiga

Social statistician who (used to) plays saxofone

No responses yet