Margem de erro
Mas o que é margem de erro que essas pesquisas tanto falam?
É o erro máximo que estamos dispostos a tolerar com uma dada probabilidade.
Quando é realizada uma pesquisa por amostragem — onde apenas uma parcela da população é selecionada para responder um questionário ou uma indagação buscamos quantificar uma medida desconhecida. Essa quantificação é uma estimação. A medida desconhecida é o valor real daquilo que temos interesse em quantificar — chamamos de parâmetro.
Em toda estimação existe um erro associado — o erro de estimação — que é a diferença do valor estimado e o valor real… expressamos esse erro em módulo e assim temos um erro absoluto de estimação.
A margem de erro (ME) é o valor máximo que o erro absoluto pode assumir, com uma probabilidade elevada. Essa probabilidade é o nível de confiança, e , em geral, é igual a 95%.
A margem de erro está intimamente conectada ao tamanho da amostra — ou em como se determina o tamanho do subgrupo que será entrevistado. No entanto, vale a pena aqui dizer que, também está conectado ao que se quer estimar (qual o parâmetro de interesse) e ao método de seleção (aleatório) que se vai utilizar — o plano de amostragem.
Suponha que o objetivo é estimar a proporção de votos em um candidato: o parâmetro de interesse é uma proporção. Não conhecemos esse valor na população alvo e queremos quantificá-lo a partir de uma amostra — ou seja, queremos estimar essa proporção.
Suponha também que temos uma listagem de todos os eleitores de uma região.
Suponha que selecionamos um subgrupo desses eleitores de forma aleatória — uma amostra aleatória simples de tamanho n — que irá responder:
Em quem o senhor(a) votará no segundo turno: candidato A ou candidato B?
Precisamos então, dimensionar n — o tamanho da amostra — de tal forma que nossa margem de erro seja ME com nível de confiança de 95%. Para esse caso específico (de nível de confiança igual a 95%), existe uma relação aproximada entre a margem de erro e o tamanho da amostra que as empresas de pesquisa de opinião costumam utilizar. Essa relação é:
Ou seja: quanto maior a margem de erro, menor a quantidade necessária de eleitores para entrevistar.
Se o objetivo for estimar a proporção de eleitores que votam no candidato A, permitindo uma margem de erro de 4% ao nível de confiança de 95% a amostra necessária terá 625 eleitores — sem importar o tamanho da população alvo daquela região!!
E, de novo, tudo isso é válido quando o método de seleção daqueles que irão responder a pergunta é a amostragem aleatória simples — tendo listado todos os eleitores daquela região, seleciona-se de forma aleatória (gerando números pseudo-aleatórios, por exemplo) quem irá responder — e esses são os entrevistados.
A pergunta é? Entrevistas realizadas em ponto de fluxo são aleatórias? Melhor dizendo: Entrevistadores parados em pontos específicos da região que entrevistam quem passa por ali, é uma seleção aleatória (por definição)?
A resposta é: Não!
Então, tecnicamente, nada do citado acima é válido!
Mas isso é papo para um próximo artigo — sobre pesquisas não-probabilísticas!