Sendo este ano de eleições resolvi escrever sobre um tema correlato, a pesquisa de opinião Vamos entender um pouco sobre pesquisas de opinão e o que é exatamente um empate técnico.
É de domínio público o fato de que uma amostragem bem realizada pode trazer informações muito relevantes, sobre uma população. Neste contexto surge o fator incerteza nas pesquisas. Uma pesquisa tem como "kick off" a definição de um planejamento amostral bem feito. Existem diversos planejamentos amostrais, normalmente para pesquisas de intenção de voto usa-se amostragem Estratificada ,ou por conglomerados, ou por cotas, sendo esta última a mais comum.
De acordo com a pesquisa realizada no dia 06/08/2010, diponível no site ultimosegundo, onde é possível comparar resultados dos principais institutos, IBOPE, Data Folha, Sensus e Vox Populi/Band/IG. IBOPE e Vox Populi, apontam Dilma com 41% das intensões de votos, enquanto Serra tem 33%. Para esse post vou assumir estes resultados para analisar.
O que garante a margem de erro é o tipo de planejamento amostral, e em função disso alguns parâmetros adotados como premissa, mas o fator determinante é o tamanho da amostra n.
Para mostrar o efeito do tamanho da amostra em uma pesquisa, vou analisar os resultados de Dilma e Serra até criar um cenário onde eles estejam empatados tecnicamente, apenas devido ao tamanho da amostra. O grau de confiança adotado por mim foi de 95,00% (Este é o valor padrão neste tipo de problema), considerando uma população de 190.000.000 de brasileiros. O Vox populi entrevistou 3.000 brasileiros, o que pelas minhas contas dá uma margem de erro de 1,78%. O erro apresntado pelo instituto foi 1,8%, logo parece que eles utilizaram amostragem aleatória simples, para estimar o erro. Note que, SE o planejamento amostral utilizado foi o de cotas, esta margem não é real.
Então criei um programinha no R-Project, para demostrar o efeito do tamanho da amostra., (agradecimento ao colega Bernardo Rangel Tura)
Primeiro usei os 3.000 entrevistados, veja o gráfico ao lado.
Nas extremidades de cada curva estão as margens de confiança, ou se preferir, os erros. com 3.000 entrevistados, o que importa para gente são as áreas de dentro. O empate técnico acontece quando essas áreas se sobrepõe. Quando isso pode acontecer? Basicamente quando o número de entrevistados é muito baixo.
Na minha simulaçao reduzi o tamanho da amostra para 500 entrevistados, e se você acha isso pouco, exitem algumas pesquisas que utilizam uma amostra dessa magnitude, não de cunho eleitoral, pois essas tem um controle um pouco maior, pelo fato de serem registradas. Nosso gráfico fica assim com 500 entrevistados:
Mesmo com uma distância alta de 8 pontos percentuais, Dilma e Serra estariam empatados, do ponto de vista estatístico. O empate ocorre exatamente no retângulo gerado entre as duas curvas.
Uma curiosidade é que se aumentarmos a confiança de 95,00% para 99,00%, isso faz com que as áreas se encontrem mais rapidamente, logo o empate ocorre, mais rapidamente para um mesmo tamanho de amostra, isso porque uma confiança maior implica em um intervalo mais largo, logo provoca um erro maior.
É de domínio público o fato de que uma amostragem bem realizada pode trazer informações muito relevantes, sobre uma população. Neste contexto surge o fator incerteza nas pesquisas. Uma pesquisa tem como "kick off" a definição de um planejamento amostral bem feito. Existem diversos planejamentos amostrais, normalmente para pesquisas de intenção de voto usa-se amostragem Estratificada ,ou por conglomerados, ou por cotas, sendo esta última a mais comum.
De acordo com a pesquisa realizada no dia 06/08/2010, diponível no site ultimosegundo, onde é possível comparar resultados dos principais institutos, IBOPE, Data Folha, Sensus e Vox Populi/Band/IG. IBOPE e Vox Populi, apontam Dilma com 41% das intensões de votos, enquanto Serra tem 33%. Para esse post vou assumir estes resultados para analisar.
O que garante a margem de erro é o tipo de planejamento amostral, e em função disso alguns parâmetros adotados como premissa, mas o fator determinante é o tamanho da amostra n.
Para mostrar o efeito do tamanho da amostra em uma pesquisa, vou analisar os resultados de Dilma e Serra até criar um cenário onde eles estejam empatados tecnicamente, apenas devido ao tamanho da amostra. O grau de confiança adotado por mim foi de 95,00% (Este é o valor padrão neste tipo de problema), considerando uma população de 190.000.000 de brasileiros. O Vox populi entrevistou 3.000 brasileiros, o que pelas minhas contas dá uma margem de erro de 1,78%. O erro apresntado pelo instituto foi 1,8%, logo parece que eles utilizaram amostragem aleatória simples, para estimar o erro. Note que, SE o planejamento amostral utilizado foi o de cotas, esta margem não é real.
Então criei um programinha no R-Project, para demostrar o efeito do tamanho da amostra., (agradecimento ao colega Bernardo Rangel Tura)
Primeiro usei os 3.000 entrevistados, veja o gráfico ao lado.
Nas extremidades de cada curva estão as margens de confiança, ou se preferir, os erros. com 3.000 entrevistados, o que importa para gente são as áreas de dentro. O empate técnico acontece quando essas áreas se sobrepõe. Quando isso pode acontecer? Basicamente quando o número de entrevistados é muito baixo.
Na minha simulaçao reduzi o tamanho da amostra para 500 entrevistados, e se você acha isso pouco, exitem algumas pesquisas que utilizam uma amostra dessa magnitude, não de cunho eleitoral, pois essas tem um controle um pouco maior, pelo fato de serem registradas. Nosso gráfico fica assim com 500 entrevistados:
Mesmo com uma distância alta de 8 pontos percentuais, Dilma e Serra estariam empatados, do ponto de vista estatístico. O empate ocorre exatamente no retângulo gerado entre as duas curvas.
Uma curiosidade é que se aumentarmos a confiança de 95,00% para 99,00%, isso faz com que as áreas se encontrem mais rapidamente, logo o empate ocorre, mais rapidamente para um mesmo tamanho de amostra, isso porque uma confiança maior implica em um intervalo mais largo, logo provoca um erro maior.