A Estatística Inferencial tem como objetivo ir além dos dados já existentes, permitindo a tomada de decisões e a formulação de conclusões de caráter mais genérico sobre uma população. Diferentemente da estatística descritiva (ou dedutiva), que apenas analisa gráficos, tabelas, média e variância daquilo que já existe, sem sentido ampliativo, a inferencial busca fazer estimativas. A base da estatística inferencial são as amostras.
População e Amostra
- População (N): É o conjunto universo de todos os elementos (pessoas, objetos, etc.) que compartilham uma característica comum e são objeto de estudo. É frequentemente difícil trabalhar com populações completas, pois a pesquisa pode ser cara, demorada e, muitas vezes, resultar em dados desatualizados. O estudo da população em sua totalidade é chamado de Censo, que é caro, lento e quase sempre desatualizado, embora admita erro processual zero e confiabilidade de 100%.
- Amostra (n): É definida como qualquer subconjunto não vazio de uma população. Na estatística inferencial, trabalha-se com amostras em cerca de 90% das situações. A amostra precisa ser representativa da população. Se a amostra não for coletada de modo apropriado (aleatório), o estudo pode não ser válido, resultando em perda de tempo e dinheiro.
Estatística e Parâmetro
- Parâmetro: É uma medida numérica que descreve alguma característica da população. Exemplos de simbologias de parâmetros populacionais incluem a média (μ), a variância (σ²), e o desvio padrão (σ).
- Estatística (ou Estimador): É uma medida numérica que descreve alguma característica da amostra. O estimador é utilizado na estimação, que é a avaliação indireta de um parâmetro, baseada em cálculos de probabilidades através de uma amostra. Exemplos de simbologias de estatísticas amostrais são a média (
), a variância (s²), e o desvio padrão (s).
Seleção de Amostra
Na Estatística Inferencial, a seleção de amostra é uma etapa fundamental, pois é por meio dela que conseguimos tirar conclusões sobre uma população inteira a partir da análise de um subconjunto representativo dessa população. Em outras palavras, como muitas vezes é impraticável ou impossível coletar dados de todos os elementos da população, utiliza-se uma amostra, e a qualidade dessa seleção influencia diretamente a precisão e a validade das inferências estatísticas.
Conceito de Amostra
Uma amostra é um subconjunto de elementos retirados de uma população, que é o conjunto total de elementos que queremos estudar.
- População: conjunto total de indivíduos, objetos ou eventos com características comuns.
Ex.: todos os clientes de um banco. - Amostra: subconjunto representativo da população.
Ex.: 500 clientes selecionados aleatoriamente para responder a uma pesquisa de satisfação.
Objetivo da Seleção de Amostra
O objetivo é escolher uma amostra que:
- Represente fielmente a população;
- Permita inferências estatísticas confiáveis (como estimativas e testes de hipóteses);
- Minimize vieses (distorsões nos resultados);
- Reduza custos e tempo de coleta de dados.
Tipos de Amostragem
A seleção da amostra pode seguir diferentes métodos, geralmente divididos em probabilísticos e não probabilísticos.
Tamanho da Amostra
A determinação do tamanho da amostra depende de:
- Tamanho da população;
- Margem de erro aceitável;
- Nível de confiança desejado;
- Variabilidade dos dados.
Um tamanho inadequado pode levar a conclusões incorretas:
- Pequeno demais: baixa precisão e alta margem de erro.
- Grande demais: aumento de custo e tempo desnecessários.
Importância de uma Boa Seleção
Uma amostra mal selecionada pode introduzir vieses e comprometer toda a análise. Por isso, atenção aos princípios:
- Representatividade
- Aleatoriedade
- Tamanho suficiente
- Ausência de viés de seleção
Distribuições Amostrais
A Distribuição Amostral é definida como a distribuição de probabilidade dos estimadores. A distribuição de uma amostra aleatória, em geral, segue a distribuição populacional.
Distribuição Amostral da Média (
)
O estudo da distribuição amostral da média é crucial na inferência estatística.
- Esperança (Média) da Média Amostral: O valor esperado da média amostral (E[
]) corresponde à média populacional (μ).
- Variância da Média Amostral: É a variância populacional (σ²) dividida pelo tamanho da amostra (n), ou seja, σ²/n. A variância da média amostral diminui conforme o tamanho da amostra aumenta.
- Para populações finitas e amostragem sem reposição, utiliza-se um Fator de Correção.
- Desvio Padrão da Média Amostral (Erro Padrão): É o desvio padrão populacional dividido pela raiz quadrada de
. É frequentemente usado na construção do intervalo de confiança para encontrar a margem de erro.
Teorema Central do Limite (TCL)
O TCL é fundamental.
- Ele estabelece que, se amostras aleatórias de tamanho n (geralmente n ≥ 30) são retiradas de qualquer população com média μ e variância finita, a distribuição amostral das médias das amostras se aproxima da distribuição normal.
- A média dessa distribuição amostral será μ e a variância será σ²/n.
- Se a população já for normalmente distribuída, a distribuição amostral das médias será normalmente distribuída para qualquer tamanho de amostra (n).
- Quanto maior o tamanho da amostra (n), mais a distribuição das médias se torna menos estendida e mais concentrada na média.
Distribuição Amostral da Proporção
O trabalho também pode ser feito com proporções. Quando a proporção populacional (p) é desconhecida, ela deve ser estimada a partir da proporção de sucessos na amostra.
- Esperança do Estimador (Proporção Amostral): É igual à proporção populacional (p).
- Variância do Estimador (Proporção Amostral): Envolve o valor de p (sucessos) e q (fracassos, onde q = 1-p). O Fator de Correção também pode ser aplicado para populações pequenas e sem reposição.
👉 Quer mais resumos como este? Acompanhe nosso blog e prepare-se para o seu concurso!
