Estatística

A Estatística, como um ramo da Matemática, dedica-se ao estudo da coleta, organização e análise de dados, frequentemente por meio de amostras. Este campo se divide em dois ramos principais: a Estatística Descritiva (ou dedutiva) e a Estatística Inferencial.

Ramos da Estatística

Estatística Descritiva

A Estatística Descritiva tem por objetivo descrever fatos e resumir dados numéricos de um grupo ou população, sem o intuito de tirar conclusões de caráter mais genérico. É considerada dedutiva, pois a análise de gráficos, tabelas, média, desvio padrão e variância se limita àquilo que já existe, sem criar nada novo. O resultado obtido não vai além do que já está implícito nas premissas. A visualização e a análise exploratória de dados, frequentemente com o uso de gráficos e tabelas, são ferramentas importantes deste ramo.

Estatística Inferencial

Já a Estatística Inferencial exige ir além dos dados existentes, buscando utilizar uma amostra representativa para inferir sobre as características de toda a população, sendo crucial para a tomada de decisões. A inferência é geralmente realizada por meio do cálculo de probabilidades, baseada em um estimador através de uma amostra (processo chamado de estimação).

Conceitos Fundamentais

No estudo estatístico, alguns conceitos são essenciais:

  • População (N): Corresponde ao conjunto universo de todos os elementos (pessoas, objetos, eventos) que são o objeto de estudo.
  • Parâmetro: É uma medida numérica que descreve uma característica da população, como a média (μ) ou a variância (σ²).
  • Amostra (n): É um subconjunto não vazio de uma população. Em 90% das situações dentro da estatística inferencial, trabalha-se com a amostra, pois o estudo de populações é frequentemente caro, demorado e pode estar desatualizado.
  • Estatística (ou Estimador): Uma medida numérica que descreve uma característica da amostra, como a média amostral () ou a variância amostral (s²).
  • Censo: Um processo estatístico que envolve a avaliação direta de um parâmetro, obtendo dados de todos os componentes da população. Embora caro e lento, apresenta erro processual zero e confiabilidade de 100%.

Tipos de Dados

Os dados estatísticos podem ser classificados quanto ao tipo:

  • Dados Quantitativos: Possuem características numéricas.
    • Discretos: O conjunto de resultados é enumerável, assumindo apenas valores inteiros (e.g., número de filhos).
    • Contínuos: Podem assumir qualquer valor em um intervalo de números reais (e.g., altura ou volume de água).
  • Dados Qualitativos (Atributos): Possuem características não numéricas, separadas em categorias.
    • Nominais: Não podem ser ordenados (ex.: sexo, cor dos olhos).
    • Ordinais: Possuem uma ordem de categorias (ex.: classe social ou nível de escolaridade).

Medidas de Tendência Central e Dispersão (Estatística Descritiva)

As medidas de posição são grandezas que buscam resumir a amostra em um único número, destacando-se as medidas de tendência central que estimam um ponto central:

  • Média Aritmética: O somatório dos elementos dividido pela quantidade de elementos. É sensível à presença de valores extremos ou atípicos (outliers).
  • Mediana: O valor central que divide os dados ordenados em duas partes iguais (50% para cada lado). É uma estimativa robusta, não sendo sensível a outliers.
  • Moda: O valor que ocorre com maior frequência. Também é robusta.

As medidas de dispersão determinam a variação ou homogeneidade dos dados:

  • Variância (σ² ou s²): Mede o quão dispersos os dados estão em relação a uma medida de posição, como média.
  • Desvio Padrão (σ ou s): Indica o quanto os valores de um conjunto de dados estão afastados média.
  • Coeficiente de Variação: Usado para analisar a dispersão em termos relativos ao valor médio, útil para comparar séries com escalas diferentes.

Fundamentos da Inferência

O Teorema Central do Limite é um pilar da Estatística Inferencial. Ele afirma que, à medida que o tamanho da amostra (n) cresce, a distribuição das médias amostrais se aproxima de uma distribuição normal. Isso ocorre independentemente da forma da distribuição da população, desde que esta tenha variância finita.

A Distribuição Normal (ou Gaussiana) é a distribuição de probabilidade mais importante, sendo contínua e simétrica em torno da média. É definida pela média (µ) e pelo desvio padrão (σ). Na Distribuição Normal, a área sob a curva representa a probabilidade.

Técnicas de Amostragem

A amostragem é definida como o procedimento de obter uma amostra representativa de uma população. É classificada em dois grandes grupos:

Amostragem Probabilística (Casual/Aleatória)

Neste tipo, a seleção da amostra é aleatória, e cada elemento da população tem uma probabilidade conhecida de ser incluído.

  • Aleatória Simples: Todos os elementos da população têm igual probabilidade de participar da amostra.
  • Sistemática: Seleciona-se um ponto inicial aleatório e, em seguida, os demais elementos são retirados em intervalos fixos regulares.
  • Estratificada: A população é dividida em subpopulações ou estratos (grupos mais homogêneos). Amostras são selecionadas em cada estrato, frequentemente de forma proporcional ao tamanho do estrato (alocação proporcional). Essa técnica gera, em geral, estimativas mais precisas que a Aleatória Simples.
  • Por Conglomerados: A população é dividida em grupos (conglomerados), e o conglomerado inteiro é selecionado para a amostra.

Amostragem Não Probabilística

Neste tipo, a escolha das unidades amostrais é deliberada, sem utilizar técnicas estatísticas rigorosamente científicas para garantir a equiprobabilidade. Exemplos incluem a amostragem a esmo ou sem norma, a amostragem intencional (por julgamento) e a técnica Bola de Neve.

👉 Quer mais resumos como este? Acompanhe nosso blog e prepare-se para o seu concurso!

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima