Todos os dias entram pela nossa "porta" frases sobre Estatística.
Desvios padrões, médias, medianas, percentis, testes de hipóteses, intervalos de confiança, regressão linear... entre outros parâmetros.
Neste artigo vou interpretar alguns destes parâmetros, adaptando a exemplos reais.
Estatística Descritiva
A estatística descritiva organiza os dados das amostras. A maioria dos inquéritos feitos pelo Instituto Nacional de Estatística são preenchidos por pessoas que não são matemáticas, porém a sua interpretação é feita por estatísticos.
Na estatística descritiva interpretamos médias, modas, medianas, desvios padrões, quartis das amostras recolhidas.
Vou dar um exemplo e interpretar estes parâmetros.
Medidas de tendência central
As medidas de tendência central são a média, a moda e a mediana.
Exemplo:
Estudámos uma amostra de 1000 pessoas e perguntamos:
- Quantas horas por dia viu televisão durante a quarentena?
E obtivemos os seguintes resultados estatísticos.
- Média - 3h, ou seja, o tempo médio em frente à televisão foi de 3 horas.
- Mediana - 2,5h, ou seja, 50% dos inquiridos tiveram até 2,5 horas em frente à televisão.
- Moda - 3,5h, ou seja, o número mais frequente de horas passadas a ver televisão foram 3,5.
Medidas de dispersão
As medidas de dispersão mais comuns são a variância, o desvio padrão e a amplitude interquartil.
Continuando com o nosso exemplo,
- Desvio Padrão: 1h, ou seja, existe um desvio de uma hora em torno da média.
- Q1: 2h, ou seja, 25% dos inquiridos estiveram até 2 horas em frente à televisão.
- Q3: 4,5h, ou seja, 75% dos inquiridos estiveram até 4,5h em frente à televisão.
- Amplitude interquartil: (Q3- Q1) = 2,5h.
Regressão Linear
Nesta altura surge a questão, o que é um modelo de regressão linear?
É um modelo estatístico onde existe uma forte relação linear entre duas variáveis. Depois de estarem construídos estes tipos de modelos são muito úteis na previsão.
Por exemplo:
X - número de dias de confinamento,
Y - número de infectados com covid-19.
Ao construirmos um modelo de regressão linear com estas duas variáveis onde existe uma forte relação linear negativa entre ambas, isto é, à medida que o X aumenta, o Y diminui.
Podemos fazer previsões sobre o número mais equilibrado de dias de confinamento.
Espero com este artigo poder ajudar-te a interpretar alguns dados estatísticos.