Matemática
Nem todos os valores matemáticos para uma
dada variável são determinísticos, ou seja, apenas um valor exato para tanto
(como por exemplo a sua massa corporal). Muitos valores que dadas variáveis
assumem são obtidos com base em análises matemático-estatísticas, para
determinar um valor que represente bem um conjunto de dados, como por exemplo,
uma nota do aluno para seu curso de graduação, ou a provável resistência de um material
com pequena probabilidade de erro. Esse valor também é acrescido de outros que
definem características da massa de dados que o originou, o quanto esta se
distancia de um valor médio, etc.
[Imagem: Wikipedia] |
As
medidas de tendência central ou medidas de posição são feitas com base em uma
distribuição de frequência, chamada comumente de função distribuição de
probabilidade. São três: média (harmônica, ponderada, geométrica ou
aritmética), mediana e moda.
A
média aritmética é um valor tal que metade dos dados se apresenta logo abaixo e
metade dos dados se apresenta em valor superior em um conjunto de dados. A
média aritmética representa um valor de soma dos dados constante, ou seja,
multiplicando a média aritmética pelo número n de dados, obtém-se a própria soma dos dados originais. Porém, só
irá representar uma boa medida estatística se os dados não forem muito
dispersos (veremos como saber a seguir). Sua expressão matemática é dada por:
xmed
= (1/n) · ∑ n
i = 1 (xi)
Já
a média harmônica é aquela em que a soma dos inversos é uma constante, seja
somada com os inversos dos elementos de uma amostra, seja por n vezes o inverso desta média. Assim,
tem-se:
hmed
= (n) · [ ∑ n
i = 1 (1/xi)]
A
média geométrica, por sua vez, é um número tal que, elevado ao número n de dados de uma amostra, resulta no
mesmo produto que contenha os dados da amostra como seus fatores. Sendo assim,
temos:
gmed
= [∏n i=1
(xi)]1/n
A
média ponderada é uma média aritmética em que são dados ‘pesos’ diferentes para
cada dado da amostra. Ao invés de ser obtida uma média pela soma de termos pelo
número de termos, obtém-se a soma dos produtos entre pesos e dados da amostra
dividida pela soma total de pesos. Assim, tem-se:
pmed
= [1/∑ n
i = 1 (pi)] · ∑ n
i = 1 (pi · xi)
Em
alguns casos, as notas de vestibulares são exemplos de médias ponderadas. Pode-se
ter um vestibular em que a nota da prova da universidade tenha peso 75 e que a
nota do ENEM tenha peso 25, por exemplo. A soma dos pesos [1/∑ 2
i = 1 (pi)] é igual a 100. Porém, muitas pessoas se
confundem com o significado dos pesos, dizendo que a nota do vestibular
corresponde a 75% da nota final no nosso exemplo, o que só seria verdade em
alguns casos específicos. Supondo que um aluno tire nota 90 neste vestibular e
83 no ENEM (apenas para exemplificar), tem-se que a nota dele (média ponderada)
é de 0,75 · 90 + 0,25 · 83 = 67,5 + 20,75 = 88,25. Verificando a participação da
nota advinda do vestibular na composição final tem-se que 67,5/88,25 = 76,49% e
não 75% como algumas pessoas diriam. Se a diferença entre as notas fosse maior,
esta diferença ficaria ainda mais nítida.
A
mediana é uma medida de tendência central, onde distribuições próximas à
igualdade em torno da média aritmética tendem a ser semelhantes à média
aritmética. Ordenando os valores da amostra em ordem crescente, quando esta
amostra tiver um número n par de
valores, a mediana md será a média
aritmética entre os valores (n/2) e (n/2 + 1), enquanto que se n for ímpar, md será o próprio valor central. Já a moda, que nas passarelas
espelha aquilo que se verá nas ruas, com parte de seus conceitos, na
estatística nada mais é do que o número que mais aparece na amostra, ou seja, o
mais frequente.
Passando
às medidas de dispersão, que nos auxiliam a avaliar o quanto os dados variam em
torno do valor da média aritmética, temos a Amplitude, o Desvio Padrão, o Desvio
Médio, a Variância e o Coeficiente de Variação. Começando pela Amplitude, conhecida
por todo o mundo pelas previsões do tempo, nada mais é do que a diferença entre
os valores máximo e mínimo da amostra.
Passando
para a Variância, esta é um dado mais apurado de dispersão, abrangendo todo o
conjunto de dados. Obtém-se a média aritmética e, para cada desvio da média,
este é elevado ao quadrado e dividido ou pelo número de n de dados ou por (n -1)
quando tivermos a chamada variância experimental ou amostral. Sua expressão é
dada por:
s² =
(1/n) · ∑ n
i = 1 (xi – xmed)² ou [1/(n - 1)]
· ∑ n
i = 1 (xi – xmed)²
O
desvio padrão, por sua vez, é dado pela raiz quadrada da variância ou da
variância experimental / amostral. Destarte:
s =
[(1/n) · ∑ n
i = 1 (xi – xmed)²]1/2 ou {[1/(n -
1)] · ∑ n i = 1 (xi
– xmed)²}1/2
Porém,
pode não ser conclusivo ver um desvio padrão por si só, conforme afirmam alguns
estudiosos na área da Estatística. Suponhamos ter um desvio de duas unidades
com um valor médio de 1 ou com um valor médio de 0,75. Para solucionar este
problema surge o Coeficiente de Variação (de Pearson), que é a razão percentual
entre desvio padrão e média aritmética. Logo:
CV
= s/xmed
Assim,
pelos nossos valores-exemplo, temos CV = 2/1 = 200% e 2/0,75 = 266%,
respectivamente. Por fim, ainda temos a medida de desvio médio, ou que também
podemos chamar de média dos desvios (de cada valor e a média aritmética). Sua
expressão matemática:
d =
(1/n) · ∑ n
i = 1 (xi – xmed)
□
GOSTOU DESTA POSTAGEM? USANDO A BARRA DE
BOTÕES, COMPARTILHE COM SEUS AMIGOS!