Estatística
A associação indica a possibilidade ou não
da relação entre duas variáveis. Para definir se existe esta relação, a Estatística
dispõe de ferramentas que ajudam a evidenciar ou não uma relação existente em
teoria, mas estes resultados são válidos apenas se a metodologia de coleta e
análise de dados for bem fundamentada.
[Imagem: Neoway] |
Considerando todo o cuidado necessário com o
método, partiremos aos conceitos e ferramentas. A Associação consiste no
indicativo de relação entre duas variáveis qualitativas (dados categorizados),
buscando saber se a probabilidade de uma pode afetar resultados em outra. Por
exemplo, se uma pessoa dirige legalmente (com CNH e no Brasil), terá maioridade
penal. Logo, as variáveis direção legal
e maioridade são associadas.
A associação não implica relação de causa e
consequência de uma variável em relação a outra. Pode ser que haja uma terceira
variável que influencie estas outras duas. Por isso ainda é importante o
embasamento teórico.
Pensando em variáveis qualitativas e a busca
por apontar ou não uma possível associação, constrói-se uma tabela de contingência. Esta tabela
possui as possíveis respostas a uma variável qualitativa nas linhas, e as
possíveis formas de outra variável em suas colunas. Cada célula ou casela
possui o número de indivíduos com as respectivas formas para a respectiva linha
e coluna, podendo conter percentuais. Os totais são apresentados nos extremos.
Por exemplo:
Variáveis
|
Finanças
|
Totais
|
|
Personalidade
|
Pobre
|
Rico
|
|
Otimista
|
155
(47 %)
|
175
(53 %)
|
330
(100 %)
|
Pessimista
|
206
(51 %)
|
197
(49 %)
|
403
(100 %)
|
Totais
|
361
(49 %)
|
372
(51 %)
|
733
(100 %)
|
Para
avaliar se existe relação (associação) entre as duas variáveis, personalidade e
finanças em nosso exemplo, pode-se utilizar o teste Qui-quadrado. Para que ele
seja válido, é necessário haver mais do que dez indivíduos com em uma das células.
Podemos montar uma outra tabela com valores esperados Eij, sendo
cada um o produto da soma da linha pela soma da coluna dividido pelo total de
observações. Note que há fracionários, e não se desespere por isso: não precisa
fazer sentido como contagem.
Valores esperados
|
Finanças
|
Totais
|
|
Personalidade
|
Pobre
|
Rico
|
|
Otimista
|
162,5
(47 %)
|
167,5
(53 %)
|
330
(100 %)
|
Pessimista
|
198,5
(51 %)
|
204,5
(49 %)
|
403
(100 %)
|
Totais
|
361
(49 %)
|
372
(51 %)
|
733
(100 %)
|
Agora, eleve ao quadrado a diferença entre
observados e esperados, divida pelos esperados em cada célula.
Parcelas de Qui-quadrado
|
Finanças
|
|
Personalidade
|
Pobre
|
Rico
|
Otimista
|
(155 – 162,5)²/162,5 = 0,35
|
(175-167,5)²/167,5 = 0,34
|
Pessimista
|
(206 – 198,5)²/198,5 = 0,28
|
(197 – 204,5)²/204,5 = 0,28
|
E somamos todas as parcelas de Qui-quadrado.
Disso, temos a fórmula para esta estatística:
χ² = Σ0
i Σ0 j [(Oij – Eij)²/Eij]
O que resulta em 1,25 para Qui-quadrado. Com
este valor, iremos realizar um teste de hipóteses. Neste teste, a hipótese nula
H0 é de independência entre as variáveis, enquanto H1
demonstra associação entre variáveis na população em estudo. A estatística do
teste é a própria distribuição Qui-quadrado com (l - 1) • (c - 1) graus de liberdade
(sendo l o número de linhas e c o número de colunas). Em nosso exemplo, então,
consideraremos um grau de liberdade na distribuição Qui-quadrado.
Iremos coletar a probabilidade associada à
distribuição Qui-quadrado, em um teste unilateral à direita. Com um valor p
(probabilidade de significância) de 0,26, não se pode rejeitar a hipótese nula,
pois a probabilidade de que haja um desvio por acaso, e não simplesmente por
ela ser falsa, é grande. Mesmo assumindo um erro (nível de significância) de 10
%, ainda assim não se pode rejeitar, comparando p e α.
□
GOSTOU DESTA POSTAGEM ☺? USANDO A BARRA DE BOTÕES, COMPARTILHE COM SEUS AMIGOS 😉!