Associação


Estatística


A associação indica a possibilidade ou não da relação entre duas variáveis. Para definir se existe esta relação, a Estatística dispõe de ferramentas que ajudam a evidenciar ou não uma relação existente em teoria, mas estes resultados são válidos apenas se a metodologia de coleta e análise de dados for bem fundamentada.

https://www.oblogdomestre.com.br/2018/06/Associacao.Estatistica.Matematica.html
[Imagem: Neoway]



Considerando todo o cuidado necessário com o método, partiremos aos conceitos e ferramentas. A Associação consiste no indicativo de relação entre duas variáveis qualitativas (dados categorizados), buscando saber se a probabilidade de uma pode afetar resultados em outra. Por exemplo, se uma pessoa dirige legalmente (com CNH e no Brasil), terá maioridade penal. Logo, as variáveis direção legal e maioridade são associadas. 

A associação não implica relação de causa e consequência de uma variável em relação a outra. Pode ser que haja uma terceira variável que influencie estas outras duas. Por isso ainda é importante o embasamento teórico.

Pensando em variáveis qualitativas e a busca por apontar ou não uma possível associação, constrói-se uma tabela de contingência. Esta tabela possui as possíveis respostas a uma variável qualitativa nas linhas, e as possíveis formas de outra variável em suas colunas. Cada célula ou casela possui o número de indivíduos com as respectivas formas para a respectiva linha e coluna, podendo conter percentuais. Os totais são apresentados nos extremos. Por exemplo:


Variáveis
Finanças
Totais
Personalidade
Pobre
Rico
Otimista
155
(47 %)
175
(53 %)
330
(100 %)
Pessimista
206
(51 %)
197
(49 %)
403
(100 %)
Totais
361
(49 %)
372
(51 %)
733
(100 %)

 Para avaliar se existe relação (associação) entre as duas variáveis, personalidade e finanças em nosso exemplo, pode-se utilizar o teste Qui-quadrado. Para que ele seja válido, é necessário haver mais do que dez indivíduos com em uma das células. Podemos montar uma outra tabela com valores esperados Eij, sendo cada um o produto da soma da linha pela soma da coluna dividido pelo total de observações. Note que há fracionários, e não se desespere por isso: não precisa fazer sentido como contagem.


Valores esperados
Finanças
Totais
Personalidade
Pobre
Rico
Otimista
162,5
(47 %)
167,5
(53 %)
330
(100 %)
Pessimista
198,5
(51 %)
204,5
(49 %)
403
(100 %)
Totais
361
(49 %)
372
(51 %)
733
(100 %)

Agora, eleve ao quadrado a diferença entre observados e esperados, divida pelos esperados em cada célula.


Parcelas de Qui-quadrado
Finanças
Personalidade
Pobre
Rico
Otimista
(155 – 162,5)²/162,5 = 0,35
(175-167,5)²/167,5 = 0,34
Pessimista
(206 – 198,5)²/198,5 = 0,28
(197 – 204,5)²/204,5 = 0,28

E somamos todas as parcelas de Qui-quadrado. Disso, temos a fórmula para esta estatística:

χ² = Σ0 i Σ0 j [(Oij – Eij)²/Eij]

O que resulta em 1,25 para Qui-quadrado. Com este valor, iremos realizar um teste de hipóteses. Neste teste, a hipótese nula H0 é de independência entre as variáveis, enquanto H1 demonstra associação entre variáveis na população em estudo. A estatística do teste é a própria distribuição Qui-quadrado com (l - 1) • (c - 1) graus de liberdade (sendo l o número de linhas e c o número de colunas). Em nosso exemplo, então, consideraremos um grau de liberdade na distribuição Qui-quadrado.

Iremos coletar a probabilidade associada à distribuição Qui-quadrado, em um teste unilateral à direita. Com um valor p (probabilidade de significância) de 0,26, não se pode rejeitar a hipótese nula, pois a probabilidade de que haja um desvio por acaso, e não simplesmente por ela ser falsa, é grande. Mesmo assumindo um erro (nível de significância) de 10 %, ainda assim não se pode rejeitar, comparando p e α.


👉 E ainda mais para você: Aproximando a binomial pela normal



GOSTOU DESTA POSTAGEM ? USANDO A BARRA DE BOTÕES, COMPARTILHE COM SEUS AMIGOS 😉!

Postar um comentário