test per variabili continue - le due mutabili indipendenti
giovedì
6 maggio 1999
Dobbiamo misurare quanto bene i dati empirici si adattano alla curva.
cx-la[(ve-vt)2/vt]
es. (3-5)2/5 + (9-6)2/6
+ .
Questo è l'utilizzo.
Io devo fare un'inversione rispetto al normale mio uso: mi interessa
che non ci sia lo scarto, che i dati empirici non differiscano
esageratamente da quelli teorici.
Un uso analogo a quello delle tabelle di contingenza.
Variabili categoriali con scala nominale si chiamano mutabili.
0,025<c<0,975
I valori di mutabili possono essere solo delle frequenze.
Il c è un test per variabili continue. Se
le frequenze sono alte non fa differenza, ma se sono alte, sì.
Correzione di continuità: diminuire le frequenze di un valore pari alla metà del totale (perché
così si mette un dato in mezzo tra i due).
Correzione di Yates:
-N/2; se la frequenza è minore di 50.
F
P
V
N
Dobbiamo fare gli scarti, ma a che cosa corrisponde vt?
Valore che si dovrebbe avere se si ha la stessa proporzione tra le due mutabili
dipendenti e le due mutabili indipendenti. Valore che si ha quando le
proporzioni sono uguali nelle 2x2 mutabili.
vr
a+b
vr
c+d
a+c
b+d
N
vt
[(a+b)*(a+c)]/N
[(a+b)*(b+d)]/N
[(c+d)*(a+c)]/N
[(c+d)*(b+d)]/N
vt=(vr*vc)/N
vt=[(7+11)*(7+22)]/N
vt=[(7+11)*(11+1)]/N
7 - (7+11)*(7+22)2 11 - (7+11)*(11+1)2
N N + .
(7+11)*(7+22)(7+11)*(11+1)
N N
Siccome questo calcolo è complicato si usa una formula ridotta .
c N*(ad-bc)2 Positivo
per forza
(a+b)*(c+d)*(a+c)*(b+d)
c N*(|ad-bc|-N/2)2 N=frequenza
(a+b)*(c+d)*(a+c)*(b+d)
Il c è definito solo per campioni indipendenti
e non per quelli dipendenti (con loro si usa il test di Fisher).