ANOVA (Analisi della varianza) - Modello lineare degli effetti nella statistica
mercoledì
10 marzo 1999
ANOVA (Analisi della varianza)
Estensione del t di student nel caso in cui
si devono confrontare le medie di più gruppi.
ANOVA ad una via esiste una sola variabile
indipendente (es. età) a più livelli (es, bambini, giovani, anziani).
Disegni fattoriali ANOVA a più vie in
cui esistono più variabili indipendenti a più livelli.
La variabile dipendente è comunque sempre 1.
Farmaco Placebo Controllo v.d.= lunghezza sonno
Nel caso di MANOVA (ANOVA multipla) abbiamo
più variabili dipendenti.
La statistica nell'ANOVA si chiama F
(Fisher). F è in rapporto diretto con t in quanto F = t2 . anche se
è meglio dire t = ±F. Quindi F è per
definizione positivo.
Il passaggio da F a t non è indolore in
quanto deve essere usato un t a due code.
Il valore di F non mi dice nulla delle
differenze dei gruppi.
Fatta una ANOVA devo fare i confronti prostock (a 2 a 2).
t e F sono la stessa statistica.
Alla base dell'ANOVA c'è il concetto di partizione della somma dei quadrati.
Modello lineare degli effetti nella
statistica
i-esimo soggetto sottoposto al j-esimo
trattamento.
yi,j = maj + ei
La formula ci dice che le ore di sonno del
soggetto dipendono dalla composizione lineare di tre fattori:
m media dell'universo;
aj fattore legato specificatamente al trattamento, corrisponde ad uno
scarto dalla media ed è identico per tutti i soggetti. E' detta between (b);
ei errore statistico
(non sbaglio), quid che differenzia all'interno dell'universo ogni persona
dalle altre. L'errore è tutto quel
complesso di fattori che noi non siamo in grado di tenere sotto controllo.Varianza
"entro soggetti" (interna al soggetto) detta within (w).
Se noi dimostriamo che b>w possiamo dire
che i trattamenti sono stati efficaci.
Se noi facciamo la somma dei semplici errori
statistici essa tende ad annullarsi (S ei
Tendenza rapida.
Se ho 3 gruppi indipendenti la somma degli
errori dei 3 gruppi tenderà ad annullarsi, mentre se il trattamento è efficace
ci sarà una forte differenza dovuta al trattamento.
somma dei quadrati totale alla base della varianza
SS (xi,j - M)2xi,j = yi,j M = media globale
faccio un trucchetto algebrico: ad ogni soggetto
aggiungo e tolgo la media del trattamento
SS (xi,j - Mj
+ Mj - M)2
posso trattarlo come un trinomio
SS [(xi,j - Mj)+
(Mj - M)]2
sviluppo il quadrato del binomio e metto dentro i
termini "sommatoria".
SS (xi,j - Mj)2+
SS (Mj - M)2 + 2SS (xi,j - Mj)*
(Mj - M)
xi,j - Mj=0e Mj - M=0
SS (xi,j - Mj)2+
SS (Mj - M)2
w b
dividere somme dei quadrati per i gradi di libertà:
per w è ; per b è n-l livelli.
T medie dei quadrati.
SS (somma dei quadrati)
MS = SS/g (media dei
quadrati)
F = MSb/MSwse F<1 trattamento non significativo MSb<MSw mi fermo!
Se F>1 devo vedere la probabilità
corrispondente ad F.