ePerTutti


Appunti, Tesina di, appunto matematica

STIME E LORO AFFIDABILITA'

ricerca 1
ricerca 2

STIME E LORO AFFIDABILITA'


L'idea chiave su cui si basa l'analisi statistica è che si possono eseguire osservazioni su un campione di soggetti e che da questo si possono compiere inferenze sulla popolazione rappresentata da tutti i soggetti con caratteristiche analoghe a quelle del capione;

Anche se ben pianificato, uno studio può dare solo una idea della risposta cercata, a causa essenzialmente della variabilità casuale del campione stesso strettamente collegata, tra l'altro, al numero di soggetti inclusi in uno studio;

Le quantità statistiche ottenute (medie, proporzioni, odds, coefficienti di regressione, etc.) sono stime imprecise dei veri valori nella popolazione generale.




STIMA


Una misura descrittiva calcolata dai dati di una popolazione è detta parametro

Una misura descrittiva calcolata dai dati di un campione è detta stima del parametro.

L'insieme dei metodi che ci consentono di estendere i risultati ottenuti dal campione a tutta la popolazione oggetto dello studio costituiscono l'inferenza statistica.







La stima è il calcolo, dai dati di un campione, di una qualche statistica, ed è una approssimazione del corrispondente parametro della popolazione da cui il campione è stato estratto.


Stima puntuale: si calcola un singolo valore numerico per stimare il corrispondente parametro. Es. una media, una proporzione, una deviazione standard.

Stima di intervallo: si calcola un intervallo di valori che, con un certo grado di probabilità, conterrà il parametro da stimare.





INTERVALLI DAI CONFIDENZA


Le stime di intervallo forniscono informazioni sia sul valore numerico del parametro incognito, che sul grado di attendibilità della stima.

La procedura di calcolo degli intervalli, detti di confidenza, si basa sulla determinazione di due limiti entro i quali, con una probabilità 1-a , è contenuto il parametro, a partire dalle informazioni campionarie

1-a = P(L1 L2) con 0 a


L1 e L2 dipendono dalle dimensioni del campione

a è il grado di attendibilità della stima ed è detto livello di confidenza


L'intervallo di confidenza per la media di una variabile con distribuzione di Gauss con media incognita e varianza nota





Per 1-a = 0,95 (cioè a = 0,05) z è pari a 1,96

Per 1-a = 0,99 (cioè a = 0,01) z è pari a 2,58


L'intervallo di confidenza per la media di una variabile con distribuzione di Gauss con media e varianza incognita





t si ottiene dalla distribuzione di Student con n-l gradi di libertà (n = n-l)


Interpretazione probabilistica degli intervalli di confidenza:

estraendo tutti i possibili campioni da una popolazione distribuita normalmente, la media µ della popolazione cadrà (1-a)% volte nell'intervallo calcolato.


Interpretazione pratica degli intervalli di confidenza:

se effettuiamo il campionamento da una popolazione con distribuzione normale, abbiamo una probabilità del (1-a)% che l'intervallo calcolato contenga la media  µ della popolazione.


Lo scopo principale degli intervalli di confidenza è quello di indicare la imprecisione delle stime campionarie come rappresentazione dei valori della popolazione.

L'imprecisione della stima campionaria è indicata dall'ampiezza degli intervalli:

più ampi sono gli intervalli minore è la precisione


L'ampiezza dipende essenzialmente da tre fattori:

Dal numero di soggetti studiati   (campioni poco numerosi conclusioni inattendibili)

Dalla variabilità dei soggetti in studio (minore variabilità stima più precisa)

Dal livello di confidenza    (maggiore è il livello di confidenza più ampi sono gli intervalli)


STIME DI INTERVALLO


In conclusione è possibile indicare una formula generica per la determinazione di un intervallo di confidenza:


Valore che serve a determinare i due limiti (inferiore e superiore), tenendo in considerazione il grado di attendibilità della stima

 

Media percentuale

 
stima (fattore di correzione errore della stima)









Intervallo di confidenza per la differenza di due medie


Dai due campioni si determinano le medie in studio e avremo:

µ1 - µ2 = differenza delle medie delle popolazioni

x1 - x2 = stima della differenza delle medie delle popolazioni

s /n1 - s /n2 = varianza della differenza delle medie campionarie


L'intervallo sarà:

a



Abbiamo usato z perché eravamo a conoscenza della varianza della popolazione.

Nel caso non si conosca la varianza della popolazione, si deve stimare dai campioni la "varianza comune" (pooled):

S12 (n1 - 1) + S22(n2 - 1)

Gradi di libertà

 
Sp2 =

n1 + n2 - 2


L'intervallo di confidenza diventa:



Intervallo di confidenza per una proporzione


In medicina è importante quantificare un fenomeno per mezzo delle percentuali


Es. percentuale di soggetti affetti da una malattia,

percentuale di soggetti sottoposti a un trattamento .


Il parametro da stimare diventa p, la proporzione nella popolazione, e per costruire un intervallo di confidenza procederemo nel seguente modo:


a = P(L1 p L2)



 





Per n sufficientemente grande, l'intervallo di confidenza può essere determinato secondo la seguente formula:


Analogamente a quanto fatto per gli intervalli di confidenza per le medie, è possibile costruire l'intervallo di confidenza per la differenza tra due proporzioni.

La stima di tale intervallo viene dalla seguente formula:

I




I PRINCIPI FONDAMENTALI DELLA VERIFICA DELLE IPOTESI


Verifica delle ipotesi


L'obiettivo è quello di guidare il clinico, il ricercatore o l'amministratore a prendere una decisione riguardo ad un parametro della popolazione, esaminando un campione di quella popolazione.


L'osservazione dei fenomeni porta alla formulazione di teorie che richiedono una conferma basata su una metodologia scientifica.






Le ipotesi statistiche sono una formulazione delle ipotesi di ricerca, in modo tale da poter essere valutate con opportune tecniche statistiche.


VERIFICA DELLE IPOTESI


Analisi dei dati

Assunzioni sul modello probabilistico, sui parametri, sul campione


Formulazione dell'ipotesi:

nulla H0 e alternativa H1


Costruzione della statistica test e della sua distribuzione


Definizione della regola di decisione e valutazione degli errori

a rifiutare l'ipotesi nulla vera

b accettare l'ipotesi nulla falsa


Decisione statistica e decisione clinica


ERRORE a O ERRORE DI I TIPO

L'espressione "p<" indica la probabilità di una conclusione falsamente positiva (un trattamento risulta migliore di un altro quando in realtà non lo è).

Quanto più piccolo è il valore di p, tanto meno probabile è che i trattamenti posti a confronto abbiano un effetto simile.


ERRORE b O ERRORE DI II TIPO

Commettendo l'errore b si afferma che i trattamenti sono uguali quando in realtà essi sono differenti (falso negativo).

L'errore b si verifica solitamente in caso di campioni di piccole dimensioni.

Non si evidenzia un effetto favorevole quando questo è presente.


POTENZA DEL TEST

La potenza di uno studio clinico è la sua capacità di fare emergere un effetto se questo esiste realmente.

Uno studio clinico con una bassa potenza è privo di ogni utilità, in quanto avrà una probabilità molto scarsa di raggiungere l'obiettivo che lo sperimentatore si prege.

Quando si parla di potenza di uno studio clinico, ci si riferisce alla potenza statistica 1-b che rappresenta la probabilità che la differenza attesa possa essere scoperta ad un predefinito livello di significatività a

Più alta è la potenza, maggiore è la possibilità che la differenza minima attesa tra i gruppi in trattamento possa essere dimostrata.

LA POTENZA DI UN TEST HA UN IMPATTO DIRETTO SULLA DIMENSIONE DEL CAMPIONE:

PIÙ ALTO È IL LIVELLO

È ragionevole che nion sia inferiore a 0.80

PIÙ GRANDE È LA DIMESIONE DEL CAMPIONE




Privacy

© ePerTutti.com : tutti i diritti riservati
:::::
Condizioni Generali - Invia - Contatta