In statistica, il campionamento casuale di dati da una popolazione spesso porta alla produzione di una curva a forma di campana con la media centrata sul picco della campana. Questo è noto come una distribuzione normale. Il teorema del limite centrale afferma che all'aumentare del numero di campioni, la media misurata tende a essere normalmente distribuita intorno alla media della popolazione e la deviazione standard diventa più stretta. Il teorema del limite centrale può essere utilizzato per stimare la probabilità di trovare un determinato valore all'interno di una popolazione.
Raccogliere i campioni e quindi determinare la media. Ad esempio, supponi di voler calcolare la probabilità che un maschio negli Stati Uniti abbia un livello di colesterolo di 230 milligrammi per decilitro o superiore. Iniziamo raccogliendo campioni da 25 individui e misurando i loro livelli di colesterolo. Dopo aver raccolto i dati, calcolare la media del campione. La media si ottiene sommando ciascun valore misurato e dividendolo per il numero totale di campioni. In questo esempio, supponiamo che la media sia 211 milligrammi per decilitro.
Calcola la deviazione standard, che è una misura della "diffusione" dei dati. Questo può essere fatto in pochi semplici passaggi:
In questo esempio, supponiamo che la deviazione standard sia di 46 milligrammi per decilitro.
Calcola l'errore standard dividendo la deviazione standard per la radice quadrata del numero totale del campione:
Errore standard = 46 / sqrt25 = 9.2
Disegna uno schizzo della distribuzione e dell'ombra normali con la probabilità appropriata. Seguendo l'esempio, si desidera conoscere la probabilità che un maschio abbia un livello di colesterolo di 230 milligrammi per decilitro o superiore. Per trovare la probabilità, scopri quanti errori standard sono lontani dalla media di 230 milligrammi per decilitro (valore Z):
Z = 230 - 211 / 9,2 = 2,07
Cerca la probabilità di ottenere un valore di errori standard 2,07 sopra la media. Se devi trovare la probabilità di trovare un valore entro 2,07 deviazioni standard della media, allora z è positivo. Se devi trovare la probabilità di trovare un valore oltre 2,07 deviazioni standard della media, allora z è negativo.
Cerca il valore z su una tabella di probabilità normale standard. La prima colonna sul lato sinistro mostra l'intero numero e la prima posizione decimale del valore z. La riga in alto mostra il terzo decimale del valore z. Seguendo l'esempio, poiché il nostro valore z è -2,07, individuare innanzitutto -2,0 nella colonna di sinistra, quindi eseguire la scansione della riga superiore per la voce 0,07. Il punto in cui queste colonne e righe si intersecano è la probabilità. In questo caso, il valore letto dalla tabella è 0,0192 e quindi la probabilità di trovare un maschio con un livello di colesterolo di 230 milligrammi per decilitro o superiore è dell'1,92 percento.