Contenuto
- TL; DR (Too Long; Didnt Read)
- Deviazione standard vs. Deviazione standard del campione
- Individuazione della deviazione standard del campione
- Deviazione media vs. Deviazione standard
Test statistici come il t-test dipende intrinsecamente dal concetto di deviazione standard. Qualsiasi studente in statistica o scienze utilizzerà regolarmente le deviazioni standard e dovrà capire cosa significa e come trovarlo da un insieme di dati. Per fortuna, l'unica cosa di cui hai bisogno sono i dati originali, e mentre i calcoli possono essere noiosi quando hai molti dati, in questi casi dovresti usare le funzioni o i fogli di calcolo per farlo automaticamente. Tuttavia, tutto ciò che devi fare per comprendere il concetto chiave è vedere un esempio di base che puoi facilmente elaborare a mano. Alla base, la deviazione standard del campione misura la quantità che la quantità scelta varia in base all'intera popolazione in base al campione.
TL; DR (Too Long; Didnt Read)
utilizzando n per indicare la dimensione del campione, μ per la media dei dati, Xio per ogni singolo punto dati (da io = 1 a io = n) e Σ come segno di somma, la varianza del campione (S2) è:
S2 = (Σ Xio – μ)2 / (n − 1)
E la deviazione standard del campione è:
S = √S2
Deviazione standard vs. Deviazione standard del campione
Le statistiche ruotano attorno alla creazione di stime per intere popolazioni basate su campioni più piccoli della popolazione e alla contabilità di eventuali incertezze nella stima nel processo. Le deviazioni standard quantificano la quantità di variazione nella popolazione che stai studiando. Se stai cercando di trovare l'altezza media, otterrai un gruppo di risultati attorno al valore medio (medio) e la deviazione standard descrive la larghezza del gruppo e la distribuzione delle altezze tra la popolazione.
La deviazione standard "campione" stima la deviazione standard reale per l'intera popolazione sulla base di un piccolo campione dalla popolazione. Il più delle volte, non sarai in grado di campionare l'intera popolazione in questione, quindi la deviazione standard del campione è spesso la versione giusta da usare.
Individuazione della deviazione standard del campione
Hai bisogno dei tuoi risultati e del numero (n) di persone nel tuo campione. Innanzitutto, calcola la media dei risultati (μ) sommando tutti i risultati individuali e quindi dividendoli per il numero di misurazioni.
Ad esempio, le frequenze cardiache (in battiti al minuto) di cinque uomini e cinque donne sono:
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
Il che porta a una media di:
μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10
= 702 ÷ 10 = 70.2
La fase successiva è sottrarre la media da ogni singola misurazione e quindi quadrare il risultato. Ad esempio, per il primo punto dati:
(71 – 70.2)2 = 0.82 = 0.64
E per il secondo:
(83 – 70.2)2 = 12.82 = 163.84
Continui in questo modo attraverso i dati e quindi aggiungi questi risultati. Quindi, per i dati di esempio, la somma di questi valori è:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
La fase successiva distingue tra la deviazione standard del campione e la deviazione standard della popolazione. Per la deviazione del campione, dividi questo risultato per la dimensione del campione meno uno (n -1). Nel nostro esempio, n = 10, quindi n – 1 = 9.
Questo risultato fornisce la varianza del campione, indicata da S2, che per l'esempio è:
S2 = 353.6 ÷ 9 = 39.289
La deviazione standard del campione (S) è solo la radice quadrata positiva di questo numero:
S = √39.289 = 6.268
Se stavi calcolando la deviazione standard della popolazione (σ) l'unica differenza è che dividi per n piuttosto che n −1.
L'intera formula per la deviazione standard del campione può essere espressa utilizzando il simbolo di somma Σ, con la somma che si trova sull'intero campione e Xio che rappresenta il i_ esito su _n. La varianza del campione è:
S2 = (Σ Xio – μ)2 / (n − 1)
E la deviazione standard del campione è semplicemente:
S = √S2
Deviazione media vs. Deviazione standard
La deviazione media differisce leggermente dalla deviazione standard. Invece di quadrare le differenze tra la media e ogni valore, devi solo prendere la differenza assoluta (ignorando qualsiasi segno meno) e quindi trovare la media di quelli. Per l'esempio nella sezione precedente, il primo e il secondo punto dati (71 e 83) danno:
X1 – μ = 71 – 70.2 = 0.8
X2 – μ = 83 – 70.2 = 12.8
Il terzo punto dati fornisce un risultato negativo
X3 – μ = 63 – 70.2 = −7.2
Ma basta rimuovere il segno meno e prenderlo come 7.2.
La somma di tutti questi dati è divisa per n dà la deviazione media. Nell'esempio:
(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64
Ciò differisce sostanzialmente dalla deviazione standard calcolata in precedenza, perché non coinvolge quadrati e radici.