Contenuto
- Misure di variabilità
- Formula di varianza
- Deviazione standard
- Varianza del campione e problema di deviazione standard
La capacità di calcolare il valore medio o medio di un gruppo di numeri è importante in ogni aspetto della vita. Se sei un professore che assegna i voti in lettere ai punteggi degli esami e tradizionalmente assegni un voto B a un punteggio medio, allora devi chiaramente sapere come appare numericamente il centro del pacchetto. Hai anche bisogno di un modo per identificare i punteggi come valori anomali in modo da poter determinare quando qualcuno merita un A o A + (al di fuori dei punteggi perfetti, ovviamente) e ciò che merita un voto non valido.
Per questo e motivi correlati, i dati completi sulle medie includono informazioni su quanto strettamente raggruppati attorno al punteggio medio che i punteggi sono in generale. Questa informazione viene trasmessa utilizzando deviazione standard e, in relazione, il varianza di un campione statistico.
Misure di variabilità
Hai quasi sicuramente sentito o visto il termine "medio" usato in riferimento a una serie di numeri o punti dati e probabilmente hai un'idea di ciò che si traduce nel linguaggio quotidiano. Ad esempio, se leggi che l'altezza media di una donna americana è di circa 5 4 ", concludi immediatamente che" medio "significa" tipico "e che circa la metà delle donne negli Stati Uniti è più alta di questa mentre circa la metà sono più brevi.
Matematicamente, media e media sono esattamente la stessa cosa: aggiungi i valori in un set e dividi per il numero di elementi nel set. Ad esempio, se un gruppo di 25 punteggi in un test di 10 domande va da 3 a 10 e si sommano a 196, il punteggio medio (medio) è 196/25 o 7,84.
La mediana è il valore del punto medio in un insieme, il numero in cui la metà dei valori si trova sopra e la metà dei valori si trova sotto. Di solito è vicino alla media (media) ma non è la stessa cosa.
Formula di varianza
Se osservi un set di 25 punteggi come quelli sopra e vedi quasi nient'altro che valori di 7, 8 e 9, ha senso intuitivo che la media dovrebbe essere intorno a 8. Ma cosa succede se vedi quasi nient'altro che punteggi di 6 e 10 ? O cinque punteggi di 0 e 20 punteggi di 9 o 10? Tutti questi possono produrre la stessa media.
La varianza è una misura della misura in cui i punti in un set di dati sono distribuiti sulla media. Per calcolare manualmente la varianza, si prende la differenza aritmetica tra ciascuno dei punti dati e la media, li si quadrano, si aggiunge la somma dei quadrati e si divide il risultato per uno in meno del numero di punti dati nel campione. Un esempio di questo è fornito in seguito. Puoi anche utilizzare programmi come Excel o siti Web come Tabelle rapide (vedi Risorse per siti aggiuntivi).
La varianza è indicata da σ2, un "sigma" greco con un esponente di 2.
Deviazione standard
La deviazione standard di un campione è semplicemente la radice quadrata della varianza. Il motivo per cui vengono utilizzati i quadrati quando si calcola la varianza è che se si sommano semplicemente le differenze individuali tra la media e ciascun singolo punto dati, la somma è sempre zero perché alcune di queste differenze sono positive e alcune sono negative e si annullano a vicenda . La quadratura di ogni termine elimina questa trappola.
Varianza del campione e problema di deviazione standard
Supponiamo che ti vengano dati i 10 punti dati:
4, 7, 10, 5, 7, 6, 9, 8, 5, 9
Trova la media, la varianza e la deviazione standard.
Innanzitutto, aggiungi i 10 valori insieme e dividi per 10 per ottenere la media (media):
70/10 = 7.0
Per ottenere la varianza, quadrare la differenza tra ciascun punto dati e la media, sommarli e dividere il risultato per (10 - 1) o 9:
9 + 0 + 9 + . . . + 4 = 36
σ2= 36/9 = 4.0
La deviazione standard σ è solo la radice quadrata di 4.0 o 2.0.