Contenuto
- TL; DR (Too Long; Didnt Read)
- Ordina punti dati
- Determina la prima posizione del quartile
- Determina la posizione del terzo quartile
- Calcola intervallo interquartile
- Vantaggi e svantaggi di IQR
L'intervallo interquartile, spesso abbreviato come IQR, rappresenta l'intervallo dal 25 ° percentile al 75 ° percentile, o il 50% medio, di ogni dato set di dati. L'intervallo interquartile può essere utilizzato per determinare quale sarebbe l'intervallo medio di prestazioni in un test: è possibile utilizzarlo per vedere dove cadono i punteggi della maggior parte delle persone in un determinato test o determinare quanti soldi guadagna il dipendente medio in un'azienda ogni mese . L'intervallo interquartile può essere uno strumento di analisi dei dati più efficace rispetto alla media o alla mediana di un set di dati, poiché consente di identificare l'intervallo di dispersione anziché un solo numero.
TL; DR (Too Long; Didnt Read)
L'intervallo interquartile (IQR) rappresenta il 50 percento medio di un set di dati. Per calcolarlo, prima ordina i tuoi punti dati dal meno al più grande, quindi determina le posizioni del tuo primo e terzo quartile usando le formule (N + 1) / 4 e 3 * (N + 1) / 4, rispettivamente, dove N è il numero di punti nel set di dati. Infine, sottrarre il primo quartile dal terzo quartile per determinare l'intervallo interquartile per il set di dati.
Ordina punti dati
Il calcolo dell'intervallo interquartile è un compito semplice, ma prima di eseguire il calcolo è necessario disporre i vari punti del set di dati. Per fare ciò, inizia ordinando i punti dati dal minimo al massimo. Ad esempio, se i tuoi punti dati fossero 10, 19, 8, 4, 9, 12, 15, 11 e 20, li riorganizzeresti in questo modo: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Una volta che i punti dati sono stati ordinati in questo modo, è possibile passare al passaggio successivo.
Determina la prima posizione del quartile
Quindi, determinare la posizione del primo quartile utilizzando la seguente formula: (N + 1) / 4, dove N è il numero di punti nel set di dati. Se il primo quartile è compreso tra due numeri, prendi la media dei due numeri come punteggio del primo quartile. Nell'esempio sopra, dato che ci sono nove punti dati, aggiungere 1 a 9 per ottenere 10, quindi dividere per 4 per ottenere 2,5. Dato che il primo quartile è compreso tra il secondo e il terzo valore, dovresti prendere la media di 8 e 9 per ottenere una posizione del primo quartile di 8,5.
Determina la posizione del terzo quartile
Dopo aver determinato il primo quartile, determinare la posizione del terzo quartile utilizzando la seguente formula: 3 * (N + 1) / 4 dove N è di nuovo il numero di punti nel set di dati. Allo stesso modo, se il terzo quartile cade tra due numeri, prendi semplicemente la media come faresti quando calcoli il punteggio del primo quartile. Nell'esempio sopra, dato che ci sono nove punti dati, dovresti aggiungere da 1 a 9 per ottenere 10, moltiplicare per 3 per ottenere 30 e quindi dividere per 4 per ottenere 7.5. Dato che il primo quartile è compreso tra il settimo e l'ottavo valore, dovresti prendere la media di 15 e 19 per ottenere un punteggio di terzo quartile di 17.
Calcola intervallo interquartile
Dopo aver determinato il primo e il terzo quartile, calcolare l'intervallo interquartile sottraendo il valore del primo quartile dal valore del terzo quartile. Per terminare l'esempio usato nel corso di questo articolo, sottrarre 8,5 da 17 per scoprire che l'intervallo interquartile del set di dati è uguale a 8.5.
Vantaggi e svantaggi di IQR
L'intervallo interquartile ha il vantaggio di essere in grado di identificare ed eliminare gli outlier su entrambe le estremità di un set di dati. L'IQR è anche una buona misura della variazione nei casi di distribuzione dei dati distorta e questo metodo di calcolo dell'IQR può funzionare per set di dati raggruppati, purché si utilizzi una distribuzione di frequenza cumulativa per organizzare i punti di dati. La formula dell'intervallo interquartile per i dati raggruppati è la stessa dei dati non raggruppati, con IQR uguale al valore del primo quartile sottratto dal valore del terzo quartile. Tuttavia, presenta diversi svantaggi rispetto alla deviazione standard: minore sensibilità a pochi punteggi estremi e stabilità di campionamento non forte come la deviazione standard.