Contenuto
- TL; DR (Too Long; Didnt Read)
- La differenza tra livello di confidenza e intervallo di confidenza
- Calcolo degli intervalli o dei livelli di confidenza per campioni di grandi dimensioni
- Calcolo degli intervalli di confidenza per piccoli campioni
Le statistiche si basano sul trarre conclusioni di fronte all'incertezza. Ogni volta che prendi un campione, non puoi essere completamente certo che il tuo campione rifletta veramente la popolazione da cui è tratto. Gli statistici affrontano questa incertezza prendendo in considerazione i fattori che potrebbero influenzare la stima, quantificandone l'incertezza ed eseguendo test statistici per trarre conclusioni da questi dati incerti.
Gli statistici utilizzano gli intervalli di confidenza per specificare un intervallo di valori che probabilmente contengono la media della popolazione "vera" sulla base di un campione ed esprimono il loro livello di certezza in questo attraverso livelli di confidenza. Sebbene il calcolo dei livelli di confidenza non sia spesso utile, calcolare gli intervalli di confidenza per un determinato livello di confidenza è un'abilità molto utile.
TL; DR (Too Long; Didnt Read)
Calcola un intervallo di confidenza per un dato livello di confidenza moltiplicando l'errore standard per il Z punteggio per il livello di confidenza prescelto. Sottrarre questo risultato dalla media del campione per ottenere il limite inferiore e aggiungerlo alla media del campione per trovare il limite superiore. (Vedi risorse)
Ripeti lo stesso processo ma con t punteggio al posto del Z punteggio per campioni più piccoli (n < 30).
Trova un livello di confidenza per un set di dati prendendo metà della dimensione dell'intervallo di confidenza, moltiplicandolo per la radice quadrata della dimensione del campione e quindi dividendolo per la deviazione standard del campione. Cerca il risultato Z o t segnare in una tabella per trovare il livello.
La differenza tra livello di confidenza e intervallo di confidenza
Quando vedi una statistica citata, a volte c'è un intervallo dato dopo di esso, con l'abbreviazione "CI" (per "intervallo di confidenza") o semplicemente un simbolo più-meno seguito da una cifra. Ad esempio, "il peso medio di un maschio adulto è di 180 libbre (CI: da 178,14 a 181,86)" o "il peso medio di un maschio adulto è di 180 ± 1,86 libbre". Entrambi forniscono le stesse informazioni: in base al campione usato, il peso medio di un uomo probabilmente rientra in un certo intervallo. L'intervallo stesso è chiamato intervallo di confidenza.
Se vuoi essere il più sicuro possibile che l'intervallo contenga il valore vero, puoi ampliare l'intervallo. Ciò aumenterebbe il vostro "livello di confidenza" nella stima, ma l'intervallo coprirebbe più potenziali pesi. La maggior parte delle statistiche (compresa quella sopra citata) sono fornite come intervalli di confidenza al 95 percento, il che significa che esiste una probabilità del 95 percento che il valore medio reale sia compreso nell'intervallo. Puoi anche utilizzare un livello di confidenza del 99 percento o un livello di confidenza del 90 percento, a seconda delle tue esigenze.
Calcolo degli intervalli o dei livelli di confidenza per campioni di grandi dimensioni
Quando si utilizza un livello di confidenza nelle statistiche, di solito è necessario per calcolare un intervallo di confidenza. Questo è un po 'più facile da fare se si dispone di un campione di grandi dimensioni, ad esempio oltre 30 persone, perché è possibile utilizzarlo Z punteggio per il tuo preventivo piuttosto che più complicato t punteggi.
Prendi i tuoi dati grezzi e calcola la media del campione (aggiungi semplicemente i singoli risultati e dividi per il numero di risultati). Calcola la deviazione standard sottraendo la media da ogni singolo risultato per trovare la differenza e quindi quadrare questa differenza. Sommare tutte queste differenze e quindi dividere il risultato per la dimensione del campione meno 1. Prendere la radice quadrata di questo risultato per trovare la deviazione standard del campione (Vedi risorse).
Determina l'intervallo di confidenza trovando prima l'errore standard:
SE = S / √n
Dove S è la deviazione standard del campione e n è la dimensione del campione. Ad esempio, se hai prelevato un campione di 1.000 uomini per calcolare il peso medio di un uomo e hai ottenuto una deviazione standard del campione di 30, ciò darebbe:
SE = 30 / √1000 = 30 / 31.62 = 0.95
Per trovare l'intervallo di confidenza da questo, cercare il livello di confidenza che si desidera calcolare l'intervallo in a Z-score table e moltiplica questo valore per Z Punto. Per un livello di confidenza del 95 percento, il Z-score è 1,96. Utilizzando l'esempio, questo significa:
Media ± Z × SE= 180 libbre ± 1,96 × 0,95 = 180 ± 1,86 libbre
Qui, ± 1,86 libbre è l'intervallo di confidenza del 95 percento.
Se invece disponi di questo bit di informazioni, insieme alla dimensione del campione e alla deviazione standard, puoi calcolare il livello di confidenza usando la seguente formula:
Z = 0,5 × dimensione dell'intervallo di confidenza × √n / S
La dimensione dell'intervallo di confidenza è solo il doppio del valore ±, quindi nell'esempio sopra, sappiamo 0,5 volte che è 1,86. Questo da:
Z = 1.86 × √1000 / 30 = 1.96
Questo ci dà un valore per Z, che puoi consultare in a Ztabella dei punteggi per trovare il livello di confidenza corrispondente.
Calcolo degli intervalli di confidenza per piccoli campioni
Per piccoli campioni, esiste un processo simile per il calcolo dell'intervallo di confidenza. Innanzitutto, sottrai 1 dalla dimensione del campione per trovare i tuoi "gradi di libertà". Nei simboli:
df = n −1
Per un campione n = 10, questo dà df = 9.
Trova il valore alfa sottraendo la versione decimale del livello di confidenza (ovvero il tuo livello di confidenza percentuale diviso per 100) da 1 e dividendo il risultato per 2 o in simboli:
α = (1 - livello di confidenza decimale) / 2
Quindi, per un livello di confidenza del 95 percento (0,95):
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
Cerca il valore alfa e i gradi di libertà in una (una coda) t tabella di distribuzione e prendere nota del risultato. In alternativa, ometti la divisione per 2 sopra e usa una doppia coda t valore. In questo esempio, il risultato è 2.262.
Come nel passaggio precedente, calcolare l'intervallo di confidenza moltiplicando questo numero per l'errore standard, che viene determinato utilizzando la deviazione standard del campione e la dimensione del campione allo stesso modo. L'unica differenza è quella al posto del Z punteggio, si utilizza il t Punto.