Contenuto
- Campionamento Casuale
- Precisione
- Intervalli di confidenza
- Errore standard
- Difficoltà nell'uso di campioni di dimensioni maggiori
La dimensione del campione rappresenta il numero di osservazioni prese per condurre un'analisi statistica. Le dimensioni dei campioni possono essere composte da persone, animali, lotti di cibo, macchine, batterie o qualunque popolazione venga valutata.
Campionamento Casuale
Il campionamento casuale è un metodo mediante il quale i campioni casuali vengono raccolti da una popolazione al fine di stimare le informazioni sulla popolazione senza essere distorti. Ad esempio, se vuoi sapere che tipo di persone vivono in una determinata città, devi intervistare / misurare persone diverse a caso. Tuttavia, se avessi usato tutti quelli della biblioteca, non avresti una stima equa / imparziale di come siano la popolazione generale che occupa la città, solo le persone che vanno in biblioteca.
Precisione
Man mano che le dimensioni del campione aumentano, le stime diventano più accurate. Ad esempio, se abbiamo selezionato casualmente 10 uomini adulti maschi, potremmo trovare la loro altezza media di 6 piedi-3 pollici di altezza, forse perché c'è un giocatore di basket che gonfia la nostra stima. Se, tuttavia, misurassimo due milioni di umani maschi adulti, avremmo un predittore migliore dell'altezza media dei maschi perché gli estremi si bilancerebbero e la media reale oscurerebbe qualsiasi deviazione dalla media.
Intervalli di confidenza
Quando uno statistico fa una previsione su un risultato, spesso costruisce un intervallo attorno alla sua stima. Ad esempio, se misurassimo il peso di 100 donne, potremmo dire che siamo sicuri al 90% che il peso medio reale delle donne è compreso tra 103 e 129 libbre. (Questo, ovviamente, dipende anche da altri fattori come la variabilità delle misurazioni.) Man mano che la dimensione del campione aumenta, diventiamo più sicuri della nostra stima e i nostri intervalli diminuiscono. Ad esempio, con un milione di donne, potremmo dire che siamo sicuri al 98% che il peso medio reale delle donne è compreso tra 115 e 117 libbre. In altre parole, all'aumentare della dimensione del campione, aumenta la fiducia nelle nostre misurazioni e diminuisce la dimensione dei nostri intervalli di confidenza.
Errore standard
La variazione è una misura della diffusione dei dati attorno alla media. La deviazione standard è la radice quadrata della variazione e aiuta ad approssimare quale percentuale della popolazione rientra in un intervallo di valori rispetto alla media. All'aumentare della dimensione del campione, l'errore standard, che dipende dalla deviazione standard e dalla dimensione del campione, diminuisce. Di conseguenza, le stime aumentano in precisione e la ricerca basata su queste stime è considerata più affidabile (con meno rischi di errore).
Difficoltà nell'uso di campioni di dimensioni maggiori
Ovviamente, campioni di dimensioni maggiori producono stime migliori e più accurate sulle popolazioni, ma ci sono molti problemi con i ricercatori che usano campioni di dimensioni maggiori. Prima di tutto, potrebbe essere difficile trovare un campione casuale di persone disposte a provare un nuovo farmaco. Quando lo fai, diventa più costoso fornire il farmaco a più persone e monitorare più persone nel tempo. Inoltre, ci vuole uno sforzo maggiore per ottenere e mantenere una dimensione del campione maggiore. Anche se campioni di dimensioni maggiori producono statistiche più accurate, i costi e gli sforzi aggiuntivi non sono sempre necessari, poiché anche campioni di dimensioni inferiori possono produrre risultati significativi.