Contenuto
- Visualizzazione rapida dei dati
- Visualizzazione dell'abbondanza relativa
- Potrebbe essere necessario classificare gli intervalli di dati complessi in intervalli
- Le tabelle delle frequenze possono oscurare l'inclinazione e la curtosi
Le tabelle di frequenza possono essere utili per descrivere il numero di occorrenze di un particolare tipo di dato all'interno di un set di dati. Le tabelle di frequenza, chiamate anche distribuzioni di frequenza, sono uno degli strumenti di base per la visualizzazione di statistiche descrittive. Le tabelle di frequenza sono ampiamente utilizzate come riferimento a colpo d'occhio nella distribuzione dei dati; sono facili da interpretare e possono visualizzare set di dati di grandi dimensioni in modo abbastanza conciso. Le tabelle di frequenza possono aiutare a identificare tendenze evidenti all'interno di un set di dati e possono essere utilizzate per confrontare i dati tra set di dati dello stesso tipo. Le tabelle di frequenza non sono appropriate per ogni applicazione, tuttavia. Possono oscurare valori estremi (più di X o meno di Y) e non si prestano all'analisi dell'inclinazione e della curtosi dei dati.
Visualizzazione rapida dei dati
Le tabelle di frequenza possono rivelare rapidamente valori anomali e persino tendenze significative all'interno di un set di dati con non molto più di un'ispezione superficiale. Ad esempio, un insegnante potrebbe visualizzare i voti degli studenti per un periodo intermedio su una tabella di frequenza al fine di dare una rapida occhiata al rendimento complessivo della sua classe. Il numero nella colonna della frequenza rappresenterebbe il numero di studenti che ricevono quel voto; per una classe di 25 studenti, la distribuzione in frequenza dei voti delle lettere ricevuti potrebbe essere simile a questa: Frequenza dei voti A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Visualizzazione dell'abbondanza relativa
Le tabelle di frequenza possono aiutare i ricercatori a esaminare l'abbondanza relativa di ciascun dato target specifico all'interno del proprio campione. L'abbondanza relativa rappresenta la quantità del set di dati che comprende i dati di destinazione. L'abbondanza relativa è spesso rappresentata come istogramma di frequenza, ma può essere facilmente visualizzata in una tabella di frequenza. Considera la stessa distribuzione di frequenza dei voti intermedi. L'abbondanza relativa è semplicemente la percentuale di studenti che ha ottenuto un determinato voto e può essere utile per concettualizzare i dati senza pensarci troppo. Ad esempio, con la colonna aggiunta che mostra la percentuale di occorrenza di ogni voto, puoi facilmente vedere che oltre la metà della classe ha ottenuto un punteggio B, senza dover esaminare i dati in modo molto dettagliato.
Abbondanza relativa della frequenza di grado (frequenza%) A .............. 7 .............. 28% B ......... .... 13 ............ 52% C .............. 3 ............. 12% D .............. .............. 2 8%
Potrebbe essere necessario classificare gli intervalli di dati complessi in intervalli
Uno svantaggio è che è difficile comprendere insiemi di dati complessi che vengono visualizzati su una tabella di frequenza. Set di dati di grandi dimensioni possono essere suddivisi in classi di intervalli per una facile visualizzazione mediante una tabella di frequenza. Ad esempio, se chiedi alle prossime 100 persone di vedere quale fosse la loro età, probabilmente otterrai una vasta gamma di risposte che vanno da tre a novantatre. Invece di includere righe per ogni età nella tabella delle frequenze, è possibile classificare i dati in intervalli, come 0-10 anni, 11-20 anni, 21-30 anni e così via. Questo può anche essere indicato come una distribuzione di frequenza raggruppata.
Le tabelle delle frequenze possono oscurare l'inclinazione e la curtosi
A meno che non vengano visualizzati su un istogramma, l'asimmetria e la curtosi dei dati potrebbero non essere facilmente evidenti in una tabella delle frequenze. L'asimmetria ti dice in quale direzione tendono i tuoi dati. Se i voti fossero visualizzati attraverso l'asse X di un grafico che mostra la frequenza dei voti intermedi per i nostri 25 studenti sopra, la distribuzione si inclinerebbe verso gli As e i Bs. Kurtosis ti parla del picco centrale dei tuoi dati - se cadrebbe in linea con una distribuzione normale, che è una bella curva a campana liscia, o essere alto e nitido. Se si rappresentano graficamente i gradi intermedi nel nostro esempio, si troverà un picco alto in B con un forte calo nella distribuzione dei gradi inferiori.