Un diagramma a dispersione è un importante strumento diagnostico nell'arsenale di uno statistico, ottenuto graficando due variabili l'una contro l'altra. Permette allo statistico di osservare le variabili e formare un'ipotesi di lavoro sulla loro relazione. Per questo motivo, di solito viene disegnato prima di eseguire un'analisi di regressione. Lo statistico successivamente verifica l'ipotesi usando un'analisi di regressione e determina il segno e l'entità precisa della relazione. Inoltre, un diagramma a dispersione aiuta a identificare i valori anomali, valori che sono anormalmente distanti dalla maggior parte dei dati nel campione. L'eliminazione dei valori anomali aiuta a migliorare il modello di regressione.
Controlla la relazione negativa tra le due variabili nel grafico a dispersione. Se i valori bassi della prima variabile corrispondono ai valori alti della seconda variabile, esiste una correlazione negativa. In questo caso, una linea tracciata attraverso i punti dati ha una pendenza negativa.
Esaminare il diagramma a dispersione per una relazione positiva tra le variabili. Se i valori bassi della prima variabile nel grafico a dispersione corrispondono a valori bassi della seconda e i valori alti della prima corrispondono in modo simile ai valori alti della seconda, le variabili hanno una correlazione positiva. In questo caso, una linea tracciata attraverso i punti dati ha una pendenza positiva.
Ispeziona il grafico a dispersione per nessuna relazione tra le variabili. Se i punti di dati nel diagramma a dispersione vengono distribuiti in modo casuale senza alcuna relazione apparente tra i due, non hanno alcuna correlazione o una piccola correlazione statisticamente insignificante. In questo caso, una linea tracciata attraverso i punti dati è orizzontale con pendenza uguale a zero.
Adatta una linea attraverso i punti dati ed esaminane la forma per valutare la natura della relazione tra le due variabili. Una linea retta viene interpretata come una relazione lineare, una forma curva suggerisce una relazione quadratica e una linea che si trova relativamente piatta prima di sparare improvvisamente su o giù viene interpretata come una relazione esponenziale.
Esaminare il grafico a dispersione per valori anomali, valori che si trovano in modo anomalo lontano dal cluster di punti dati. I valori anomali distorcono la relazione tra le variabili. Eliminali, ma solo se la loro assenza non influisce sull'analisi della relazione tra le due variabili.