La correlazione tra due variabili descrive la probabilità che un cambiamento in una variabile provochi un cambiamento proporzionale nell'altra variabile. Un'alta correlazione tra due variabili suggerisce che condividono una causa comune o che un cambiamento in una delle variabili sia direttamente responsabile di un cambiamento nell'altra variabile. Il valore di Pearsons r viene utilizzato per quantificare la correlazione tra due variabili discrete.
Etichetta la variabile che ritieni stia causando la modifica all'altra variabile come x (la variabile indipendente) e l'altra variabile y (la variabile dipendente).
Costruisci una tabella con cinque colonne e tante righe quanti sono i punti dati per xey. Etichetta le colonne da A a E da sinistra a destra.
Compila ogni riga con i seguenti valori per ciascun punto dati (x, y) nella prima colonna: il valore di x nella colonna A, il valore di x al quadrato nella colonna B, il valore di y nella colonna C, il valore di y al quadrato nella colonna D e il valore x volte y nella colonna E.
Crea un'ultima riga nella parte inferiore della tabella e inserisci la somma di tutti i valori di ciascuna colonna nella cella corrispondente.
Calcola il prodotto delle celle finali nella colonna A e C.
Moltiplica la cella finale nella colonna E per il numero di punti dati.
Sottrarre il valore ottenuto nel passaggio 5 dal valore ottenuto nel passaggio 6 e sottolineare la risposta.
Moltiplica la cella finale della colonna B per il numero di punti dati. Sottrai da questo valore il quadrato del valore della cella finale della colonna A.
Moltiplica la cella finale della colonna D per il numero di punti dati e sottrai il quadrato del valore della cella finale della colonna C.
Moltiplica i valori trovati nei passaggi 8 e 9 e quindi prendi la radice quadrata del risultato.
Dividi il valore ottenuto nel passaggio 7 (dovrebbe essere sottolineato) per il valore ottenuto nel passaggio 10. Questo è Pearsons r, noto anche come coefficiente di correlazione. Se r è vicino a 1, esiste una forte correlazione positiva. Se r è vicino a -1, esiste una forte correlazione negativa. Se r è vicino a 0, c'è una correlazione debole.