Come trovare il coefficiente di correlazione per 'R' in un diagramma a dispersione

Posted on
Autore: Laura McKinney
Data Della Creazione: 9 Aprile 2021
Data Di Aggiornamento: 17 Novembre 2024
Anonim
Come trovare il coefficiente di correlazione per 'R' in un diagramma a dispersione - Scienza
Come trovare il coefficiente di correlazione per 'R' in un diagramma a dispersione - Scienza

Contenuto

Trovare la forza dell'associazione tra due variabili è un'abilità importante per gli scienziati di tutti i tipi. Se due variabili sono correlate tra loro, mostra che esiste un collegamento tra loro. Una correlazione positiva significa che quando una variabile aumenta, anche l'altra fa, e una correlazione negativa significa che quando una variabile aumenta, l'altra diminuisce. Le correlazioni non dimostrano la causalità, sebbene sia possibile che ulteriori test dimostrino una relazione causale tra le variabili. Il coefficiente di correlazione R mostra la forza della relazione tra le due variabili e se si tratta di una correlazione positiva o negativa.

TL; DR (Too Long; Didnt Read)

Chiama una variabile X e una variabile y. Calcola il valore di R usando la formula:

R = ÷ √ {}

Dove n è la dimensione del campione.

    Crea una tabella dei tuoi dati. Ciò dovrebbe includere una colonna per il numero del partecipante, una colonna per la prima variabile (etichettata X) e una colonna per la seconda variabile (etichettata y). Ad esempio, se stai cercando di vedere se esiste una correlazione tra altezza e dimensioni della scarpa, una colonna identificherebbe ogni persona che misuri, una colonna mostrerebbe l'altezza di ciascuna persona e un'altra mostrerebbe la loro dimensione della scarpa. Crea tre colonne aggiuntive, una per xy, uno per X2 e uno per y2.

    Usa i tuoi dati per compilare le tre colonne aggiuntive. Ad esempio, immagina che la tua prima persona sia alta 75 pollici e abbia una dimensione di 12 piedi. Il X (altezza) mostrerebbe 75 e il y (numero di scarpe) la colonna mostrerebbe 12. Devi trovare xy, X2 e y2. Quindi usando questo esempio:

    xy = 75 × 12 = 900

    X2 = 752 = 5,625

    y2 = 122 = 144

    Completa questi calcoli per ogni persona per cui hai i dati.

    Crea una nuova riga nella parte inferiore della tabella per le somme di ogni colonna. Aggiungi tutti insieme X valori, tutti i y valori, tutti i xy valori, tutti i X2 valori e tutto il y2 valori, quindi inserisci i risultati nella parte inferiore della colonna corrispondente nella nuova riga. È possibile etichettare la nuova riga "somma" o utilizzare un simbolo sigma (Σ).

    Trovate R dai tuoi dati utilizzando la formula:

    R = ÷ √ {}

    Sembra un po 'scoraggiante, quindi puoi dividerlo in due parti, che chiameremo S e t.

    s = n (Σxy) - (Σx) (Σy)

    t = √ {}

    In queste equazioni, n è il numero di partecipanti che hai (la dimensione del tuo campione). Il resto delle parti dell'equazione sono le somme calcolate nell'ultimo passaggio. Quindi per S, moltiplica la dimensione del tuo campione per la somma di xy colonna e quindi sottrarre la somma di X colonna moltiplicata per la somma di y colonna da questo.

    Per t, ci sono quattro passaggi principali. Innanzitutto, calcola n moltiplicato per la somma del tuo X2 colonna e quindi sottrarre la somma della tua X colonna quadrata (moltiplicata per se stessa) da questo valore. In secondo luogo, fai esattamente la stessa cosa ma con la somma di y2 colonna e la somma del y colonna quadrata al posto del X parti (cioè n × Σy2 -). In terzo luogo, moltiplicare questi due risultati (per il Xs e ys) insieme. In quarto luogo, prendi la radice quadrata di questa risposta.

    Se hai lavorato in parti, puoi calcolare R semplicemente R = s ÷ t. Riceverai una risposta tra -1 e 1. Una risposta positiva mostra una correlazione positiva, con qualcosa in più di 0,7 generalmente considerato una relazione forte. Una risposta negativa mostra una correlazione negativa, con qualsiasi cosa superiore a -0,7 considerata una relazione fortemente negativa. Allo stesso modo ± 0,5 è considerata una relazione moderata e ± 0,3 è considerata una relazione debole. Qualcosa vicino a 0 mostra una mancanza di correlazione.