Leksikon

Naslovnica Leksikon

korelacija

Korelacija (engl. correlation, njem. Korrelation), statistička povezanost dviju ili više varijabli.

Skup metoda kojima se mjeri stupanj jakosti statističkih veza zove se korelacijska analiza, a normirani pokazatelji korelacije koeficijenti korelacije. Ako se između dviju varijabli pretpostavlja postojanje linearne statističke veze, tada se jakost i smjer veze mjeri koeficijentom linearne korelacije r (–1<=r<=1). Promatrane varijable su pozitivno korelirane ako je porast jedne praćen porastom druge i obratno, a negativno korelirane ako se varijable ne mijenjaju u istom smjeru. Korelacija (pozitivna, negativna) je to jača što je r bliži +- 1.

Među promatranim varijablama postoji negativna, odnosno pozitivna funkcionalna (egzaktna, deterministička) veza ako je r=-1 ili r=1, a ako je r=0 promatrane su varijable međusobno nekorelirane. Pretpostavi li se da je veza između zavisne varijable i odabranog skupa od p, (p>=2) nezavisnih varijabli linearna (tj. da se njihov odnos može opisati modelom višestruke linearne regresije), računaju se sljedeći pokazatelji korelacije:

1. koeficijent višestruke linearne korelacije R, (0<=R<=1) koji mjeri jakost veze između zavisne varijable i odabranog skupa nezavisnih varijabli, a izražava čvršću vezu što je bliži 1. O smjeru veze ne može se govoriti jer povezanost zavisne varijable s pojedinim nezavisnim varijablama ne mora biti istog smjera;

2. koeficijent parcijalne korelacije koji je pokazatelj smjera i jakosti linearne veze između zavisne i odabrane nezavisne varijable u modelu višestruke linearne regresije u kome je utjecaj ostalih nezavisnih varijabli isključen tako da ih se drži konstantnim;

3. korelacijska matrica (simetrična, kvadratna matrica) koja kao elemente sadrži koeficijente linearne korelacije između parova varijabli uključenih u model. Sadrži li model pored zavisne i p nezavisnih varijabli, ta je matrica dimenzije p+1. Jakost krivolinijske veze između dviju varijabli izražava se koeficijentom krivolinijske korelacije n, (0<=n<=1).

Korelacija između dviju redosljednih (ili numeričkih) varijabli mjeri se Spearmanovim koeficijentom korelacije ranga koji se tumači na isti način kao koeficijent linearne korelacije, a jakost višestruke korelacijske veze između redosljednih varijabli izražava se pomoću Kendallova koeficijenta korelacije ranga, koji poprima vrijednosti između 0 i 1, a izražava jaču vezu što je bliži jedinici.