zpět na výpis    domů » statistika » Kovariance a korelace

Kovariance a korelace

Publikováno: 19.5.2017

Kovariance a korelace

Kovariance a korelace vyjadřují míru vzájemné závislosti náhodných veličin. Používají se například v regresní analýze při zjišťování vzájemné závislosti proměnných, kvality regresního modelu a výpočtu koeficientu beta cenných papírů. Uplatnění mají také v moderní teorii portfolia cenných papírů.

Náhodné veličiny se označují velkými písmeny X, Y a Z, zatímco jejich konkrétní realizace se označují malými písmeny x, y a z.

Kovariance

Kovariance C(X,Y) je statistická charakteristika, která určuje vzájemnou závislost náhodných veličin X a Y. Kovariance může nabývat hodnot na intervalu ⟨-∞, ∞⟩.

Kovariance je definována jako střední hodnota součinu odchylek veličin X a Y od jejich středních hodnot.

Kovariance náhodných veličin

C(X,Y) = E{[X - E(X)][Y - E(Y)]}

X, Y ... náhodné veličiny
E(X), E(Y) ... střední hodnoty veličin

Význam hodnot kovariancí je následující:

  • C(X,Y) > 0 - veličiny X a Y se pohybují stejným směrem (současně rostou nebo klesají)
  • C(X,Y) = 0 - veličiny X a Y jsou navzájem nezávislé
  • C(X,Y) < 0 - mezi veličinami X a Y je inverzní vztah (jedna roste a druhá klesá a naopak)

Při praktickém výpočtu kovariance mezi statistickými znaky jsou rozlišovány 2 varianty - populační a výběrová kovariance. Výběrová kovariance se používá pro odhad populační kovariance a používá se pro malý rozsah dat (n < 30).

Kovariance statistických znaků

σxy = [∑(xi - xp)·(yi - yp)]/n

sxy = [∑(xi - xp)·(yi - yp)]/(n - 1)

σxy ... populační koeficient kovariance
sxy ... výběrový koeficient kovariance (n < 30)
xp, yp ... prosté aritmetické průměry veličin X a Y
n ... počet pozorování

Při zjišťování závislosti mezi více než 2 náhodnými proměnnými jsou jednotlivé párové kovariance uspořádány do kovarianční matice (C). Kovarianční matice je symetrická matice s diagonálními prvky rovny rozptylu jednotlivých veličin. Prvky mimo diagonálu představují párové koeficienty kovariance.

Kovarianční matice

V následujícím odstavci je důkaz rovnosti kovariance a rozptylu pro náhodnou veličinu X1.

σ11 = [∑(xi - x1p)·(xi - x1p)]/n
σ11 = ∑(xi - x1p)2/n
σ11 = σ2

σ2 ... rozptyl náhodné veličiny X1

Kovariance v MS Excel

Pro výpočet kovariance je v MS Excel 2003 statistická funkce COVAR(), kde argumenty funkce jsou vybrané oblasti dat náhodných veličin. Verze 2003 nezná výběrovou kovarianci, proto je třeba upravit funkci COVAR() na výběrovou dle vztahu COVAR(X;Y)×n/(n-1).

Od verze 2007 jsou již k dispozici obě varianty funkcí:

  • COVARIANCE.P() - kovariance základního souboru
  • COVARIANCE.S() - kovariance výběru dat

MS Excel umí sestavit i kovarianční matici, kterou najdete v doplňku Analýza dat -> Kovariance.

Korelační koeficient

Korelace ρ(X,Y) měří lineární závislost mezi veličinami X a Y. Korelační koeficient standardizuje kovarianci a výsledkem jsou hodnoty na intervalu ⟨-1; 1⟩.

Vzorec pro výpočet korelace je vyjádřen jako poměr kovariance k součinu směrodatných odchylek náhodných veličin X a Y.

Korelace náhodných veličin

ρ(X,Y) = C(X,Y)/√D2(X)D2(Y) = C(X,Y)/D(X)D(Y)

D2(X), D2(Y) ... rozptyly náhodných veličin X a Y
D(X), D(Y) ... směrodatné odchylky náhodných veličin X a Y

Význam hodnot koeficientů korelace je následující:

  • ρ(X,Y) = 1 - mezi veličinami X a Y existuje dokonalá přímá závislost
  • ρ(X,Y) = 0 - veličiny X a Y nejsou korelované
  • ρ(X,Y) = -1 - mezi veličinami X a Y je dokonalý inverzní vztah

Stejně jako u kovariance se rozlišuje populační a výběrový koeficient korelace. Výběrová korelace se používá pro odhad populační korelace a používá se pro malý rozsah dat (n < 30).

Korelace statistických znaků

ρx,y = [∑(xi - xp)·(yi - yp)/n]/(σx·σy)
ρx,y = σxy/(σx·σy)

rx,y = [∑(xi - xp)·(yi - yp)/(n - 1)]/(sx·sy)]
rx,y = sxy/(sx·sy)

ρx,y ... populační koeficient korelace
rx,y ... výběrový koeficient korelace
σxy, sxy ... kovariance veličin X a Y
σx, σy ... směrodatné odchylky veličin X a Y
sx, sy ... výběrové směrodatné odchylky veličin X a Y (n < 30)
xp, yp ... prosté aritmetické průměry veličin X a Y

Základní koeficient korelace, který měří lineární závislost mezi 2 proměnnými, se nazývá párový korelační koeficient.

V případě zkoumání lineární závislosti mezi více než 2 proměnnými jsou párové korelační koeficienty uspořádány do korelační matice (ρ). Korelační matice je symetrická matice s diagonálními prvky rovny 1. Prvky mimo diagonálu představují párové koeficienty korelace.

Korelační matice

Jestliže jsou korelační koeficienty mimo diagonálu nulové je korelační matice rovna matici jednotkové (I).

V následujícím odstavci je důkaz rovnosti korelace pro X1 a jedničky.

ρ11 = ([∑(xi - x1p)·(xi - x1p)]/n)/(σx·σx)
ρ11 = [∑(xi - x1p)2/n]/(σx·σx)
ρ11 = σx12x12
ρ11 = 1

Korelace v MS Excel

Pro výpočet koeficientu korelace v MS Excel se používá statistická funkce CORREL(), kde argumenty funkce jsou vybrané oblasti dat proměnných.

MS Excel umí sestavit korelační matici. Korelační matici najdete stejně jako kovarianční matici v doplňku Analýza dat -> Korelace.

Chcete vědět o každém novém článku? Dejte Like Financím v praxi na sociálních sítích a zůstaňte ve spojení.

Google+

Sdílejte článek na sociálních sítích

Seznam použité literatury
  • CYHELSKÝ, L., KAHOUNOVÁ, J., HINDLS, R.: Elementární statistická analýza. Management Press 2001, Praha. Druhé doplněné vydání, 319 stran. ISBN 80-7261-003-1
  • ČÁMSKÝ, F.: Teorie portfolia. Masarykova univerzita 2007, Brno. Druhé přepracované a rozšířené vydání, 123 stran. ISBN 978-80-210-4252-0
  • HINDLS, R., HRONOVÁ, S., SEGER, J., FISCHER, J.: Statistika pro ekonomy. Profesional publishing 2007, Praha. Osmé vydání, 415 stran. ISBN 978-80-86946-43-6
  • MINAŘÍK, B.: Statistika II. Mendelova zemědělská a lesnická univerzita v Brně 2007, Brno. První vydání, 136 stran. ISBN 978-80-7375-033-6
  • Wikipedie. Kovariance [on-line] [cit. 2017-05-19]. Dostupné z WWW: https://cs.wikipedia.org/wiki/Kovariance
  • Wikipedie. Korelace [on-line] [cit. 2017-05-19]. Dostupné z WWW: https://cs.wikipedia.org/wiki/Korelace
Nahoru