zpět na výpis    domů » statistika » Úvod do regresní analýzy

Úvod do regresní analýzy

Publikováno: 1.6.2017

Úvod do regresní analýzy

Regresní analýza je statistický nástroj, který slouží k modelování vztahů mezi proměnnými a tvorbě predikcí. Regresní modely nabývají různých tvarů matematických funkcí, které se označují jako regresní funkce. Regresní funkce obsahuje 2 skupiny proměnných - závisle proměnnou y a množinu nezávisle proměnných x1, x2, ...., xk, které vysvětlují variabilitu y.

Lineární regresní model

Lineární regresní model vyjádřuje stochastickou závislost závisle proměnné y na regresní funkci základního souboru η a náhodné složce ε

Regresní funkce základního souboru

y ... závisle proměnná, η ... regresní funkce základního souboru, ε ... náhodná složka, βk ... neznámé regresní parametry, xk ... nezávisle proměnné

Regresní funkce základního souboru (populace) je teoretický koncept, který obsahuje neznámé parametry β0, β1, ..., βk. Parametry βk jsou výsledkem vztahů v celé populaci, kterou v naprosté většině případů nemáme k dispozici.

V praxi pracujeme s výběrem dat z určitého základního souboru, proto se musíme spokojit s výběrovými odhady b0, b1, ..., bk neznámých parametrů

Výběrová regresní funkce

y ... závisle proměnná, Y ... výběrová regresní funkce, e ... odhad náhodné složky, bk ... odhad parametrů modelu, xk ... nezávisle proměnné

Výběrové odhady parametrů se statisticky verifikují. Potvrdí-lí se u nich optimální vlastnosti, pak je můžeme vztáhnout na celou populaci.

Stejně tak se musíme v praxi spokojit s odhadem náhodné složky ε. Odhad náhodné složky se označuje jako reziduum e, které je rozdílem mezi skutečnou hodnotou závisle proměnné y a její vyrovnanou hodnotou Y.

Tvary regresních funkcí

Regresní modely nabývají různého stupně složitosti. Obecně se rozlišují jednofaktorové regresní modely a vícefaktorové regresní modely.

Modely s jednou nezávisle proměnnou se označují jako jednofaktorové regresní modely - lineární, kvadratický, hyperbolický, odmocniný, mocninný, exponenciální a logaritmický

Jednoduché regresní funkce

Naopak modely s více nezávisle proměnnými se označují jako vícefaktorové regresní modely - mnohonásobný lineární model, mocniný a exponenciální

Vícefaktorové regresní modely

Průběh závislosti mezi 2 proměnnými lze identifikovat pomocí grafického diagramu (bodový graf). V případě vícenásobné regrese je identifikace složitější. Průběh závislosti mezi více proměnnými již nelze zobrazit graficky. Ideální specifikace modelu se volí na základě statistických testů průkaznosti modelu.

Metoda nejmenších čtverců

Pro odhad parametrů klasického lineárního regresního modelu (KLRM) se používá metoda nejmenších čtverců (MNČ). MNČ je použitelná pouze pro modely s lineárními regresními parametry. Lze jí však použít i pro modely s nelineárními parametry, které je možné vhodnou transformací linearizovat (například logaritmická transformace).

Cílem MNČ je nalézt vhodnou aproximační funkci, která nejlépe vystihuje empirické hodnoty závisle proměnné. Nejlepší aproximační funkce je taková funkce, která nejlépe minimalizuje reziduální součet čtverců odchylek skutečných hodnot závisle proměnné y od teoretických η. V praxi je teoretická hodnota nahrazena vyrovnanou hodnotou Y odhadnutou pomocí výběrové regresní funkce.

Složkové vyjádření KLRM

Metoda nejmenších čtverců je založena na minimalizaci součtu čtverců odchylek. Minimalizační kritérium MNČ má podobu

Minimalizační kritérium metody nejmenších čtverců

Parciálními derivacemi minimalizačního kritéria podle jednotlivých parametrů modelu β0, β1, ..., βk a položením rovnic rovných nule vytvoříme soustavu normálních rovnic. Soustava obsahuje tolik rovnic, kolik je parametrů v modelu. V následujícím příkladě je odvození soustavy normálních rovnic pro výběrovou kvadratickou regresní funkci

Odvození normálních rovnic kvadratické regrese

Úpravami získáme následující finální podobu soustavy normálních rovnic.

Soustava normálních rovnice kvadratické regrese

Bodové odhady bj parametrů βj lze získat řešením soustavy normálních rovnic pomocí Cramerova pravidla.

Maticové vyjádření KLRM

Pro složitější modely jsou Cramerovy vzorce nepřehledné. Proto doporučuji řešit soustavu normálních rovnic v maticové podobě. Maticové vyjádření klasického lineárního regresního modelu je přehlednější a prostorově úspornější.

Klasický lineární regresní model - maticový zápis

y ... sloupcový vektor n pozorování hodnot závisle proměnné, X ... matice n x (k + 1) pozorování hodnot vysvětlujících proměnných, β ... sloupcový vektor k + 1 neznámých parametrů, e ... sloupcový vektor n náhodných složek → e = y - Xβ

Derivací minimalizačního kritéria podle transponovaného vektoru bT získáme soustavu normálních rovnic, ze které nakonec vyjádříme bodovou odhadovou funkci MNČ

Odhadová funkce MNČ

b ... sloupcový vektor bodových odhadů parametrů β, XT ... transponovaná matice (k + 1) x n nezávisle proměnných, (XTX)-1 ... inverzní čtvercová matice (k + 1) x (k + 1), y ... sloupcový vektor závisle proměnné

Bodové odhady vektoru b parametrů β doporučuji ideálně provádět pomocí ekonometrického softwaru například Gretl nebo v MS Excelu.

Líbil se vám článek? A chcete se vědět o každém dalším?

Sledujte:

Seznam použité literatury
  • CIPRA, T.: Finanční ekonometrie. EKOPRESS 2008, Praha. První vydání, 538 stran. ISBN 978-80-86929-43-9
  • DUFEK, J.: Ekonometrie. Mendelova zemědělská a lesnická univerzita v Brně 2003, Brno. První vydání, 136 stran. ISBN 80-7157-654-9
  • HAMPEL, D., BLAŠKOVÁ, V., STŘELEC, L.: Ekonometrie 2. Mendelova univerzita v Brně 2011, Brno. První vydání, 147 stran. ISBN 978-80-7375-540-9
  • HINDLS, R., HRONOVÁ, S., SEGER, J., FISCHER, J.: Statistika pro ekonomy. Profesional publishing 2007, Praha. Osmé vydání, 415 stran. ISBN 978-80-86946-43-6
  • HUŠEK, R.: Ekonometrická analýza. EKOPRESS 1999, Praha. První vydání, 303 stran. ISBN 80-86119-19-X
  • JAROŠOVÁ, E., PECÁKOVÁ, I.: Příklady k předmětu statistika B. Vysoká škola ekonomická v Praze 2003, Praha. První vydání, 222 stran. ISBN 80-245-0015-9
  • LEJNAROVÁ, Š., RÁČKOVÁ, A., ZOUHAR, J.: Základy ekonometrie v příkladech. Vysoká škola ekonomická 2009, Praha. První vydání, 276 stran. ISBN 978-80-245-1564-9
  • MINAŘÍK, B.: Statistika I. Popisná statistika - druhá část. Mendelova zemědělská a lesnická univerzita v Brně 2000, Brno. První vydání, 226 stran. ISBN 978-80-7375-152-4
  • Wikipedia. Metoda nejmenších čtverců [on-line] [cit. 2015-10-05]. Dostupné z WWW: https://cs.wikipedia.org/wiki/Metoda_nejmen%C5%A1%C3%ADch_%C4%8Dtverc%C5%AF
Nahoru