Úvod do regresní analýzy
Publikováno: 1.6.2017
Regresní funkce, metoda nejmenších čtverců, soustava normálních rovnic ve složkovém a maticovém tvaru
- lineární regrese
- regresní funkce
- MNČ
Regresní analýza je statistický nástroj, který slouží k modelování vztahů mezi proměnnými a tvorbě predikcí. Regresní modely nabývají různých tvarů matematických funkcí, které se označují jako regresní funkce. Regresní funkce obsahuje 2 skupiny proměnných - závisle proměnnou y a množinu nezávisle proměnných x1, x2, ...., xk, které vysvětlují variabilitu y.
Lineární regresní model
Lineární regresní model vyjádřuje stochastickou závislost závisle proměnné y na regresní funkci základního souboru η a náhodné složce ε
y ... závisle proměnná, η ... regresní funkce základního souboru, ε ... náhodná složka, βk ... neznámé regresní parametry, xk ... nezávisle proměnné
Regresní funkce základního souboru (populace) je teoretický koncept, který obsahuje neznámé parametry β0, β1, ..., βk. Parametry βk jsou výsledkem vztahů v celé populaci, kterou v naprosté většině případů nemáme k dispozici.
V praxi pracujeme s výběrem dat z určitého základního souboru, proto se musíme spokojit s výběrovými odhady b0, b1, ..., bk neznámých parametrů
y ... závisle proměnná, Y ... výběrová regresní funkce, e ... odhad náhodné složky, bk ... odhad parametrů modelu, xk ... nezávisle proměnné
Výběrové odhady parametrů se statisticky verifikují. Potvrdí-lí se u nich optimální vlastnosti, pak je můžeme vztáhnout na celou populaci.
Stejně tak se musíme v praxi spokojit s odhadem náhodné složky ε. Odhad náhodné složky se označuje jako reziduum e, které je rozdílem mezi skutečnou hodnotou závisle proměnné y a její vyrovnanou hodnotou Y.
Tvary regresních funkcí
Regresní modely nabývají různého stupně složitosti. Obecně se rozlišují jednofaktorové regresní modely a vícefaktorové regresní modely.
Modely s jednou nezávisle proměnnou se označují jako jednofaktorové regresní modely - lineární, kvadratický, hyperbolický, odmocniný, mocninný, exponenciální a logaritmický
Naopak modely s více nezávisle proměnnými se označují jako vícefaktorové regresní modely - mnohonásobný lineární model, mocniný a exponenciální
Průběh závislosti mezi 2 proměnnými lze identifikovat pomocí grafického diagramu (bodový graf). V případě vícenásobné regrese je identifikace složitější. Průběh závislosti mezi více proměnnými již nelze zobrazit graficky. Ideální specifikace modelu se volí na základě statistických testů průkaznosti modelu.
Metoda nejmenších čtverců
Pro odhad parametrů klasického lineárního regresního modelu (KLRM) se používá metoda nejmenších čtverců (MNČ). MNČ je použitelná pouze pro modely s lineárními regresními parametry. Lze jí však použít i pro modely s nelineárními parametry, které je možné vhodnou transformací linearizovat (například logaritmická transformace).
Cílem MNČ je nalézt vhodnou aproximační funkci, která nejlépe vystihuje empirické hodnoty závisle proměnné. Nejlepší aproximační funkce je taková funkce, která nejlépe minimalizuje reziduální součet čtverců odchylek skutečných hodnot závisle proměnné y od teoretických η. V praxi je teoretická hodnota nahrazena vyrovnanou hodnotou Y odhadnutou pomocí výběrové regresní funkce.
Složkové vyjádření KLRM
Metoda nejmenších čtverců je založena na minimalizaci součtu čtverců odchylek. Minimalizační kritérium MNČ má podobu
Parciálními derivacemi minimalizačního kritéria podle jednotlivých parametrů modelu β0, β1, ..., βk a položením rovnic rovných nule vytvoříme soustavu normálních rovnic. Soustava obsahuje tolik rovnic, kolik je parametrů v modelu. V následujícím příkladě je odvození soustavy normálních rovnic pro výběrovou kvadratickou regresní funkci
Úpravami získáme následující finální podobu soustavy normálních rovnic.
Bodové odhady bj parametrů βj lze získat řešením soustavy normálních rovnic pomocí Cramerova pravidla.
Maticové vyjádření KLRM
Pro složitější modely jsou Cramerovy vzorce nepřehledné. Proto doporučuji řešit soustavu normálních rovnic v maticové podobě. Maticové vyjádření klasického lineárního regresního modelu je přehlednější a prostorově úspornější.
y ... sloupcový vektor n pozorování hodnot závisle proměnné, X ... matice n x (k + 1) pozorování hodnot vysvětlujících proměnných, β ... sloupcový vektor k + 1 neznámých parametrů, e ... sloupcový vektor n náhodných složek → e = y - Xβ
Derivací minimalizačního kritéria podle transponovaného vektoru bT získáme soustavu normálních rovnic, ze které nakonec vyjádříme bodovou odhadovou funkci MNČ
b ... sloupcový vektor bodových odhadů parametrů β, XT ... transponovaná matice (k + 1) x n nezávisle proměnných, (XTX)-1 ... inverzní čtvercová matice (k + 1) x (k + 1), y ... sloupcový vektor závisle proměnné
Bodové odhady vektoru b parametrů β doporučuji ideálně provádět pomocí ekonometrického softwaru například Gretl nebo v MS Excelu.
- CIPRA, T.: Finanční ekonometrie. EKOPRESS 2008, Praha. První vydání, 538 stran. ISBN 978-80-86929-43-9
- DUFEK, J.: Ekonometrie. Mendelova zemědělská a lesnická univerzita v Brně 2003, Brno. První vydání, 136 stran. ISBN 80-7157-654-9
- HAMPEL, D., BLAŠKOVÁ, V., STŘELEC, L.: Ekonometrie 2. Mendelova univerzita v Brně 2011, Brno. První vydání, 147 stran. ISBN 978-80-7375-540-9
- HINDLS, R., HRONOVÁ, S., SEGER, J., FISCHER, J.: Statistika pro ekonomy. Profesional publishing 2007, Praha. Osmé vydání, 415 stran. ISBN 978-80-86946-43-6
- HUŠEK, R.: Ekonometrická analýza. EKOPRESS 1999, Praha. První vydání, 303 stran. ISBN 80-86119-19-X
- JAROŠOVÁ, E., PECÁKOVÁ, I.: Příklady k předmětu statistika B. Vysoká škola ekonomická v Praze 2003, Praha. První vydání, 222 stran. ISBN 80-245-0015-9
- LEJNAROVÁ, Š., RÁČKOVÁ, A., ZOUHAR, J.: Základy ekonometrie v příkladech. Vysoká škola ekonomická 2009, Praha. První vydání, 276 stran. ISBN 978-80-245-1564-9
- MINAŘÍK, B.: Statistika I. Popisná statistika - druhá část. Mendelova zemědělská a lesnická univerzita v Brně 2000, Brno. První vydání, 226 stran. ISBN 978-80-7375-152-4
- Wikipedia. Metoda nejmenších čtverců [on-line] [cit. 2015-10-05]. Dostupné z WWW: https://cs.wikipedia.org/wiki/Metoda_nejmen%C5%A1%C3%ADch_%C4%8Dtverc%C5%AF