Je uvedená matica párových korelačných koeficientov. Konštrukcia matice párových korelačných koeficientov

Z 1 (t)

Z 2 (t)

t

y(t)

Z 1 (t)

Z 2 (t)

t

y(t)

Hlavnou úlohou pri výbere faktorov zahrnutých do korelačného modelu je zahrnúť do analýzy všetky hlavné faktory, ktoré ovplyvňujú úroveň skúmaného javu. Nie je však vhodné zavádzať do modelu veľké množstvo faktorov, správnejšie je vybrať len relatívne malý počet hlavných faktorov, ktoré sú pravdepodobne v korelácii s vybraným funkčným ukazovateľom.

Dá sa to urobiť pomocou takzvaného dvojstupňového výberu. V súlade s ním sú do modelu zahrnuté všetky vopred zvolené faktory. Potom sa medzi nimi na základe špeciálneho kvantitatívneho hodnotenia a dodatočnej kvalitatívnej analýzy identifikujú nevýznamne ovplyvňujúce faktory, ktoré sa postupne vyraďujú, kým nezostanú tie, o ktorých možno tvrdiť, že dostupný štatistický materiál je v súlade s hypotézou ich spoločný významný vplyv na závislú premennú so zvolenou formou spojenia.

Dvojstupňový výber dostal svoje najúplnejšie vyjadrenie v metóde tzv. viacstupňovej regresnej analýzy, pri ktorej dochádza k skríningu nevýznamných faktorov na základe ich ukazovateľov významnosti, najmä na základe hodnoty t f - vypočítaná hodnota študentského kritéria.

Vypočítajte t f podľa nájdených párových korelačných koeficientov a porovnajte ich s t kritickým pre 5% hladinu významnosti (obojstranná) a 18 stupňov voľnosti (ν = n-2).

kde r je hodnota párového korelačného koeficientu;

n – počet pozorovaní (n=20)

Pri porovnaní t f pre každý koeficient s t kr = 2,101 získame, že zistené koeficienty sú uznané ako významné, keďže t f > t kr.

t f pre r yx 1 = 2, 5599 ;

t f pre r yx 2 = 7,064206 ;

t f pre r yx 3 = 2,40218 ;

tf pre r x1 x 2 = 4,338906 ;

tf pre r x1 x 3 = 15,35065;

tf pre r x2 x 3 = 4,749981

Pri výbere faktorov zahrnutých do analýzy sa na ne vzťahujú špecifické požiadavky. V prvom rade musia byť ukazovatele vyjadrujúce tieto faktory kvantifikovateľné.

Faktory zahrnuté v modeli by nemali byť vo funkčnom alebo úzkom vzťahu medzi sebou. Prítomnosť takýchto väzieb je charakterizovaná multikolinearitou.

Multikolinearita naznačuje, že niektoré faktory charakterizujú rovnakú stránku skúmaného javu. Preto je ich súčasné zaradenie do modelu nepraktické, keďže sa do určitej miery navzájom duplikujú. Ak neexistujú žiadne špeciálne predpoklady hovoriace v prospech jedného z týchto faktorov, treba dať prednosť jednému z nich, ktorý sa vyznačuje veľkým koeficientom párovej (alebo čiastočnej) korelácie.

Predpokladá sa, že limitnou hodnotou je hodnota korelačného koeficientu medzi týmito dvoma faktormi, ktorá sa rovná 0,8.

Multikolinearita zvyčajne vedie k degenerácii matice premenných a následne k tomu, že hlavný determinant znižuje svoju hodnotu a v limite sa blíži k nule. Odhady koeficientov regresnej rovnice sa stávajú vysoko závislými od presnosti nájdenia počiatočných údajov a pri zmene počtu pozorovaní dramaticky menia ich hodnoty.

Matica párových korelačných koeficientov

Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945

Uzly matice obsahujú párové korelačné koeficienty, ktoré charakterizujú blízkosť vzťahu medzi faktorovými charakteristikami. Pri analýze týchto koeficientov si všimneme, že čím väčšia je ich absolútna hodnota, tým väčší je vplyv zodpovedajúceho znamienka faktora na výsledný koeficient. Analýza výslednej matrice sa vykonáva v dvoch fázach:

1. Ak prvý stĺpec matice obsahuje korelačné koeficienty, pre ktoré /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Pri analýze párových korelačných koeficientov faktorových charakteristík medzi sebou, (r XiXj), charakterizujúcich tesnosť ich vzťahu, je potrebné vyhodnotiť ich vzájomnú nezávislosť, keďže je to nevyhnutná podmienka pre ďalšiu regresnú analýzu. Vzhľadom na to, že v ekonomike neexistujú absolútne nezávislé znaky, je potrebné podľa možnosti vyčleniť tie najsamostatnejšie. Faktorové znaky, ktoré sú navzájom v úzkej korelácii, sa nazývajú multikolineárne. Zahrnutie multikolineárnych prvkov do modelu znemožňuje ekonomickú interpretáciu regresného modelu, pretože zmena jedného faktora so sebou nesie zmenu faktorov s ním spojených, čo môže viesť k „rozpadu“ modelu ako celku.

Kritérium multikoleniality faktorov je nasledovné:

/r XiXj / > 0,8

Vo výslednej matici párových korelačných koeficientov toto kritérium spĺňajú dva ukazovatele umiestnené v priesečníku riadkov A . Z každej dvojice týchto vlastností by mala byť jedna v modeli ponechaná, mala by mať väčší vplyv na výslednú vlastnosť. V dôsledku toho sú faktory a vylúčené z modelu; tempo rastu nákladov na predaj a tempo rastu objemu jeho realizácie.

Takže do regresného modelu zavedieme faktory X1 a X2.

Ďalej sa vykoná regresná analýza (servis, analýza dát, regresia). Opäť zostaví tabuľku počiatočných údajov s faktormi X1 a X2. Regresia ako celok sa používa na analýzu vplyvu hodnôt nezávislých premenných (faktorov) na samostatnú závislú premennú a umožňuje prezentovať koreláciu medzi znakmi vo forme určitej funkčnej závislosti nazývanej regresná rovnica alebo korelácia- regresný model.

Ako výsledok regresnej analýzy získame výsledky výpočtu multivariačnej regresie. Analyzujme získané výsledky.

Všetky regresné koeficienty sú signifikantné podľa Studentovho t-testu. Viacnásobný korelačný koeficient R bol 0,925, druhá mocnina tejto hodnoty (determinačný koeficient) znamená, že variácia výsledného znaku je v priemere 85,5 % v dôsledku variácie faktorových znakov zahrnutých v modeli. Koeficient determinizmu charakterizuje tesnosť vzťahu medzi súborom faktorových charakteristík a ukazovateľom výkonnosti. Čím je hodnota R-štvorca bližšie k 1, tým silnejší je vzťah. V našom prípade indikátor rovný 0,855 indikuje správny výber faktorov a prítomnosť vzťahu medzi faktormi a indikátorom výkonnosti.

Uvažovaný model je adekvátny, keďže vypočítaná hodnota Fisherovho F-kritéria výrazne prevyšuje jeho tabuľkovú hodnotu (F obl = 52,401; F tabl = 1,53).

Ako všeobecný výsledok vykonanej korelačno-regresnej analýzy existuje viacnásobná regresná rovnica, ktorá má tvar:

Výsledná regresná rovnica spĺňa účel korelačnej a regresnej analýzy a je lineárnym modelom závislosti bilančného zisku spoločnosti od dvoch faktorov: tempa rastu produktivity práce a koeficientu priemyselného vlastníctva.

Na základe získaného modelu môžeme konštatovať, že pri zvýšení úrovne produktivity práce o 1 % v porovnaní s predchádzajúcim obdobím sa bilančný zisk zvýši o 0,95 percentuálneho bodu; zvýšenie koeficientu priemyselného vlastníctva o 1 % povedie k zvýšeniu efektívneho ukazovateľa o 27,9 percentuálneho bodu. Dominantný vplyv na rast bilančného zisku má teda zvýšenie hodnoty priemyselného vlastníctva (renovácia a rast investičného majetku podniku).

Podľa viacnásobného regresného modelu sa vykonáva multifaktoriálna predpoveď efektívnej funkcie. Nech je známe, že X1 = 3,0 a X3 = 0,7. Dosadíme do modelu hodnoty faktorových znamienok, dostaneme Cm = 0,95 * 3,0 + 27,9 * 0,7 - 19,4 = 2,98. So zvýšením produktivity práce a modernizáciou dlhodobého majetku v podniku sa tak bilančný zisk v 1. štvrťroku 2005 v porovnaní s predchádzajúcim obdobím (4. štvrťrok 2004) zvýši o 2,98 %.

Ekonomické údaje sú kvantitatívne charakteristiky akýchkoľvek ekonomických objektov alebo procesov. Vznikajú pod vplyvom mnohých faktorov, z ktorých nie všetky sú dostupné externej kontrole. Nekontrolovateľné faktory môžu nadobudnúť náhodné hodnoty zo súboru hodnôt a tým spôsobiť náhodnosť údajov, ktoré určujú. Jednou z hlavných úloh ekonomického výskumu je analýza závislostí medzi premennými.

Vzhľadom na závislosti medzi vlastnosťami je potrebné rozlišovať predovšetkým dva typy vzťahov:

  • funkčný - sú charakterizované úplnou zhodou medzi zmenou atribútu faktora a zmenou výslednej hodnoty: každá hodnota atribútu-faktor zodpovedá dobre definovaným hodnotám efektívneho atribútu. Tento typ vzťahu je vyjadrený ako vzorecový vzťah. Funkčná závislosť môže spájať výsledný znak s jedným alebo viacerými faktorovými znakmi. Výška mzdy za časovú mzdu teda závisí od počtu odpracovaných hodín;
  • korelácia- medzi zmenou dvoch znakov neexistuje úplná zhoda, vplyv jednotlivých faktorov sa prejavuje len priemerne, s hromadným sledovaním skutočných údajov. Súčasný vplyv veľkého množstva rôznych faktorov na študovaný znak vedie k tomu, že rovnaká hodnota atribútu-faktor zodpovedá celému rozdeleniu hodnôt výsledného atribútu, pretože v každom konkrétnom prípade môžu iné faktory zmeniť silu a smer ich dopadu.

Malo by sa pamätať na to, že ak medzi znakmi existuje funkčný vzťah, je možné pri znalosti hodnoty znaku faktora presne určiť hodnotu výsledku. Len za prítomnosti korelačnej závislosti trend zmeny efektívnej funkcie pri zmene hodnoty znamienka faktora.

Pri štúdiu vzťahu medzi znakmi sú klasifikované podľa smeru, formy, počtu faktorov:

  • smerom k spoje sa delia na rovno A obrátene. Pri priamom spojení sa smer zmeny efektívneho atribútu zhoduje so smerom zmeny znaku-faktora. So spätnou väzbou je smer zmeny v efektívnom znaku opačný ako smer zmeny vo znaku-faktore. Napríklad, čím vyššia je kvalifikácia pracovníka, tým vyššia je úroveň produktivity jeho práce (priamy vzťah). Čím vyššia je produktivita práce, tým nižšie sú jednotkové výrobné náklady (spätná väzba);
  • informovať(typ funkcie) spoje sa delia na lineárne(priamočiare) a nelineárne(krivočiary). Lineárny vzťah sa zobrazuje ako priamka, nelineárny vzťah - ako krivka (parabola, hyperbola atď.). Pri lineárnom vzťahu s nárastom hodnoty atribútu faktora dochádza k rovnomernému zvýšeniu (poklesu) hodnoty výsledného atribútu;
  • počtom faktorov pôsobiacich na efektívne znamenie, komunikácie sa delia na jednofaktorové(spárované) a multifaktoriálny.

Štúdium závislosti variácie znaku na okolitých podmienkach je obsahom teórie korelácie.

Pri vykonávaní korelačnej analýzy sa celý súbor údajov považuje za súbor premenných (faktorov), z ktorých každá obsahuje P pozorovania.

Pri štúdiu vzťahu medzi dvoma faktormi sa zvyčajne označujú X=(x str x 2,...,x p) A Y= (y ( , y 2,..., y a).

Kovariancia - je to štatistické miera interakcie dve premenné. Napríklad kladná hodnota kovariancie výnosov dvoch cenných papierov naznačuje, že výnosy týchto cenných papierov majú tendenciu pohybovať sa rovnakým smerom.

Kovariancia medzi dvoma premennými X A Y vypočítané takto:

kde sú skutočné hodnoty premenných

X A G;

Ak náhodné premenné Hee Y sú nezávislé, teoretická kovariancia je nulová.

Kovariancia závisí od jednotiek, v ktorých sú premenné merané Hee Y, je to nenormalizované množstvo. Preto merať komunikačné sily medzi dvoma premennými sa používa iná štatistika, ktorá sa nazýva korelačný koeficient.

Pre dve premenné X A Y párový korelačný koeficient

je definovaný nasledovne:

Kde SSy- odhady rozptylu Hee Y. Tieto odhady charakterizujú stupeň disperzie hodnoty x ( , x 2, ..., x n (y 1 , y 2, y n) okolo vášho priemeru x (y v uvedenom poradí), alebo variabilita(variabilita) týchto premenných počas súboru pozorovaní.

Disperzia(odhad rozptylu) je určený vzorcom

Vo všeobecnom prípade, aby sa získal nezaujatý odhad rozptylu, súčet štvorcov by sa mal vydeliť počtom stupňov voľnosti odhadu (atď), Kde P - veľkosť vzorky, R - počet odkazov uložených na vzorke. Keďže vzorka už bola raz použitá na určenie priemeru X, potom sa počet superponovaných väzieb v tomto prípade rovná jednej (p = 1) a počet stupňov voľnosti odhadu (t. j. počet nezávislých prvkov vzorky) sa rovná (P - 1).

Je prirodzenejšie merať stupeň rozptylu hodnôt premenných v rovnakých jednotkách, v ktorých sa meria samotná premenná. Tento problém rieši indikátor tzv smerodajná odchýlka (smerodajná odchýlka) alebo štandardná chyba premenlivý X(premenná Y) a určí sa pomerom

Členy v čitateli vzorca (3.2.1) vyjadrujú interakciu dvoch premenných a určujú znamienko korelácie (kladné alebo záporné). Ak napríklad existuje silný pozitívny vzťah medzi premennými (nárast jednej premennej, keď sa zvyšuje druhá), každý člen bude kladné číslo. Podobne, ak existuje silný negatívny vzťah medzi premennými, všetky výrazy v čitateli budú záporné čísla, výsledkom čoho bude negatívna korelačná hodnota.

Menovateľ výrazu pre párový korelačný koeficient [viď. vzorec (3.2.2)] jednoducho normalizuje čitateľa takým spôsobom, že korelačný koeficient sa ukáže ako ľahko interpretovateľné číslo, ktoré nemá rozmer a nadobúda hodnoty od -1 do +1.

Čitateľ výrazu pre korelačný koeficient, ktorý je pre neobvyklé jednotky ťažko interpretovateľný, je XY kovariancia. Napriek tomu, že sa niekedy používa ako nezávislá charakteristika (napríklad v teórii financií na opis spoločnej zmeny cien akcií na dvoch burzách), je vhodnejšie použiť korelačný koeficient. Korelácia a kovariancia predstavujú v podstate rovnaké informácie, ale korelácia tieto informácie prezentuje vo vhodnejšej forme.

Na kvalitatívne posúdenie korelačného koeficientu sa používajú rôzne škály, najčastejšie Chaddockova škála. V závislosti od hodnoty korelačného koeficientu môže mať vzťah jeden z nasledujúcich odhadov:

  • 0,1-0,3 - slabé;
  • 0,3-0,5 - viditeľné;
  • 0,5-0,7 - mierny;
  • 0,7-0,9 - vysoká;
  • 0,9-1,0 - veľmi vysoká.

Hodnotenie miery blízkosti súvislosti pomocou korelačného koeficientu sa uskutočňuje spravidla na základe viac-menej obmedzených informácií o skúmanom jave. V tejto súvislosti je potrebné posúdiť významnosť lineárneho korelačného koeficientu, ktorý umožňuje rozšíriť závery na základe výsledkov vzorky na všeobecnú populáciu.

Hodnotenie významnosti korelačného koeficientu pre malé veľkosti vzorky sa vykonáva pomocou Studentovho 7-testu. V tomto prípade je skutočná (pozorovaná) hodnota tohto kritéria určená vzorcom

Hodnota / obs vypočítaná pomocou tohto vzorca sa porovnáva s kritickou hodnotou θ-kritéria, ktoré je prevzaté z tabuľky hodnôt Študentovho /-testu (pozri prílohu 2), pričom sa berie do úvahy daná hladina významnosti σ a počet stupňov voľnosti (P - 2).

Ak 7 obs > 7 tab, potom sa získaná hodnota korelačného koeficientu považuje za významnú (t. j. nulová hypotéza tvrdiaca, že korelačný koeficient sa rovná nule je zamietnutá). A tak sa dospelo k záveru, že medzi skúmanými premennými existuje úzky štatistický vzťah.

Ak je hodnota y x blízko nule, vzťah medzi premennými je slabý. Ak korelácia medzi náhodnými premennými:

  • je kladná, potom keď sa jedna náhodná premenná zvyšuje, druhá má tendenciu v priemere stúpať;
  • je záporná, potom keď sa jedna náhodná premenná zvyšuje, druhá má tendenciu v priemere klesať. Pohodlný grafický nástroj na analýzu spárovaných údajov je bodový diagram, ktorý predstavuje každé pozorovanie v priestore dvoch rozmerov zodpovedajúcich dvom faktorom. Nazýva sa aj bodový graf, ktorý zobrazuje množinu hodnôt dvoch funkcií korelačné pole. Každý bod tohto diagramu má súradnice x (. a y g Keď sa sila lineárneho vzťahu zvýši, body na grafe budú ležať bližšie k priamke a veľkosť G bude bližšie k jednote.

Párové korelačné koeficienty sa používajú na meranie sily lineárnych vzťahov medzi rôznymi pármi znakov z ich súboru. Pre súbor funkcií získajte matica párových korelačných koeficientov.

Nech celý súbor údajov pozostáva z premennej Y==(v r y 2, ..., y p) A T premenné (faktory) X, z ktorých každý obsahuje P pozorovania. Variabilné hodnoty Y A X, obsiahnuté v sledovanej populácii sú zaznamenané v tabuľke (tabuľka 3.2.1).

Tabuľka 3.2.1

Variabilné

číslo

pozorovania

X t3

Х tp

Na základe údajov uvedených v tejto tabuľke vypočítajte matica párových korelačných koeficientov R, je symetrický okolo hlavnej uhlopriečky:


Analýza matice párových korelačných koeficientov sa využíva pri konštrukcii viacnásobných regresných modelov.

Jedna korelačná matica nedokáže úplne opísať závislosti medzi veličinami. V tejto súvislosti sa v multivariačnej korelačnej analýze zvažujú dva problémy:

  • 1. Určenie tesnosti vzťahu jednej náhodnej premennej so súhrnom ostatných premenných zahrnutých do analýzy.
  • 2. Určenie tesnosti vzťahu medzi dvoma veličinami pri fixovaní alebo vylúčení vplyvu iných veličín.

Tieto problémy sa riešia pomocou viacnásobných a parciálnych korelačných koeficientov.

Riešenie prvého problému (určenie tesnej súvislosti jednej náhodnej premennej s množinou ďalších premenných zahrnutých do analýzy) sa vykonáva pomocou výberový viacnásobný korelačný koeficient podľa vzorca

Kde R- R[cm. vzorec (3.2.6)]; Rjj- algebraický doplnok prvku tej istej matice R.

Druhá mocnina viacnásobného korelačného koeficientu SCHj2 j _j J+l m volal selektívny viacnásobný koeficient determinácie; ukazuje, aký podiel variácie (náhodného rozptylu) skúmanej veličiny Xj vysvetľuje variácie iných náhodných premenných X ( , X 2 ,..., X t.

Koeficienty viacnásobnej korelácie a determinácie sú kladné hodnoty, nadobúdajú hodnoty v rozsahu od 0 do 1. Keď sa koeficient priblíži R 2 k jednote, môžeme konštatovať, že vzťah náhodných premenných je blízky, ale nie o jeho smere. Koeficient viacnásobnej korelácie sa môže zvýšiť iba vtedy, ak sú do modelu zahrnuté ďalšie premenné, a nezvýši sa, ak sa vylúčia niektoré z dostupných funkcií.

Kontrola významnosti koeficientu determinácie sa vykonáva porovnaním vypočítanej hodnoty /'-Fisherovho kritéria

s tabuľkovým F rabl. Tabuľková hodnota kritéria (pozri prílohu 1) je určená danou hladinou významnosti a a stupňami voľnosti v l \u003d mnv 2 \u003d n-m-l. Koeficient R2 sa výrazne líši od nuly, ak je nerovnosť

Ak sú uvažované náhodné premenné navzájom korelujú potom je hodnota párového korelačného koeficientu čiastočne ovplyvnená vplyvom iných veličín. V tejto súvislosti je potrebné študovať čiastočnú koreláciu medzi premennými pri vylúčení vplyvu iných náhodných premenných (jednej alebo viacerých).

Vzorový koeficient parciálnej korelácie sa určuje podľa vzorca

Kde RJk , Rjj, Rkk - algebraické doplnky k príslušným maticovým prvkom R[cm. vzorec (3.2.6)].

Parciálny korelačný koeficient, ako aj párový korelačný koeficient, sa mení od -1 do +1.

Vyjadrenie (3.2.9) za podmienky t = 3 bude vyzerať

Nazýva sa koeficient r 12(3). korelačný koeficient medzi x ( A x 2 pre pevné x y Je symetrický vzhľadom na primárne indexy 1, 2. Jeho sekundárny index 3 sa vzťahuje na pevnú premennú.

Príklad 3.2.1. Výpočet párových koeficientov,

viacnásobná a čiastočná korelácia.

V tabuľke. 3.2.2 poskytuje informácie o objemoch predaja a reklamných nákladoch jednej spoločnosti, ako aj index spotrebiteľských výdavkov za niekoľko aktuálnych rokov.

  • 1. Zostrojte bodový graf (korelačné pole) pre premenné „objem predaja“ a „index spotrebiteľských výdavkov“.
  • 2. Určte mieru vplyvu indexu spotrebiteľských výdavkov na objem predaja (vypočítajte párový korelačný koeficient).
  • 3. Posúďte významnosť vypočítaného párového korelačného koeficientu.
  • 4. Zostavte maticu párových korelačných koeficientov pre tri premenné.
  • 5. Nájdite odhad viacnásobného korelačného koeficientu.
  • 6. Nájdite odhady parciálnych korelačných koeficientov.

1. V našom príklade má rozptylový diagram tvar znázornený na obr. 3.2.1. Predĺženie mračna bodov v rozptylovom grafe pozdĺž naklonenej priamky nám umožňuje predpokladať, že existuje určitá objektívna tendencia k priamemu lineárnemu vzťahu medzi hodnotami premenných. X 2 Y(objem predaja).

Ryža. 3.2.1.

2. Medzivýpočty pri výpočte korelačného koeficientu medzi premennými X 2(index spotrebiteľských výdavkov) a Y(objem predaja) sú uvedené v tabuľke. 3.2.3.

Priemery náhodné premenné X 2 A Y,čo sú najjednoduchšie ukazovatele charakterizujúce postupnosti jCj, x 2,..., x 16 a y v y 2 ,..., y 16 , vypočítame podľa nasledujúcich vzorcov:


Objem predaja Y, tisíc rubľov

Index

konzumovať

Telsky

výdavky

Objem predaja Y, tisíc rubľov

Index

konzumovať

Telsky

výdavky

Tabuľka 3.2.3

l:, - X

(A - Y) (x, - x)

(x, - x) 2

(y, -- y) 2

Disperzia charakterizuje mieru šírenia hodnôt x v x 2 , x :

Zvážte teraz riešenie príkladu 3.2.1 v Exceli.

Na výpočet korelácie pomocou Excelu môžete použiť funkciu =correl(), špecifikujúci adresy dvoch stĺpcov čísel, ako je znázornené na obr. 3.2.2. Odpoveď je umiestnená v D8 a rovná sa 0,816.

Ryža. 3.2.2.

(Poznámka: Argumenty funkcie korelácie musia byť čísla alebo názvy, polia alebo odkazy obsahujúce čísla. Ak argument, ktorým je pole alebo odkaz, obsahuje text, boolovské hodnoty alebo prázdne bunky, potom sa tieto hodnoty ignorujú; počítajú sa však bunky, ktoré obsahujú hodnoty null.

Ak pole! a pole2 majú iný počet dátových bodov, potom funkcia correl vráti chybovú hodnotu #n/a.

Ak je pole1 alebo pole2 prázdne alebo ak o (štandardná odchýlka) ich hodnôt je nula, potom funkcia correl vráti chybovú hodnotu #div/0 !.)

Pomocou funkcie je možné získať aj kritickú hodnotu štatistiky /-Student steudrasprobr 1 balík Excel. Ako argumenty funkcie musíte zadať počet stupňov voľnosti rovný P- 2 (v našom príklade 16 - 2= 14) a hladina významnosti a (v našom príklade a = 0,1) (obr. 3.2.3). Ak skutočná hodnota/-štatistika, prevzaté modulo, ďalšie kritický, potom s pravdepodobnosťou (1 - a) je korelačný koeficient výrazne odlišný od nuly.


Ryža. 3.2.3. Kritická hodnota /-štatistiky je 1,7613

Excel obsahuje sadu nástrojov na analýzu údajov (takzvaný analytický balík) navrhnutých na riešenie rôznych štatistických problémov. Vypočítať maticu párových korelačných koeficientov R použite nástroj Korelácia (obr. 3.2.4) a nastavte parametre analýzy v príslušnom dialógovom okne. Odpoveď bude umiestnená na novom pracovnom hárku (obr. 3.2.5).

1 V Exceli 2010 názov funkcie steudrasprobr sa zmenil na steu-

DENT.ORD.2X.

Ryža. 3.2.4.


Ryža. 3.2.5.

  • Za zakladateľov teórie korelácie sa považujú anglickí štatistici F. Galton (1822-1911) a K. Pearson (1857-1936). Pojem „korelácia“ bol vypožičaný z prírodných vied a znamená „korelácia, korešpondencia“. Pojem korelácie ako vzájomnej závislosti medzi náhodnými premennými je základom matematicko-štatistickej teórie korelácie.

Pre územia Južného federálneho okruhu Ruskej federácie sú uvedené údaje za rok 2011

Územia federálneho okresu

Hrubý regionálny produkt, miliardy rubľov, Y

Investície do fixného kapitálu, miliardy rubľov, X1

1. Rep. Adygea

2. Rep. Dagestan

3. Rep. Ingušsko

4. Kabardino-Balkarská republika

5. Rep. Kalmykia

6. Karačajsko-čerkesská republika

7. Rep. Severné Osetsko Alania

8. Krasnodarský kraj)

9. Územie Stavropol

10. Astrachanská oblasť

11. Volgogradská oblasť

12. Rostovská oblasť

  • 1. Vypočítajte maticu párových korelačných koeficientov; hodnotiť štatistickú významnosť korelačných koeficientov.
  • 2. Zostavte korelačné pole výsledného znaku a najbližšie súvisiaceho faktora.
  • 3. Vypočítajte parametre lineárnej párovej regresie pre každý faktor X..
  • 4. Vyhodnoťte kvalitu každého modelu pomocou koeficientu determinácie, priemernej chyby aproximácie a Fisherovho F-testu. Vyberte si najlepší model.

bude 80 % svojej maximálnej hodnoty. Prezentujte graficky: skutočné a modelové hodnoty, predpovedané body.

  • 6. Pomocou postupnej viacnásobnej regresie (metóda vylúčenia alebo metóda inklúzie) zostavte model tvorby cien bytov v dôsledku významných faktorov. Uveďte ekonomickú interpretáciu koeficientov regresného modelu.
  • 7. Zhodnoťte kvalitu postaveného modelu. Zlepšila sa kvalita modelu v porovnaní s jednofaktorovým modelom? Uveďte posúdenie vplyvu významných faktorov na výsledok pomocou koeficientov elasticity, v - a -? koeficienty.

Pri riešení tohto problému vykonáme výpočty a vykresľovanie grafov a tabuliek pomocou nastavení Excelu Analýza údajov.

1. Vypočítajte maticu párových korelačných koeficientov a vyhodnoťte štatistickú významnosť korelačných koeficientov

V dialógovom okne Korelácia zadajte do poľa Interval vstupu rozsah buniek obsahujúcich zdrojové údaje. Keďže sme vybrali aj nadpisy stĺpcov, zaškrtneme políčko Označenia v prvom riadku.

Získali sme nasledujúce výsledky:

Tabuľka 1.1 Matica párových korelačných koeficientov

Analýza matice párových korelačných koeficientov ukazuje, že závislá premenná Y, teda hrubý regionálny produkt, má užší vzťah s X1 (investície do fixného kapitálu). Korelačný koeficient je 0,936. To znamená, že závislá premenná Y (hrubý regionálny produkt) je z 93,6 % závislá od X1 (investície do fixných aktív).

Štatistická významnosť korelačných koeficientov sa určí pomocou Studentovho t-testu. Tabuľková hodnota sa porovnáva s vypočítanými hodnotami.

Vypočítajme tabuľkovú hodnotu pomocou funkcie STUDRIST.

t tabuľka = 0,129 s úrovňou spoľahlivosti 0,9 a stupňom voľnosti (n-2).

Faktor X1 je štatisticky významný.

2. Zostrojme pole korelácie efektívneho znaku (hrubý regionálny produkt) a najbližšie súvisiaceho faktora (investície do fixného kapitálu)

Na to použijeme nástroj na zostavenie bodového grafu v Exceli.

V dôsledku toho získame pole korelácie ceny hrubého regionálneho produktu, miliardy rubľov. a investície do fixného kapitálu, miliardy rubľov. (Obrázok 1.1.).

Obrázok 1.1

3. Vypočítajte parametre lineárnej párovej regresie pre každý faktor X

Na výpočet parametrov lineárnej párovej regresie použijeme nástroj Regresia, ktorý je súčasťou nastavenia Analýza údajov.

V dialógovom okne Regresia zadajte do poľa Vstupný interval Y adresu rozsahu buniek, ktoré predstavujú závislú premennú. V teréne

Vstupný interval X zadávame adresu rozsahu, ktorý obsahuje hodnoty nezávislých premenných. Vypočítajme parametre párovej regresie pre faktor X.

Pre X1 sa získali nasledujúce údaje uvedené v tabuľke 1.2:

Tabuľka 1.2

Regresná rovnica pre závislosť ceny hrubého regionálneho produktu od investícií do fixného kapitálu má tvar:

4. Vyhodnoťme kvalitu každého modelu prostredníctvom koeficientu determinácie, priemernej chyby aproximácie a Fisherovho F-kritéria. Poďme zistiť, ktorý model je najlepší.

Koeficient determinácie, priemerná chyba aproximácie, sme získali ako výsledok výpočtov vykonaných v odseku 3. Získané údaje sú uvedené v nasledujúcich tabuľkách:

Údaje pre X1:

Tabuľka 1.3a

Tabuľka 1.4b

A) Koeficient determinácie určuje, aký podiel variácie atribútu Y je v modeli zohľadnený a je spôsobený vplyvom faktora X naňho. Čím väčšia je hodnota koeficientu determinácie, tým je vzťah užší. medzi atribútmi v konštruovanom matematickom modeli.

V Exceli je R-štvorec označený.

Na základe tohto kritéria je najvhodnejší model regresnej rovnice pre závislosť ceny hrubého regionálneho produktu od investícií do fixných aktív (X1).

B) Vypočítajte priemernú chybu aproximácie pomocou vzorca:

kde čitateľ je súčet štvorcových odchýlok vypočítaných hodnôt od skutočných. V tabuľkách je v stĺpci SS, riadok Zostatky.

Priemernú hodnotu ceny bytu vypočítame v Exceli pomocou funkcie PRIEMER. = 24,18182 miliárd rubľov

Pri vykonávaní ekonomických výpočtov sa model považuje za dostatočne presný, ak je priemerná chyba aproximácie menšia ako 5 %, model sa považuje za prijateľný, ak je priemerná chyba aproximácie menšia ako 15 %.

Podľa tohto kritéria je najvhodnejší matematický model pre regresnú rovnicu závislosti ceny hrubého regionálneho produktu od investícií do fixných aktív (X1).

C) Na testovanie významnosti regresného modelu sa používa F-test. Na tento účel sa porovnávajú aj kritické (tabuľkové) hodnoty Fisherovho F-testu.

Vypočítané hodnoty sú uvedené v tabuľkách 1.4b (označené písmenom F).

Tabuľková hodnota Fisherovho F-testu sa vypočíta v Exceli pomocou funkcie FDISP. Berieme pravdepodobnosť 0,05. Prijaté: = 4,75

Vypočítané hodnoty Fisherovho F-testu pre každý faktor sú porovnateľné s tabuľkovou hodnotou:

71,02 > = 4,75 model je podľa tohto kritéria primeraný.

Po analýze údajov pre všetky tri kritériá môžeme konštatovať, že najlepší je matematický model zostavený pre faktor hrubého regionálneho produktu, ktorý je opísaný lineárnou rovnicou

5. Pre zvolený model závislosti ceny hrubého regionálneho produktu

priemernú hodnotu ukazovateľa predikujeme na hladine významnosti, ak je predikovaná hodnota faktora 80 % jeho maximálnej hodnoty. Znázornime graficky: skutočné a modelové hodnoty, predpovedné body.

Vypočítajte predpokladanú hodnotu X, podľa podmienky to bude 80% maximálnej hodnoty.

Vypočítajte X max v Exceli pomocou funkcie MAX.

0,8 *52,8 = 42,24

Na získanie prediktívnych odhadov závislej premennej dosadíme získanú hodnotu nezávislej premennej do lineárnej rovnice:

5,07 + 2,14 * 42,24 \u003d 304,55 miliárd rubľov.

Stanovme interval spoľahlivosti prognózy, ktorý bude mať nasledujúce hranice:

Na výpočet intervalu spoľahlivosti pre predpovedanú hodnotu vypočítame odchýlku od regresnej priamky.

Pre párový regresný model sa vypočíta hodnota odchýlky:

tie. hodnota štandardnej chyby z tabuľky 1.5a.

(Keďže počet stupňov voľnosti je rovný jednej, menovateľ sa bude rovnať n-2). korelácia párová regresná predpoveď

Na výpočet koeficientu použijeme excelovskú funkciu STUDRASP, pravdepodobnosť bude rovná 0,1, počet stupňov voľnosti je 38.

Vypočítame hodnotu pomocou Excelu, dostaneme 12294.


Definujme hornú a dolnú hranicu intervalu.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Predpovedaná hodnota = 304,55 tisíc dolárov bude teda medzi dolnou hranicou, teda 277,078 tisíc dolárov. a horná hranica rovná 332,022 miliardy rubľov. Rub.

Aktuálne a modelové hodnoty, prognózované body sú graficky znázornené na obrázku 1.2.


Obrázok 1.2

6. Pomocou postupnej viacnásobnej regresie (metóda vylúčenia) zostavíme model tvorby ceny hrubého regionálneho produktu vplyvom významných faktorov.

Na zostavenie viacnásobnej regresie použijeme funkciu Excel Regression vrátane všetkých faktorov v nej. Získame tak výsledkové tabuľky, z ktorých potrebujeme Studentov t-test.

Tabuľka 1.8a

Tabuľka 1.8b

Tabuľka 1.8c.

Získame model zobrazenia:

Pretože< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Zvolíme najmenšiu modulo hodnotu Studentovho t-testu, rovná sa 8,427, porovnajme s tabuľkovou hodnotou, ktorú vypočítame v Exceli, zoberme hladinu významnosti 0,10, počet stupňov voľnosti n-m-1=12- 4=8:=1,8595

Keďže 8.427>1.8595 by mal byť model uznaný ako primeraný.

7. Na vyhodnotenie významného faktora získaného matematického modelu vypočítame koeficienty pružnosti, a - koeficienty

Koeficient elasticity ukazuje, o koľko percent sa zmení výsledné znamienko, keď sa znamienko faktora zmení o 1%:

E X4 \u003d 2,137 * (10,69 / 24,182) \u003d 0,94 %

To znamená, že pri zvýšení investície do fixného kapitálu o 1 % sa náklady zvýšia v priemere o 0,94 %.

Koeficient ukazuje, o akú časť hodnoty smerodajnej odchýlky sa zmení priemerná hodnota závislej premennej pri zmene nezávislej premennej o jednu smerodajnú odchýlku.

2,137* (14.736/33,632) = 0,936.

Údaje o smerodajnej odchýlke sú prevzaté z tabuliek získaných pomocou nástroja Descriptive Statistics.

Tabuľka 1.11 Opisná štatistika (Y)

Tabuľka 1.12 Opisná štatistika (X4)

Koeficient určuje podiel vplyvu faktora na celkovom vplyve všetkých faktorov:

Na výpočet párových korelačných koeficientov vypočítame maticu párových korelačných koeficientov v Exceli pomocou nástroja Korelácia v nastaveniach Analýza údajov.

Tabuľka 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Záver: Na základe získaných výpočtov môžeme konštatovať, že efektívny atribút Y (hrubý regionálny produkt) je vysoko závislý od faktora X1 (investície do fixného kapitálu) (o 100 %).

Bibliografia

  • 1. Magnus Ya.R., Katyshev P.K., Peresetsky A.A. Ekonometria. Úvodný kurz. Návod. 2. vyd. - M.: Delo, 1998. - s. 69 - 74.
  • 2. Workshop z ekonometrie: Učebnica / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko a ďalší 2002. - s. 49 - 105.
  • 3. Dougerty K. Úvod do ekonometrie: Per. z angličtiny. - M.: INFRA-M, 1999. - XIV, s. 262 - 285.
  • 4. Aivyzyan S.A., Mikhtiryan V.S. Aplikovaná matematika a základy ekonometrie. -1998., s. 115-147.
  • 5. Kremer N.Sh., Putko B.A. Ekonometria. -2007. od 175-251.
r X (1) X (2) X (3) X (4) X (5)
r 1.00 0.43 0.37 0.40 0.58 0.33
X (1) 0.43 1.00 0.85 0.98 0.11 0.34
X (2) 0.37 0.85 1.00 0.88 0.03 0.46
X (3) 0.40 0.98 0.88 1.00 0.03 0.28
X (4) 0.58 0.11 0.03 0.03 1.00 0.57
X (5) 0.33 0.34 0.46 0.28 0.57 1.00

Analýza matice párových korelačných koeficientov ukazuje, že s ukazovateľom najviac súvisí ukazovateľ výkonnosti X(4) - množstvo použitých hnojív na 1 ha ().

Zároveň je vzťah medzi vlastnosťami-argumentmi dosť blízky. Takže medzi počtom kolesových traktorov prakticky existuje funkčný vzťah ( X(1)) a počet nástrojov na povrchové obrábanie pôdy .

Prítomnosť multikolinearity dokazujú aj korelačné koeficienty a . Vzhľadom na úzky vzťah ukazovateľov X (1) , X(2) a X(3) len jeden z nich môže vstúpiť do modelu výnosovej regresie.

Ak chcete demonštrovať negatívny vplyv multikolinearity, zvážte model regresie výnosov zahŕňajúci všetky vstupy:

Návleky = 121.

V zátvorkách sú hodnoty opravených odhadov štandardných odchýlok odhadov koeficientov rovnice .

Pod regresnou rovnicou sú uvedené nasledujúce parametre primeranosti: viacnásobný koeficient determinácie; opravený odhad reziduálneho rozptylu, priemerná relatívna chyba aproximácie a vypočítaná hodnota kritéria Fob = 121.

Regresná rovnica je významná, pretože F obl = 121 > F kp = 2,85 zistené z tabuľky F- distribúcie pri a=0,05; n1=6 a n2=14.

Z toho vyplýva, že Q¹0, t.j. a aspoň jeden z koeficientov rovnice q j (j= 0, 1, 2, ..., 5) sa nerovná nule.

Na testovanie hypotézy o významnosti jednotlivých regresných koeficientov H0: q j =0, kde j=1,2,3,4,5, porovnajte kritickú hodnotu t kp = 2,14, zistené z tabuľky t-rozdelenia na hladine významnosti a=2 Q=0,05 a počet stupňov voľnosti n=14, s vypočítanou hodnotou . Z rovnice vyplýva, že regresný koeficient je štatisticky významný len vtedy, keď X(4) od ½ t 4½ = 2,90 > t kp = 2,14.



Negatívne znamienka regresných koeficientov at X(1) a X(5) . Zo záporných hodnôt koeficientov vyplýva, že zvýšenie saturácie poľnohospodárstva kolesovými traktormi ( X(1)) a prípravky na ochranu rastlín ( X(5) negatívne ovplyvňuje výnos. Výsledná regresná rovnica je teda neprijateľná.

Na získanie regresnej rovnice s významnými koeficientmi používame algoritmus regresnej analýzy krok za krokom. Spočiatku používame krokový algoritmus s elimináciou premenných.

Vylúčte premennú z modelu X(1) , čo zodpovedá minimálnej absolútnej hodnote ½ t 1½ = 0,01. Pre zvyšné premenné opäť zostavíme regresnú rovnicu:

Výsledná rovnica je významná, pretože F obs = 155 > F kp = 2,90, zistené na hladine významnosti a=0,05 a počtoch stupňov voľnosti n 1 =5 a n 2 =15 podľa tabuľky F-distribúcie, t.j. vektor q¹0. V rovnici je však významný iba regresný koeficient X(4) . Vypočítané hodnoty ½ t j ½ pre ostatné koeficienty menšie ako t kr = 2,131 nájdených v tabuľke t-rozdelenia pre a=2 Q= 0,05 an = 15.

Vylúčenie premennej z modelu X(3) , ktorá zodpovedá minimálnej hodnote t 3 = 0,35 a získajte regresnú rovnicu:

(2.9)

Vo výslednej rovnici to nie je štatisticky významné a nemôžeme ekonomicky interpretovať koeficient pri X(5) . Nepočítajúc X(5) dostaneme regresnú rovnicu:

(2.10)

Získali sme zmysluplnú regresnú rovnicu so zmysluplnými a interpretovateľnými koeficientmi.

Výsledná rovnica však nie je jediným „dobrým“ alebo „najlepším“ výnosovým modelom v našom príklade.

Ukážme to v podmienkach multikolinearity je efektívnejší krokový algoritmus so zahrnutím premenných. Prvý krok vo výnosovom modeli r obsahuje premennú X(4) , ktorý má najvyšší korelačný koeficient s r, vysvetlené premennou - r(r,X(4)) = 0,58. V druhom kroku vrátane rovnice spolu s X(4) premenné X(1) alebo X(3) dostaneme modely, ktoré sú lepšie ako (2.10) z ekonomických dôvodov a štatistických charakteristík:

(2.11)

(2.12)

Zahrnutie ktorejkoľvek z troch zostávajúcich premenných do rovnice zhoršuje jej vlastnosti. Pozri napríklad rovnicu (2.9).

Máme teda tri „dobré“ výnosové modely, z ktorých si jeden musí vybrať z ekonomických a štatistických dôvodov.

Podľa štatistických kritérií je najvhodnejší model (2.11). Zodpovedá minimálnym hodnotám reziduálneho rozptylu = 2,26 a priemernej relatívnej aproximačnej chybe a najväčším hodnotám a FOB = 273.

O niečo horšie ukazovatele primeranosti má model (2.12) a potom model (2.10).

Teraz vyberieme to najlepšie z modelov (2.11) a (2.12). Tieto modely sa navzájom líšia premennými X(1) a X(3). Vo výnosových modeloch však premenná X(1) (počet kolesových traktorov na 100 ha) je vhodnejšie ako variabilné X(3) (počet nástrojov na povrchové obrábanie pôdy na 100 ha), ktorý je do istej miery sekundárny (alebo odvodený od X (1)).

V tejto súvislosti by sa mal z ekonomických dôvodov uprednostniť model (2.12). Po implementácii algoritmu postupnej regresnej analýzy so zahrnutím premenných a zohľadnením skutočnosti, že do rovnice by mala vstúpiť iba jedna z troch súvisiacich premenných ( X (1) , X(2) alebo X(3)) vyberte konečnú regresnú rovnicu:

Rovnica je významná pri a=0,05, pretože F obl = 266 > F kp = 3,20 zistené z tabuľky F-distribúcie pre a= Q=0,05; n1=3 a n2=17. Všetky regresné koeficienty sú významné aj v rovnici ½ t j½> t kp (a=2 Q=0,05; n = 17) = 2,11. Regresný koeficient q 1 by sa mal z ekonomických dôvodov považovať za významný (q 1 ¹0). t 1 = 2,09 len o niečo menej t kp = 2,11.

Z regresnej rovnice vyplýva, že nárast počtu traktorov na jednotku na 100 hektárov ornej pôdy (s pevnou hodnotou X(4)) vedie k zvýšeniu úrody zrna v priemere o 0,345 c/ha.

Približný výpočet koeficientov elasticity e 1 "0,068 a e 2" 0,161 ukazuje, že s nárastom ukazovateľov X(1) a X(4) o 1 %, úroda zrna sa zvyšuje v priemere o 0,068 % a 0,161 %.

Viacnásobný koeficient determinácie naznačuje, že iba 46,9 % variácií výnosov je vysvetlených ukazovateľmi zahrnutými v modeli ( X(1) a X(4), teda nasýtenie rastlinnej výroby traktormi a hnojivami. Zvyšok variácií je spôsobený pôsobením nezohľadnených faktorov ( X (2) , X (3) , X(5) , poveternostné podmienky atď.). Priemerná relatívna chyba aproximácie charakterizuje adekvátnosť modelu, ako aj hodnotu reziduálneho rozptylu . Pri interpretácii regresnej rovnice sú zaujímavé hodnoty relatívnych aproximačných chýb . Pripomeňme, že - modelová hodnota efektívneho ukazovateľa charakterizuje priemernú hodnotu produktivity pre všetky uvažované oblasti za predpokladu, že hodnoty vysvetľujúcich premenných X(1) a X(4) stanovená na rovnakej úrovni, tj X (1) = x i(1) a X (4) = x i(4) . Potom pre hodnoty d i výnosy sa dajú porovnať. Oblasti, ktoré zodpovedajú hodnotám d i>0, majú nadpriemerný výnos a d i<0 - ниже среднего.

V našom príklade je rastlinná výroba najefektívnejšia v oblasti zodpovedajúcej d 7 \u003d 28%, kde je výnos o 28% vyšší ako priemer v regióne a najmenej efektívny - v oblasti s d 20 =-27,3%.


Úlohy a cvičenia

2.1. Od bežnej populácie ( r, X (1) , ..., X p)), kde r má zákon normálneho rozdelenia s podmieneným matematickým očakávaním a rozptylom s 2, náhodná vzorka objemu n, nechaj to tak ( y i, x i (1) , ..., x i(p)) - výsledok i pozorovanie ( i=1, 2, ..., n). Určte: a) matematické očakávanie odhadu vektora metódou najmenších štvorcov q; b) kovariančná matica odhadu vektora pomocou najmenších štvorcov q; c) matematické očakávanie odhadu.

2.2. Podľa podmienky úlohy 2.1 nájdite matematické očakávanie súčtu kvadrátov odchýlok v dôsledku regresie, t.j. EQ R, Kde

.

2.3. Podľa podmienky úlohy 2.1 určte matematické očakávanie súčtu štvorcových odchýlok v dôsledku reziduálnej variácie vzhľadom na regresné priamky, t.j. EQ ost kde

2.4. Dokážte, že podľa hypotézy Н 0: q=0 je štatistika

má F-rozdelenie so stupňami voľnosti n 1 =p+1 a n 2 = n-p-1.

2.5. Dokážte, že pri splnení hypotézy H 0: q j =0 má štatistika t-rozdelenie s počtom stupňov voľnosti n=n-p-1.

2.6. Na základe údajov (tabuľka 2.3) o závislosti zmrštenia kŕmneho chleba ( r) o dobe skladovania ( X) nájsť bodový odhad podmieneného matematického očakávania za predpokladu, že všeobecná regresná rovnica je lineárna.

Tabuľka 2.3.

Je potrebné: a) nájsť odhady a zvyškový rozptyl s 2 za predpokladu, že všeobecná regresná rovnica má tvar ; b) skontrolujte pre a=0,05 významnosť regresnej rovnice, t.j. hypotéza H0: q=0; c) so spoľahlivosťou g=0,9 určte intervalové odhady parametrov q 0 , q 1 ; d) so spoľahlivosťou g=0,95 určte intervalový odhad podmieneného očakávania pre X 0 = 6; e) určte pri g=0,95 interval spoľahlivosti predpovede v bode X=12.

2.7. Na základe údajov o dynamike tempa rastu ceny akcie za 5 mesiacov uvedených v tabuľke. 2.4.

Tabuľka 2.4.

mesiace ( X)
r (%)

a za predpokladu, že všeobecná regresná rovnica má tvar , je potrebné: a) určiť odhady a parametre regresnej rovnice a reziduálny rozptyl s 2 ; b) skontrolujte pri a=0,01 významnosť regresného koeficientu, t.j. hypotézy H0: q1=0;

c) so spoľahlivosťou g=0,95 nájdite intervalové odhady parametrov q 0 a q 1 ; d) so spoľahlivosťou g = 0,9 stanovte intervalový odhad podmieneného matematického očakávania pre X 0 = 4; e) určte pri g=0,9 interval spoľahlivosti predpovede v bode X=5.

2.8. Výsledky štúdia dynamiky prírastku hmotnosti u mladých zvierat sú uvedené v tabuľke 2.5.

Tabuľka 2.5.

Za predpokladu, že všeobecná regresná rovnica je lineárna, je potrebné: a) určiť odhady a parametre regresnej rovnice a reziduálny rozptyl s 2 ; b) skontrolujte pre a=0,05 významnosť regresnej rovnice, t.j. hypotézy Ho: q=0;

c) so spoľahlivosťou g=0,8 nájsť intervalové odhady parametrov q 0 a q 1 ; d) so spoľahlivosťou g=0,98 určte a porovnajte intervalové odhady podmieneného matematického očakávania pre X 0 = 3 a X 1 =6;

e) určte pri g=0,98 interval spoľahlivosti predpovede v bode X=8.

2.9. Nákladová cena ( r) jeden výtlačok knihy v závislosti od nákladu ( X) (tis. výtlačkov) charakterizujú údaje zozbierané vydavateľstvom (tabuľka 2.6). Určte odhady najmenších štvorcov a parametre hyperbolickej regresnej rovnice so spoľahlivosťou g=0,9 vytvorte intervaly spoľahlivosti pre parametre q 0 a q 1 , ako aj podmienené matematické očakávanie pri X=10.

Tabuľka 2.6.

Určte odhady a parametre regresnej rovnice typu X=20.

2.11. V tabuľke. 2.8 vykázali miery rastu (%) nasledujúcich makroekonomických ukazovateľov n\u003d 10 rozvinutých krajín sveta za rok 1992: HNP - X(1) , priemyselná výroba - X(2) , cenový index - X (3) .

Tabuľka 2.8.

krajiny x a parametre regresnej rovnice, odhad reziduálneho rozptylu; b) skontrolujte pri a=0,05 významnosť regresného koeficientu, t.j. H°: qi=0; c) so spoľahlivosťou g=0,9 nájdite intervalové odhady q 0 a q 1 ; d) nájdite pri g=0,95 interval spoľahlivosti pre bod X 0 =x i, Kde i=5; e) porovnajte štatistické charakteristiky regresných rovníc: 1, 2 a 3.

2.12. Vyriešte problém 2.11, pričom hodnotu vysvetlite ( pri) index X(1) a na vysvetlenie ( X) premenná X (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Aplikovaná štatistika a základy ekonometrie: učebnica. M., UNITI, 1998 (2. vydanie, 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Aplikovaná štatistika v úlohách a cvičeniach: učebnica. M. JEDNOTA - DANA, 2001;

3. Aivazyan S.A., Enyukov I.S., Meshalkin L.D. Aplikovaná štatistika. Výskum závislosti. M., Financie a štatistika, 1985, 487 s.;

4. Aivazyan S.A., Buchstaber V.M., Enyukov I.S., Meshalkin L.D. Aplikovaná štatistika. Klasifikácia a redukcia rozmerov. M., Financie a štatistika, 1989, 607 s.;

5. Johnston J. Ekonometrické metódy, Moskva: Štatistika, 1980, 446 s.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Viacrozmerné štatistické metódy. M., Financie a štatistika, 2000;

7. Mkhitaryan V.S., Troshin L.I. Výskum závislostí metódami korelácie a regresie. M., MESI, 1995, 120 strán;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Viacrozmerné štatistické metódy v ekonómii. M., MESI, 1995, 149 s.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Matematické štatistiky pre obchodníkov a manažérov. M., MESI, 2000, 140. roky;

10. Lukashin Yu.I. Metódy regresie a adaptívneho prognózovania: Učebnica, M., MESI, 1997.

11. Lukashin Yu.I. Adaptívne metódy krátkodobej prognózy. - M., Štatistika, 1979.


APPS


Príloha 1. Možnosti úloh pre nezávislý počítačový výskum.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov