Je uvedená matica párových korelačných koeficientov. Konštrukcia matice párových korelačných koeficientov

Z 1 (t)

Z 2 (t)

t

y(t)

Z 1 (t)

Z 2 (t)

t

y(t)

Hlavnou úlohou pri výbere faktorov zahrnutých do korelačného modelu je zaviesť do analýzy všetky hlavné faktory ovplyvňujúce úroveň skúmaného javu. Zavedenie veľkého množstva faktorov do modelu je však nepraktické, správnejšie je vybrať len relatívne malý počet hlavných faktorov, ktoré sú pravdepodobne v korelácii s vybraným funkčným ukazovateľom.

Dá sa to urobiť pomocou takzvaného dvojstupňového výberu. V súlade s ním sú do modelu zahrnuté všetky vopred zvolené faktory. Potom sa medzi nimi na základe špeciálneho kvantitatívneho hodnotenia a dodatočnej kvalitatívnej analýzy identifikujú nevýznamne ovplyvňujúce faktory, ktoré sa postupne vyraďujú, až kým nezostanú tie, pri ktorých možno tvrdiť, že dostupný štatistický materiál je v súlade s hypotézou ich spojenia. významný vplyv na závislú premennú so zvolenou formou spojenia.

Dvojstupňový výber dostal svoje najkompletnejšie vyjadrenie v technike tzv. viackrokovej regresnej analýzy, pri ktorej dochádza k eliminácii nedôležitých faktorov na základe ukazovateľov ich významnosti, najmä na základe hodnoty t f - vypočítaná hodnota Študentovho testu.

Vypočítajme t f pomocou nájdených párových korelačných koeficientov a porovnajme ich s t kritickým pre 5% hladinu významnosti (obojstranná) a 18 stupňov voľnosti (ν = n-2).

kde r je hodnota párového korelačného koeficientu;

n – počet pozorovaní (n=20)

Pri porovnaní t f pre každý koeficient s t kr = 2,101 zistíme, že zistené koeficienty sa považujú za významné, pretože t f > t kr.

t f pre r yx 1 = 2, 5599 ;

t f pre r yx 2 = 7,064206 ;

t f pre r yx 3 = 2,40218 ;

tf pre r x1 x 2 = 4,338906 ;

tf pre r x1 x 3 = 15,35065;

tf pre r x2 x 3 = 4,749981

Pri výbere faktorov, ktoré sa majú zahrnúť do analýzy, sú na ne kladené špecifické požiadavky. V prvom rade musia byť ukazovatele vyjadrujúce tieto faktory kvantifikovateľné.

Faktory zahrnuté v modeli by nemali byť vo funkčnom alebo úzkom vzťahu medzi sebou. Prítomnosť takýchto vzťahov je charakterizovaná multikolinearitou.

Multikolinearita naznačuje, že niektoré faktory charakterizujú rovnakú stránku skúmaného javu. Preto je ich súčasné zaradenie do modelu nepraktické, keďže sa do určitej miery navzájom duplikujú. Ak neexistujú žiadne špeciálne predpoklady hovoriace v prospech jedného z týchto faktorov, treba dať prednosť jednému z nich, ktorý sa vyznačuje veľkým koeficientom párovej (alebo čiastočnej) korelácie.

Predpokladá sa, že limitnou hodnotou je hodnota korelačného koeficientu medzi týmito dvoma faktormi, ktorá sa rovná 0,8.

Multikolinearita zvyčajne vedie k degenerácii matice premenných a následne k tomu, že hlavný determinant znižuje svoju hodnotu a v limite sa blíži k nule. Odhady koeficientov regresnej rovnice sa stávajú vysoko závislými od presnosti nájdenia počiatočných údajov a pri zmene počtu pozorovaní dramaticky menia ich hodnoty.

Matica párových korelačných koeficientov

Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945

Uzly matice obsahujú párové korelačné koeficienty, ktoré charakterizujú blízkosť vzťahu medzi faktorovými charakteristikami. Pri analýze týchto koeficientov si všimneme, že čím väčšia je ich absolútna hodnota, tým väčší je vplyv zodpovedajúceho znamienka faktora na výsledný koeficient. Analýza výslednej matrice sa vykonáva v dvoch fázach:

1. Ak prvý stĺpec matice obsahuje korelačné koeficienty, pre ktoré /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Pri analýze párových korelačných koeficientov faktorových charakteristík medzi sebou, (r XiXj), charakterizujúcich blízkosť ich vzťahu, je potrebné posúdiť ich vzájomnú nezávislosť, keďže je to nevyhnutná podmienka pre ďalšiu regresnú analýzu. Vzhľadom na to, že v ekonomike neexistujú absolútne nezávislé znaky, je potrebné podľa možnosti vyčleniť tie najsamostatnejšie. Faktorové znaky, ktoré sú navzájom v úzkej korelácii, sa nazývajú multikolineárne. Zahrnutie multikolineárnych charakteristík do modelu znemožňuje ekonomickú interpretáciu regresného modelu, pretože zmena jedného faktora so sebou nesie zmenu faktorov s ním spojených, čo môže viesť k „rozpadu“ modelu ako celku.

Kritérium multikoleniality faktorov je nasledovné:

/r XiXj / > 0,8

Vo výslednej matici párových korelačných koeficientov toto kritérium spĺňajú dva ukazovatele umiestnené v priesečníku riadkov A . Z každej dvojice týchto prvkov musí byť v modeli ponechaná jedna, tá by mala mať väčší vplyv na výslednú vlastnosť. V dôsledku toho sú faktory a z modelu vylúčené, t.j. tempo rastu nákladov na predaný tovar a tempo rastu jeho objemu predaja.

Takže do regresného modelu zavedieme faktory X1 a X2.

Ďalej sa vykoná regresná analýza (servis, analýza dát, regresia). Opäť je zostavená tabuľka počiatočných údajov s faktormi X1 a X2. Regresia sa vo všeobecnosti používa na analýzu vplyvu hodnôt nezávislých premenných (faktorov) na samostatnú závislú premennú a umožňuje reprezentovať koreláciu medzi charakteristikami vo forme určitej funkčnej závislosti nazývanej regresná rovnica alebo korelačná regresia. Model.

Ako výsledok regresnej analýzy získame výsledky výpočtu multivariačnej regresie. Analyzujme získané výsledky.

Všetky regresné koeficienty sú signifikantné podľa Studentovho t testu. Viacnásobný korelačný koeficient R bol 0,925, druhá mocnina tejto hodnoty (koeficient determinácie) znamená, že v priemere 85,5 % variácií efektívnej charakteristiky je vysvetlených variáciou faktorových charakteristík zahrnutých v modeli. Koeficient determinizmu charakterizuje úzky vzťah medzi súborom faktorových charakteristík a efektívnym ukazovateľom. Čím je hodnota R-štvorca bližšie k 1, tým silnejší je vzťah. V našom prípade indikátor rovný 0,855 indikuje správny výber faktorov a prítomnosť vzťahu medzi faktormi a efektívnym indikátorom.

Uvažovaný model je adekvátny, keďže vypočítaná hodnota Fisherovho F-kritéria výrazne prevyšuje jeho tabuľkovú hodnotu (F obl = 52,401; F tabl = 1,53).

Ako všeobecný výsledok vykonanej korelačno-regresnej analýzy existuje viacnásobná regresná rovnica, ktorá má tvar:

Výsledná regresná rovnica spĺňa účel korelačno-regresnej analýzy a je lineárnym modelom závislosti bilančného zisku podniku od dvoch faktorov: koeficientu rastu produktivity práce a koeficientu priemyselného vlastníctva.

Na základe získaného modelu môžeme konštatovať, že pri zvýšení úrovne produktivity práce o 1 % v porovnaní s úrovňou predchádzajúceho obdobia sa výška bilančného zisku zvýši o 0,95 percentuálneho bodu; zvýšenie koeficientu priemyselného vlastníctva o 1 % povedie k zvýšeniu efektívneho ukazovateľa o 27,9 percentuálneho bodu. Dominantný vplyv na rast bilančného zisku má preto zvyšovanie hodnoty majetku na výrobné účely (obnova a rast fixných aktív podniku).

Pomocou viacnásobného regresného modelu sa vykonáva multifaktoriálna predpoveď efektívnej charakteristiky. Nech je známe, že X1 = 3,0 a X3 = 0,7. Dosadíme do modelu hodnoty faktorových charakteristík, dostaneme Control = 0,95*3,0 + 27,9*0,7 – 19,4 = 2,98. So zvýšením produktivity práce a modernizáciou dlhodobého majetku v podniku sa tak bilančný zisk v 1. štvrťroku 2005 v porovnaní s predchádzajúcim obdobím (IV. štvrťrok 2004) zvýši o 2,98 %.

Ekonomické údaje predstavujú kvantitatívne charakteristiky akýchkoľvek ekonomických objektov alebo procesov. Vznikajú pod vplyvom mnohých faktorov, z ktorých nie všetky sú prístupné vonkajšej kontrole. Nekontrolovateľné faktory môžu nadobudnúť náhodné hodnoty z nejakej množiny hodnôt a tým spôsobiť, že údaje, ktoré definujú, sú náhodné. Jednou z hlavných úloh ekonomického výskumu je analýza závislostí medzi premennými.

Pri zvažovaní závislostí medzi charakteristikami je potrebné rozlišovať predovšetkým dva typy spojení:

  • funkčný - sú charakterizované úplnou zhodou medzi zmenou charakteristiky faktora a zmenou výslednej hodnoty: Každá hodnota faktorovej charakteristiky zodpovedá veľmi špecifickým hodnotám výslednej charakteristiky. Tento typ vzťahu je vyjadrený ako vzorecový vzťah. Funkčná závislosť môže spájať efektívnu charakteristiku s jednou alebo viacerými faktorovými charakteristikami. Výška mzdy pri časovej mzde teda závisí od počtu odpracovaných hodín;
  • korelačné- medzi zmenou dvoch znakov nie je úplná zhoda, vplyv jednotlivých faktorov sa prejavuje len priemerne, pri hromadnom sledovaní aktuálnych údajov. Súčasný vplyv veľkého množstva rôznych faktorov na študovaný znak vedie k tomu, že jedna a tá istá hodnota faktorovej charakteristiky zodpovedá celému rozdeleniu hodnôt výslednej charakteristiky, pretože v každom konkrétnom prípade môžu iné charakteristiky faktorov zmeniť silu a smer ich vplyvu.

Je potrebné mať na pamäti, že ak existuje funkčný vzťah medzi charakteristikami, je možné pri znalosti hodnoty faktorovej charakteristiky presne určiť hodnotu výsledného znamienka. Len za prítomnosti korelačnej závislosti trend zmeny vo výslednej charakteristike keď sa zmení hodnota faktorovej charakteristiky.

Pri štúdiu vzťahov medzi znakmi sú klasifikované podľa smeru, formy, počtu faktorov:

  • smerom k spoje sa delia na rovno A obrátene. Pri priamom spojení sa smer zmeny výslednej charakteristiky zhoduje so smerom zmeny faktorovej charakteristiky. Pri spätnej väzbe je smer zmeny výslednej charakteristiky opačný ako smer zmeny faktorovej charakteristiky. Napríklad, čím vyššia je kvalifikácia pracovníka, tým vyššia je úroveň produktivity jeho práce (priamy vzťah). Čím vyššia je produktivita práce, tým nižšie sú náklady na jednotku produkcie (spätná väzba);
  • podľa formy(typ funkcie) spoje sa delia na lineárne(priamočiare) a nelineárne(krivočiary). Lineárny vzťah je reprezentovaný priamkou, nelineárny vzťah krivkou (parabola, hyperbola atď.). V lineárnom vzťahu s rastom hodnoty faktorovej charakteristiky dochádza k rovnomernému rastu (poklesu) hodnoty výslednej charakteristiky;
  • počtom faktorov pôsobiacich na efektívnu charakteristiku, komunikácie sa delia na jednofaktorové(spárované) a multifaktoriálny.

Štúdium závislosti variácie znakov na podmienkach prostredia je obsahom korelačnej teórie.

Pri vykonávaní korelačnej analýzy sa celý súbor údajov považuje za súbor premenných (faktorov), z ktorých každá obsahuje P pozorovania.

Pri štúdiu vzťahu medzi dvoma faktormi sa zvyčajne označujú X=(x str x 2,...,x n) A Y= (y ( , y 2,..., y a).

Kovariancia - je to štatistické miera interakcie dve premenné. Napríklad kladná hodnota kovariancie výnosov dvoch cenných papierov naznačuje, že výnosy týchto cenných papierov majú tendenciu pohybovať sa jedným smerom.

Kovariancia medzi dvoma premennými X A Y vypočítané takto:

kde sú skutočné hodnoty premenných

X A G;

Ak náhodné premenné Chi Y nezávislý, teoretická kovariancia je nulová.

Kovariancia závisí od jednotiek, v ktorých sú premenné merané Hee Y, je to neštandardné množstvo. Preto merať pevnosť spojenia medzi dvoma premennými sa používa iná štatistika, nazývaná korelačný koeficient.

Pre dve premenné X A Y párový korelačný koeficient

je definovaný nasledovne:

Kde SSy- odhady rozptylov veličín Hee Y. Tieto odhady charakterizujú stupeň rozptylu hodnoty x (, x 2, ..., x n (y 1, y 2, y n) okolo vášho priemeru x (y v uvedenom poradí), alebo variabilita(variabilita) týchto premenných počas súboru pozorovaní.

Disperzia(odhad rozptylu) je určený vzorcom

Vo všeobecnom prípade, aby sa získal nezaujatý odhad rozptylu, súčet štvorcov by sa mal vydeliť počtom stupňov voľnosti odhadu (atď), Kde P - veľkosť vzorky, R - počet spojení superponovaných na vzorke. Keďže vzorka už bola raz použitá na určenie priemeru X, potom sa počet superponovaných väzieb v tomto prípade rovná jednej (p = 1) a počet stupňov voľnosti odhadu (t. j. počet nezávislých prvkov vzorky) sa rovná (P - 1).

Je prirodzenejšie merať stupeň rozptylu hodnôt premenných v rovnakých jednotkách, v ktorých sa meria samotná premenná. Tento problém rieši indikátor tzv smerodajná odchýlka (smerodajná odchýlka) alebo štandardná chyba premenlivý X(premenná Y) a určí sa pomerom

Členy v čitateli vzorca (3.2.1) vyjadrujú interakciu dvoch premenných a určujú znamienko korelácie (kladné alebo záporné). Ak napríklad existuje silný pozitívny vzťah medzi premennými (nárast jednej premennej, keď sa zvyšuje druhá), každý člen bude kladné číslo. Podobne, ak existuje silný negatívny vzťah medzi premennými, všetky výrazy v čitateli budú záporné čísla, výsledkom čoho bude negatívna korelačná hodnota.

Menovateľ výrazu pre párový korelačný koeficient [viď. vzorec (3.2.2)] jednoducho normalizuje čitateľa takým spôsobom, že korelačný koeficient sa ukáže ako ľahko interpretovateľné číslo, ktoré nemá rozmer a nadobúda hodnoty od -1 do +1.

Čitateľ výrazu pre korelačný koeficient, ktorý je pre neobvyklé jednotky ťažko interpretovateľný, je kovariancia HiU. Napriek tomu, že sa niekedy používa ako nezávislá charakteristika (napríklad v teórii financií na opis spoločnej zmeny cien akcií na dvoch burzách), je vhodnejšie použiť korelačný koeficient. Korelácia a kovariancia predstavujú v podstate rovnaké informácie, ale korelácia tieto informácie prezentuje vo vhodnejšej forme.

Na kvalitatívne posúdenie korelačného koeficientu sa používajú rôzne škály, najčastejšie Chaddockova škála. V závislosti od hodnoty korelačného koeficientu môže mať vzťah jedno z nasledujúcich hodnotení:

  • 0,1-0,3 - slabé;
  • 0,3-0,5 - viditeľné;
  • 0,5-0,7 - mierny;
  • 0,7-0,9 - vysoká;
  • 0,9-1,0 - veľmi vysoká.

Posúdenie miery blízkosti súvislosti pomocou korelačného koeficientu sa spravidla uskutočňuje na základe viac či menej obmedzených informácií o skúmanom jave. V tejto súvislosti je potrebné posúdiť významnosť koeficientu lineárnej korelácie, ktorý umožňuje rozšíriť závery na základe výsledkov vzorky na všeobecnú populáciu.

Hodnotenie významnosti korelačného koeficientu pre malé veľkosti vzorky sa vykonáva pomocou Studentovho 7-testu. V tomto prípade je skutočná (pozorovaná) hodnota tohto kritéria určená vzorcom

Hodnota / obs vypočítaná pomocou tohto vzorca sa porovnáva s kritickou hodnotou 7-kritéria, ktoré je prevzaté z tabuľky študentských /-testových hodnôt (pozri prílohu 2) s prihliadnutím na danú hladinu významnosti oc a počet stupňov voľnosti (P - 2).

Ak 7 obs > 7 tab, potom sa výsledná hodnota korelačného koeficientu považuje za významnú (t. j. nulová hypotéza hovoriaca o tom, že korelačný koeficient sa rovná nule je zamietnutá). A tak sa dospelo k záveru, že medzi skúmanými premennými existuje úzky štatistický vzťah.

Ak je hodnota g y x blízko nule, vzťah medzi premennými je slabý. Ak korelácia medzi náhodnými premennými:

  • kladné, potom keď sa jedna náhodná premenná zvyšuje, druhá má tendenciu v priemere stúpať;
  • negatívne, potom ako jedna náhodná premenná rastie, druhá má tendenciu v priemere klesať. Pohodlný grafický nástroj na analýzu spárovaných údajov je bodový diagram, ktorý predstavuje každé pozorovanie v priestore dvoch rozmerov zodpovedajúcich dvom faktorom. Nazýva sa aj bodový graf, ktorý zobrazuje súbor hodnôt dvoch charakteristík korelačné pole. Každý bod v tomto diagrame má súradnice x (. a y g Keď sa sila lineárneho vzťahu zvýši, body na grafe budú ležať bližšie k priamke a magnitúde G bude bližšie k jednote.

Koeficienty párovej korelácie sa používajú na meranie sily lineárnych vzťahov medzi rôznymi pármi znakov z ich množiny. Pre mnoho funkcií človek dostane matica párových korelačných koeficientov.

Nech celý súbor údajov pozostáva z premennej Y = =(y p y 2, ..., y p) A T premenné (faktory) X, z ktorých každý obsahuje P pozorovania. Variabilné hodnoty Y A X, obsiahnuté v sledovanej populácii sú zaznamenané v tabuľke (tabuľka 3.2.1).

Tabuľka 3.2.1

Variabilné

číslo

pozorovania

X TZ

X tp

Na základe údajov uvedených v tejto tabuľke vypočítajte matica párových korelačných koeficientov R, je symetrický okolo hlavnej uhlopriečky:


Analýza matice párových korelačných koeficientov sa využíva pri konštrukcii viacnásobných regresných modelov.

Jedna korelačná matica nedokáže úplne opísať závislosti medzi veličinami. V tomto ohľade multivariačná korelačná analýza zvažuje dva problémy:

  • 1. Určenie úzkeho vzťahu jednej náhodnej premennej k súhrnu ostatných premenných zahrnutých do analýzy.
  • 2. Určenie tesnej súvislosti medzi dvoma veličinami pri fixovaní alebo vylúčení vplyvu iných veličín.

Tieto problémy sú riešené pomocou viacnásobných a parciálnych korelačných koeficientov, resp.

Riešenie prvého problému (určenie úzkeho vzťahu jednej náhodnej premennej so súhrnom ostatných premenných zahrnutých do analýzy) sa vykonáva pomocou výberový viacnásobný korelačný koeficient podľa vzorca

Kde R- R[cm. vzorec (3.2.6)]; Rjj- algebraický doplnok prvku tej istej matice R.

Druhá mocnina viacnásobného korelačného koeficientu SCHj 2 j _j J+l m zvyčajne nazývaný selektívny viacnásobný koeficient determinácie; ukazuje, aký podiel variácie (náhodného rozptylu) skúmanej veličiny Xj vysvetľuje variácie zostávajúcich náhodných premenných X ( , X 2 ,..., X t.

Koeficienty viacnásobnej korelácie a determinácie sú kladné veličiny, nadobúdajúce hodnoty v rozsahu od 0 do 1. Pri aproximácii koeficientu R 2 k jednote, môžeme konštatovať, že vzťah medzi náhodnými premennými je blízky, ale nie o jeho smere. Koeficient viacnásobnej korelácie sa môže zvýšiť iba vtedy, ak sú do modelu zahrnuté ďalšie premenné, a nezvýši sa, ak sa vylúči niektorá z existujúcich charakteristík.

Kontrola významnosti koeficientu determinácie sa vykonáva porovnaním vypočítanej hodnoty Fisherovho /'-kritéria.

s tabuľkovým F rabl. Tabuľková hodnota kritéria (pozri prílohu 1) je určená danou hladinou významnosti a a stupňami voľnosti vl = mnv2 = n-m-l. Koeficient R 2 sa výrazne líši od nuly, ak nerovnosť platí

Ak sú uvažované náhodné premenné navzájom korelujú potom je hodnota párového korelačného koeficientu čiastočne ovplyvnená vplyvom iných veličín. V tejto súvislosti je potrebné študovať čiastočnú koreláciu medzi veličinami pri vylúčení vplyvu iných náhodných premenných (jednej alebo viacerých).

Vzorový koeficient parciálnej korelácie určený vzorcom

Kde R Jk , Rjj, R kk - algebraické doplnky k príslušným maticovým prvkom R[cm. vzorec (3.2.6)].

Parciálny korelačný koeficient, ako aj párový korelačný koeficient, sa pohybuje od -1 do +1.

Výraz (3.2.9) podlieha t = 3 bude vyzerať

Nazýva sa koeficient r 12(3). korelačný koeficient medzi x ( A x 2 pre pevné x y Je symetrický vzhľadom na primárne indexy 1, 2. Jeho sekundárny index 3 sa vzťahuje na pevnú premennú.

Príklad 3.2.1. Výpočet párových koeficientov,

viacnásobná a čiastočná korelácia.

V tabuľke 3.2.2 poskytuje informácie o objemoch predaja a reklamných nákladoch jednej spoločnosti, ako aj index spotrebiteľských výdavkov za niekoľko aktuálnych rokov.

  • 1. Zostrojte bodový diagram (korelačné pole) pre premenné „objem predaja“ a „index spotrebiteľských výdavkov“.
  • 2. Určte mieru vplyvu indexu spotrebiteľských výdavkov na objem predaja (vypočítajte koeficient párovej korelácie).
  • 3. Posúďte významnosť vypočítaného párového korelačného koeficientu.
  • 4. Zostrojte maticu párových korelačných koeficientov pre tri premenné.
  • 5. Nájdite odhad viacnásobného korelačného koeficientu.
  • 6. Nájdite odhady parciálnych korelačných koeficientov.

1. V našom príklade má rozptylový diagram podobu znázornenú na obr. 3.2.1. Predĺženie mračna bodov na rozptylovom diagrame pozdĺž naklonenej čiary nám umožňuje predpokladať, že existuje určitá objektívna tendencia k priamemu lineárnemu vzťahu medzi hodnotami premenných. X 2 Y(objem predaja).

Ryža. 3.2.1.

2. Medzivýpočty pri výpočte korelačného koeficientu medzi premennými X 2(Index spotrebiteľských výdavkov) a Y(objem predaja) sú uvedené v tabuľke. 3.2.3.

Priemery náhodné premenné X 2 A Y,čo sú najjednoduchšie ukazovatele charakterizujúce postupnosti jCj, x 2,..., x 16 a y v y 2 ,..., y 16, vypočítajte pomocou nasledujúcich vzorcov:


Objem predaja Y, tisíc rubľov

Index

konzumovať

telsky

výdavky

Objem predaja Y, tisíc rubľov

Index

konzumovať

telsky

výdavky

Tabuľka 3.2.3

l:, - X

(A - U) (x, - x)

(x, - x) 2

(y, -- y) 2

Disperzia charakterizuje mieru šírenia hodnôt x v x 2, x:

Pozrime sa teraz na riešenie príkladu 3.2.1 v Exceli.

Na výpočet korelácie pomocou Excelu môžete použiť funkciu =correl(), špecifikujúce adresy dvoch stĺpcov čísel, ako je znázornené na obr. 3.2.2. Odpoveď je umiestnená v D8 a rovná sa 0,816.

Ryža. 3.2.2.

(Poznámka: Argumenty funkcie korelácie musia byť čísla alebo názvy, polia alebo odkazy obsahujúce čísla. Ak argument, ktorým je pole alebo odkaz, obsahuje text, boolovské hodnoty alebo prázdne bunky, potom sa tieto hodnoty ignorujú; počítajú sa však bunky, ktoré obsahujú hodnoty null.

Ak pole! a pole2 majú iný počet dátových bodov, potom funkcia correl vráti chybovú hodnotu #n/a.

Ak je pole1 alebo pole2 prázdne alebo ak o (štandardná odchýlka) ich hodnôt je nula, potom funkcia correl vráti chybovú hodnotu #div/0!.)

Pomocou funkcie je možné získať aj kritickú hodnotu štatistiky /-Student steudrasprobr 1 balík Excel. Ako argumenty funkcie musíte zadať rovnaký počet stupňov voľnosti P- 2 (v našom príklade 16 - 2= 14) a hladina významnosti a (v našom príklade a = 0,1) (obr. 3.2.3). Ak skutočná hodnota/-štatistika, prevzaté modulo, ďalšie kritický, potom s pravdepodobnosťou (1 - a) je korelačný koeficient výrazne odlišný od nuly.


Ryža. 3.2.3. Kritická hodnota /-štatistiky je 1,7613

Excel obsahuje sadu nástrojov na analýzu údajov (takzvaný analytický balík) navrhnutých na riešenie rôznych štatistických problémov. Vypočítať maticu párových korelačných koeficientov R mali by ste použiť nástroj Korelácia (obr. 3.2.4) a nastaviť parametre analýzy v príslušnom dialógovom okne. Odpoveď bude umiestnená na novom pracovnom hárku (obr. 3.2.5).

1 V Exceli 2010 názov funkcie steudrasprobr sa zmenil na steu-

DENT.OBR.2X.

Ryža. 3.2.4.


Ryža. 3.2.5.

  • Za zakladateľov teórie korelácie sa považujú anglickí štatistici F. Galton (1822-1911) a K. Pearson (1857-1936). Termín „korelácia“ bol vypožičaný z prírodných vied a znamená „korelácia, korešpondencia“. Myšlienka korelácie ako vzájomnej závislosti medzi náhodnými premennými je základom matematicko-štatistickej teórie korelácie.

Údaje za rok 2011 sú uvedené za územia Južného federálneho okruhu Ruskej federácie

Územia federálneho okruhu

Hrubý regionálny produkt, miliardy rubľov, Y

Investície do fixných aktív, miliardy rubľov, X1

1. Rep. Adygea

2. Rep. Dagestan

3. Rep. Ingušsko

4. Kabardino-Balkarská republika

5. Rep. Kalmykia

6. Karačajsko-čerkesská republika

7. Rep. Severné Osetsko Alania

8. Krasnodarský kraj)

9. Stavropolská oblasť

10. Astrachanská oblasť.

11. Volgogradská oblasť.

12. Rostovská oblasť.

  • 1. Vypočítajte maticu párových korelačných koeficientov; hodnotiť štatistickú významnosť korelačných koeficientov.
  • 2. Zostrojte pole korelácie medzi efektívnou charakteristikou a faktorom, ktorý s ňou najbližšie súvisí.
  • 3. Vypočítajte parametre lineárnej párovej regresie pre každý faktor X..
  • 4. Posúďte kvalitu každého modelu pomocou koeficientu determinácie, priemernej chyby aproximácie a Fisherovho F testu. Vyberte si najlepší model.

bude 80 % svojej maximálnej hodnoty. Prezentujte graficky: skutočné a modelové hodnoty, predpovedané body.

  • 6. Pomocou viacnásobnej regresie krok za krokom (metóda vylúčenia alebo metóda inklúzie) zostavte model tvorby ceny bytu vplyvom významných faktorov. Uveďte ekonomickú interpretáciu koeficientov regresného modelu.
  • 7. Zhodnoťte kvalitu postaveného modelu. Zlepšila sa kvalita modelu v porovnaní s jednofaktorovým modelom? Posúdiť vplyv významných faktorov na výsledok pomocou koeficientov elasticity, v - a -? koeficienty

Pri riešení tohto problému vykonáme výpočty a zostavíme grafy a diagramy pomocou nastavení Excel Data Analysis.

1. Vypočítajte maticu párových korelačných koeficientov a vyhodnoťte štatistickú významnosť korelačných koeficientov

V dialógovom okne Korelácia zadajte do poľa Interval vstupu rozsah buniek obsahujúcich zdrojové údaje. Keďže máme vybraté aj hlavičky stĺpcov, v prvom riadku zaškrtneme políčko Štítky.

Získali sme nasledujúce výsledky:

Tabuľka 1.1 Matica párových korelačných koeficientov

Analýza matice párových korelačných koeficientov ukazuje, že závislá premenná Y, teda hrubý regionálny produkt, má užší vzťah s X1 (investície do fixného kapitálu). Korelačný koeficient je 0,936. To znamená, že 93,6 % závislej premennej Y (hrubý regionálny produkt) závisí od ukazovateľa X1 (investície do fixného kapitálu).

Štatistickú významnosť korelačných koeficientov určíme pomocou Studentovho t-testu. Tabuľkovú hodnotu porovnávame s vypočítanými hodnotami.

Vypočítajme tabuľkovú hodnotu pomocou funkcie STUDISCOVER.

t tabuľka = 0,129 s úrovňou spoľahlivosti 0,9 a stupňami voľnosti (n-2).

Faktor X1 je štatisticky významný.

2. Zostrojme pole korelácie medzi efektívnym atribútom (hrubý regionálny produkt) a faktorom, ktorý s ním najviac súvisí (investície do fixného kapitálu)

Na to použijeme nástroj bodového grafu v Exceli.

Výsledkom je, že získame korelačné pole ceny hrubého regionálneho produktu, miliardy rubľov. a investície do fixného kapitálu, miliardy rubľov. (Obrázok 1.1.).

Obrázok 1.1

3. Vypočítajte parametre lineárnej párovej regresie pre každý faktor X

Na výpočet parametrov lineárnej párovej regresie použijeme nástroj Regresia, ktorý je súčasťou nastavenia Analýza údajov.

V dialógovom okne Regresia zadajte do poľa Vstupný interval Y adresu rozsahu buniek, ktoré závislá premenná predstavuje. V teréne

Vstupný interval X zadávame adresu rozsahu, ktorý obsahuje hodnoty nezávislých premenných. Vypočítajme parametre párovej regresie pre faktor X.

Pre X1 sa získali nasledujúce údaje uvedené v tabuľke 1.2:

Tabuľka 1.2

Regresná rovnica pre závislosť ceny hrubého regionálneho produktu od investícií do fixného kapitálu má tvar:

4. Vyhodnoťme kvalitu každého modelu prostredníctvom koeficientu determinácie, priemernej chyby aproximácie a Fisherovho F-testu. Poďme zistiť, ktorý model je najlepší.

Získali sme koeficient determinácie, priemernú chybu aproximácie, ako výsledok výpočtov vykonaných v odseku 3. Získané údaje sú uvedené v nasledujúcich tabuľkách:

Údaje pre X1:

Tabuľka 1.3a

Tabuľka 1.4b

A) Koeficient determinácie určuje, aký podiel variácie znaku Y sa berie do úvahy v modeli a je spôsobený vplyvom faktora X naňho. Čím väčšia je hodnota koeficientu determinácie, tým užšia je súvislosť medzi vlastnosti v konštruovanom matematickom modeli.

Excel označuje R-štvorec.

Na základe tohto kritéria je najvhodnejším modelom regresná rovnica závislosti ceny hrubého regionálneho produktu od investícií do fixného kapitálu (X1).

B) Priemernú chybu aproximácie vypočítame pomocou vzorca:

kde čitateľ je súčet druhých mocnín odchýlky vypočítaných hodnôt od skutočných. V tabuľkách sa nachádza v stĺpci SS, riadok Zostávajúce.

Priemernú cenu bytu vypočítame v Exceli pomocou funkcie PRIEMER. = 24,18182 miliárd rubľov.

Pri vykonávaní ekonomických výpočtov sa model považuje za dostatočne presný, ak je priemerná chyba aproximácie menšia ako 5 %, model sa považuje za prijateľný, ak je priemerná chyba aproximácie menšia ako 15 %.

Podľa tohto kritéria je najvhodnejší matematický model pre regresnú rovnicu závislosti ceny hrubého regionálneho produktu od investícií do fixného kapitálu (X1).

C) F-test sa používa na testovanie významnosti regresného modelu. Na tento účel sa porovnávajú aj kritické (tabuľkové) hodnoty Fisher F-testu.

Vypočítané hodnoty sú uvedené v tabuľkách 1.4b (označené písmenom F).

Tabuľková hodnota Fisherovho F-testu sa vypočíta v Exceli pomocou funkcie FDISP. Vezmime si pravdepodobnosť 0,05. Prijaté: = 4,75

Vypočítané hodnoty Fisherovho F-testu pre každý faktor sú porovnateľné s tabuľkovou hodnotou:

71,02 > = 4,75 model je podľa tohto kritéria primeraný.

Po analýze údajov pre všetky tri kritériá môžeme konštatovať, že najlepší je matematický model zostavený pre faktor hrubého regionálneho produktu, ktorý je opísaný lineárnou rovnicou

5. Pre zvolený model závislosti ceny hrubého regionálneho produktu

priemernú hodnotu ukazovateľa predikujeme na hladine významnosti, ak je predikovaná hodnota faktora 80 % jeho maximálnej hodnoty. Predstavme si to graficky: skutočné a modelové hodnoty, predpovedné body.

Vypočítajte predpokladanú hodnotu X, podľa podmienky to bude 80% maximálnej hodnoty.

Vypočítajme X max v Exceli pomocou funkcie MAX.

0,8 *52,8 = 42,24

Na získanie prediktívnych odhadov závislej premennej dosadíme získanú hodnotu nezávislej premennej do lineárnej rovnice:

5,07 + 2,14 * 42,24 \u003d 304,55 miliárd rubľov.

Stanovme interval spoľahlivosti prognózy, ktorý bude mať nasledujúce hranice:

Na výpočet intervalu spoľahlivosti pre predpovedanú hodnotu vypočítame odchýlku od regresnej priamky.

Pre párový regresný model sa vypočíta hodnota odchýlky:

tie. hodnota štandardnej chyby z tabuľky 1.5a.

(Keďže počet stupňov voľnosti je rovný jednej, menovateľ sa bude rovnať n-2). korelačný pár regresná predpoveď

Na výpočet koeficientu použijeme excelovskú funkciu STUDRASP, pravdepodobnosť bude rovná 0,1, počet stupňov voľnosti je 38.

Vypočítame hodnotu pomocou Excelu a dostaneme 12294.


Určme hornú a dolnú hranicu intervalu.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Predpovedaná hodnota = 304,55 tisíc dolárov bude teda medzi spodnou hranicou rovnajúcou sa 277,078 tisíc dolárov. a horná hranica rovná 332,022 mld. Rub.

Aktuálne a modelové hodnoty, prognózované body sú graficky znázornené na obrázku 1.2.


Obrázok 1.2

6. Pomocou postupnej viacnásobnej regresie (metóda vylúčenia) zostavíme model tvorby ceny hrubého regionálneho produktu vplyvom významných faktorov.

Na zostavenie viacnásobnej regresie použijeme funkciu Excel Regression vrátane všetkých faktorov v nej. Získame tak výsledkové tabuľky, z ktorých potrebujeme Studentov t-test.

Tabuľka 1.8a

Tabuľka 1.8b

Tabuľka 1.8c.

Dostaneme model ako:

Pretože< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Zvolíme najmenšiu absolútnu hodnotu Studentovho t-testu, rovná sa 8,427, porovnajme s tabuľkovou hodnotou, ktorú vypočítame v Exceli, zoberme hladinu významnosti rovnú 0,10, počet stupňov voľnosti n-m-1= 12-4=8:=1,8595

Keďže 8.427>1.8595 by sa model mal považovať za primeraný.

7. Pre posúdenie signifikantného faktora výsledného matematického modelu vypočítame koeficienty elasticity, a - koeficienty

Koeficient elasticity ukazuje, o koľko percent sa zmení efektívny atribút, keď sa atribút faktora zmení o 1 %:

EX4 = 2,137 * (10,69/24,182) = 0,94 %

To znamená, že pri zvýšení investície do fixného kapitálu o 1 % sa náklady v priemere zvýšia o 0,94 %.

Koeficient ukazuje, o akú časť smerodajnej odchýlky sa zmení priemerná hodnota závislej premennej pri zmene nezávislej premennej o jednu smerodajnú odchýlku.

2,137* (14.736/33,632) = 0,936.

Údaje o smerodajnej odchýlke sú prevzaté z tabuliek získaných pomocou nástroja Descriptive Statistics.

Tabuľka 1.11 Opisná štatistika (Y)

Tabuľka 1.12 Opisná štatistika (X4)

Koeficient určuje podiel vplyvu faktora na celkovom vplyve všetkých faktorov:

Na výpočet párových korelačných koeficientov vypočítame maticu párových korelačných koeficientov v Exceli pomocou nástroja Korelácia v nastaveniach Analýza údajov.

Tabuľka 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Záver: Zo získaných výpočtov môžeme usúdiť, že efektívny atribút Y (hrubý regionálny produkt) má veľkú závislosť od faktora X1 (investície do fixného kapitálu) (o 100 %).

Bibliografia

  • 1. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ekonometria. Kurz pre začiatočníkov. Návod. 2. vyd. - M.: Delo, 1998. - s. 69 - 74.
  • 2. Workshop z ekonometrie: Učebnica / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko a kol., 2002. - s. 49 - 105.
  • 3. Dougherty K. Úvod do ekonometrie: Prel. z angličtiny - M.: INFRA-M, 1999. - XIV, s. 262 - 285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Aplikovaná matematika a základy ekonometrie. -1998., s. 115-147.
  • 5. Kremer N.Sh., Putko B.A. Ekonometria. -2007. od 175-251.
r X (1) X (2) X (3) X (4) X (5)
r 1.00 0.43 0.37 0.40 0.58 0.33
X (1) 0.43 1.00 0.85 0.98 0.11 0.34
X (2) 0.37 0.85 1.00 0.88 0.03 0.46
X (3) 0.40 0.98 0.88 1.00 0.03 0.28
X (4) 0.58 0.11 0.03 0.03 1.00 0.57
X (5) 0.33 0.34 0.46 0.28 0.57 1.00

Analýza matice párových korelačných koeficientov ukazuje, že s ukazovateľom najviac súvisí ukazovateľ výkonnosti X(4) - množstvo spotrebovaného hnojiva na 1 hektár ().

Zároveň je súvislosť medzi atribútmi-argumentmi dosť úzka. Takže medzi počtom kolesových traktorov prakticky existuje funkčný vzťah ( X(1)) a počet nástrojov na povrchové obrábanie pôdy .

Prítomnosť multikolinearity je indikovaná aj korelačnými koeficientmi a . Vzhľadom na úzky vzťah medzi ukazovateľmi X (1) , X(2) a X(3), len jeden z nich môže byť zahrnutý do výnosového regresného modelu.

Na preukázanie negatívneho vplyvu multikolinearity zvážte regresný model výnosu vrátane všetkých vstupných ukazovateľov:

F obs = 121.

Hodnoty opravených odhadov štandardných odchýlok odhadov koeficientov rovnice sú uvedené v zátvorkách .

Nasledujúce parametre primeranosti sú prezentované pod regresnou rovnicou: viacnásobný koeficient determinácie; opravený odhad reziduálneho rozptylu, priemerná relatívna chyba aproximácie a vypočítaná hodnota kritéria F obs = 121.

Regresná rovnica je významná, pretože F obs = 121 > F kp = 2,85 zistené z tabuľky F- distribúcie pri a=0,05; n1=6 a n2=14.

Z toho vyplýva, že Q¹0, t.j. a aspoň jeden z koeficientov rovnice q j (j= 0, 1, 2, ..., 5) sa nerovná nule.

Na testovanie hypotézy o významnosti jednotlivých regresných koeficientov H0: q j =0, kde j=1,2,3,4,5, porovnajte kritickú hodnotu t kp = 2,14, zistené z tabuľky t-rozdelenia na hladine významnosti a=2 Q=0,05 a počet stupňov voľnosti n=14, s vypočítanou hodnotou . Z rovnice vyplýva, že regresný koeficient je štatisticky významný len vtedy, keď X(4) od ½ t 4½ = 2,90 > t kp = 2,14.



Negatívne znaky regresných koeficientov nie sú vhodné na ekonomickú interpretáciu, keď X(1) a X(5) . Zo záporných hodnôt koeficientov vyplýva, že nárast saturácie poľnohospodárstva kolesovými traktormi ( X(1)) a prípravky na ochranu rastlín ( X(5) negatívne ovplyvňuje výnos. Výsledná regresná rovnica je teda neprijateľná.

Na získanie regresnej rovnice s významnými koeficientmi používame algoritmus regresnej analýzy krok za krokom. Spočiatku používame krokový algoritmus s elimináciou premenných.

Vylúčte premennú z modelu X(1) , čo zodpovedá minimálnej absolútnej hodnote ½ t 1½ = 0,01. Pre zvyšné premenné opäť zostavíme regresnú rovnicu:

Výsledná rovnica je významná, pretože F pozorované = 155 > F kp = 2,90, zistené na hladine významnosti a=0,05 a počty stupňov voľnosti n 1 =5 a n 2 =15 podľa tabuľky F-distribúcie, t.j. vektor q¹0. V rovnici je však významný iba regresný koeficient X(4) . Odhadované hodnoty ½ t j ½ pre ostatné koeficienty menšie ako t kr = 2,131 nájdených v tabuľke t-distribúcie pri a=2 Q= 0,05 an = 15.

Vylúčením premennej z modelu X(3) , ktorá zodpovedá minimálnej hodnote t 3 = 0,35 a dostaneme regresnú rovnicu:

(2.9)

Vo výslednej rovnici to nie je štatisticky významné a nemôžeme ekonomicky interpretovať koeficient pri X(5) . Vylúčením X(5) dostaneme regresnú rovnicu:

(2.10)

Získali sme zmysluplnú regresnú rovnicu so zmysluplnými a interpretovateľnými koeficientmi.

Výsledná rovnica však nie je jediným „dobrým“ a nie „najlepším“ výnosovým modelom v našom príklade.

Ukážme to v podmienkach multikolinearity je efektívnejší postupný algoritmus so zahrnutím premenných. Prvý krok vo výnosovom modeli r obsahuje premennú X(4) , ktorý má najvyšší korelačný koeficient s r, vysvetlené premennou - r(r,X(4)) = 0,58. V druhom kroku vrátane rovnice spolu s X(4) premenné X(1) alebo X(3), získame modely, ktoré z ekonomických dôvodov a štatistických charakteristík presahujú (2.10):

(2.11)

(2.12)

Zahrnutie ktorejkoľvek z troch zostávajúcich premenných do rovnice zhoršuje jej vlastnosti. Pozri napríklad rovnicu (2.9).

Máme teda tri „dobré“ výnosové modely, z ktorých si z ekonomických a štatistických dôvodov musíme vybrať jeden.

Podľa štatistických kritérií je najvhodnejší model (2.11). Zodpovedá minimálnym hodnotám reziduálneho rozptylu = 2,26 a priemernej relatívnej chybe aproximácie a najväčším hodnotám a Fob = 273.

O niečo horšie ukazovatele primeranosti má model (2.12), za ním nasleduje model (2.10).

Teraz vyberieme to najlepšie z modelov (2.11) a (2.12). Tieto modely sa navzájom líšia z hľadiska premenných X(1) a X(3). Avšak vo výnosových modeloch premenná X(1) (počet kolesových traktorov na 100 ha) je vhodnejší ako variabilný X(3) (počet nástrojov na povrchové obrábanie pôdy na 100 ha), ktorý je do určitej miery sekundárny (alebo odvodený od X (1)).

V tejto súvislosti by sa mal z ekonomických dôvodov uprednostniť model (2.12). Po implementácii algoritmu postupnej regresnej analýzy so zahrnutím premenných a zohľadnením skutočnosti, že do rovnice by mala vstúpiť iba jedna z troch súvisiacich premenných ( X (1) , X(2) alebo X(3)) vyberte konečnú regresnú rovnicu:

Rovnica je významná pri a=0,05, pretože F obs = 266 > F kp = 3,20, zistené z tabuľky F-distribúcie pre a= Q=0,05; n1=3 a n2=17. Všetky regresné koeficienty v rovnici ½ sú tiež významné t j½> t kp(a=2 Q=0,05; n = 17) = 2,11. Regresný koeficient q 1 by sa mal z ekonomických dôvodov považovať za významný (q 1 ¹0). t 1 = 2,09 len o niečo menej t kp = 2,11.

Z regresnej rovnice vyplýva, že zvýšenie počtu traktorov o jeden na 100 hektárov ornej pôdy (pri pevnej hodnote X(4)) vedie k zvýšeniu úrody zrna v priemere o 0,345 c/ha.

Približný výpočet koeficientov elasticity e 1 »0,068 a e 2 »0,161 ukazuje, že s rastúcimi ukazovateľmi X(1) a X(4) o 1 %, úroda zrna sa zvyšuje v priemere o 0,068 % a 0,161 %.

Viacnásobný koeficient determinácie naznačuje, že iba 46,9 % variácií výnosov je vysvetlených ukazovateľmi zahrnutými v modeli ( X(1) a X(4), teda nasýtenie rastlinnej výroby traktormi a hnojivami. Zvyšok variácií je spôsobený pôsobením nezapočítaných faktorov ( X (2) , X (3) , X(5), poveternostné podmienky atď.). Priemerná relatívna chyba aproximácie charakterizuje adekvátnosť modelu, ako aj hodnotu reziduálneho rozptylu . Pri interpretácii regresnej rovnice sú zaujímavé hodnoty relatívnych aproximačných chýb . Pripomeňme, že - modelová hodnota efektívneho ukazovateľa charakterizuje priemernú hodnotu produktivity pre všetky uvažované oblasti za predpokladu, že hodnoty vysvetľujúcich premenných X(1) a X(4) sú stanovené na rovnakej úrovni, tj X (1) = x i(1) a X (4) = x i(4) . Potom podľa hodnôt d i Môžete porovnávať regióny podľa výnosu. Oblasti, ktorým zodpovedajú hodnoty d i>0, majú nadpriemerný výnos a d i<0 - ниже среднего.

V našom príklade je rastlinná výroba najefektívnejšia v oblasti zodpovedajúcej d 7 \u003d 28%, kde je výnos o 28% vyšší ako priemer v regióne a najmenej efektívny - v oblasti s d 20 =-27,3%.


Úlohy a cvičenia

2.1. Od bežnej populácie ( r, X (1) , ..., X p)), kde r má zákon normálneho rozdelenia s podmieneným matematickým očakávaním a rozptylom s 2, náhodná vzorka objemu n, nechaj to tak ( y i, x i (1) , ..., x i(p)) - výsledok i pozorovanie ( i=1, 2, ..., n). Určte: a) matematické očakávanie odhadu vektora metódou najmenších štvorcov q; b) kovariančná matica odhadu vektora metódou najmenších štvorcov q; c) matematické očakávanie hodnotenia.

2.2. Podľa podmienky úlohy 2.1 nájdite matematické očakávanie súčtu kvadrátov odchýlok v dôsledku regresie, t.j. EQ R, Kde

.

2.3. Podľa podmienky úlohy 2.1 určte matematické očakávanie súčtu štvorcových odchýlok v dôsledku reziduálnej variácie vzhľadom na regresné priamky, t.j. EQ ost, kde

2.4. Dokážte, že keď je splnená hypotéza H 0: q=0 štatistiky

má F-rozdelenie so stupňami voľnosti n 1 =p+1 a n 2 = n-p-1.

2.5. Dokážte, že pri splnení hypotézy H 0: q j =0 má štatistika t-rozdelenie s počtom stupňov voľnosti n=n-p-1.

2.6. Na základe údajov (tabuľka 2.3) o závislosti zmrštenia kŕmneho chleba ( r) o dĺžke skladovania ( X) nájsť bodový odhad podmieneného očakávania za predpokladu, že všeobecná regresná rovnica je lineárna.

Tabuľka 2.3.

Vyžaduje sa: a) nájsť odhady reziduálneho rozptylu s 2 za predpokladu, že všeobecná regresná rovnica má tvar ; b) skontrolujte pri a=0,05 významnosť regresnej rovnice, t.j. hypotéza H0: q=0; c) pri spoľahlivosti g=0,9 určte intervalové odhady parametrov q 0, q 1; d) so spoľahlivosťou g=0,95 určte intervalový odhad podmieneného matematického očakávania pri X 0 = 6; e) určte pri g=0,95 interval spoľahlivosti predpovede v bode X=12.

2.7. Na základe údajov o dynamike tempa rastu cien akcií za 5 mesiacov uvedených v tabuľke. 2.4.

Tabuľka 2.4.

mesiace ( X)
r (%)

a za predpokladu, že všeobecná regresná rovnica má tvar , je potrebné: a) určiť odhady a parametre regresnej rovnice a reziduálny rozptyl s 2 ; b) skontrolujte pri a=0,01 významnosť regresného koeficientu, t.j. hypotézy H0: q1=0;

c) so spoľahlivosťou g=0,95 nájdite intervalové odhady parametrov q 0 a q 1; d) so spoľahlivosťou g = 0,9 stanovte intervalový odhad podmieneného matematického očakávania pre X 0 = 4; e) určte pri g=0,9 interval spoľahlivosti predpovede v bode X=5.

2.8. Výsledky štúdia dynamiky prírastku hmotnosti mladých zvierat sú uvedené v tabuľke 2.5.

Tabuľka 2.5.

Za predpokladu, že všeobecná regresná rovnica je lineárna, je potrebné: a) určiť odhady a parametre regresnej rovnice a reziduálny rozptyl s 2 ; b) skontrolujte pri a=0,05 významnosť regresnej rovnice, t.j. hypotézy Ho: q=0;

c) pri spoľahlivosti g=0,8 nájdite intervalové odhady parametrov q 0 a q 1; d) so spoľahlivosťou g=0,98 určte a porovnajte intervalové odhady podmieneného matematického očakávania pre X 0 = 3 a X 1 =6;

e) určte pri g=0,98 interval spoľahlivosti predpovede v bode X=8.

2.9. Nákladová cena ( r) jeden výtlačok knihy v závislosti od nákladu ( X) (tis. výtlačkov) charakterizujú údaje zozbierané vydavateľstvom (tabuľka 2.6). Určte odhady najmenších štvorcov a parametre hyperbolickej regresnej rovnice so spoľahlivosťou g=0,9 vytvorte intervaly spoľahlivosti pre parametre q 0 a q 1 , ako aj podmienené matematické očakávanie pri X=10.

Tabuľka 2.6.

Určte odhady a parametre regresnej rovnice tvaru , otestujte hypotézu H 0 pri a = 0,05: q 1 = 0 a zostrojte intervaly spoľahlivosti so spoľahlivosťou g = 0,9 pre parametre q 0 a q 1 a podmienené matematické očakávanie pri X=20.

2.11. V tabuľke 2.8 uvádza údaje o mierach rastu (%) nasledujúcich makroekonomických ukazovateľov n=10 rozvinutých krajín sveta za rok 1992: HNP - X(1) , priemyselná výroba - X(2) , cenový index - X (3) .

Tabuľka 2.8.

krajiny x a parametre regresnej rovnice, odhad reziduálneho rozptylu; b) skontrolujte pri a=0,05 významnosť regresného koeficientu, t.j. H°: qi=0; c) so spoľahlivosťou g=0,9 nájdite intervalové odhady q 0 a q 1; d) nájdite pri g=0,95 interval spoľahlivosti pre bod X 0 =x i, Kde i=5; e) porovnajte štatistické charakteristiky regresných rovníc: 1, 2 a 3.

2.12. Vyriešte problém 2.11 pomocou ( pri) index X(1) a na vysvetlenie ( X) premenná X (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Aplikovaná štatistika a základy ekonometrie: Učebnica. M., UNITY, 1998 (2. vydanie, 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Aplikovaná štatistika v úlohách a cvičeniach: Učebnica. M. JEDNOTA - DANA, 2001;

3. Ayvazyan S.A., Enyukov I.S., Meshalkin L.D. Aplikovaná štatistika. Výskum závislosti. M., Financie a štatistika, 1985, 487 s.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov I.S., Meshalkin L.D. Aplikovaná štatistika. Klasifikácia a redukcia rozmerov. M., Financie a štatistika, 1989, 607 s.;

5. Johnston J. Ekonometrické metódy, M.: Štatistika, 1980, 446 s.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Viacrozmerné štatistické metódy. M., Financie a štatistika, 2000;

7. Mkhitaryan V.S., Troshin L.I. Štúdium závislostí pomocou korelačných a regresných metód. M., MESI, 1995, 120 strán;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Viacrozmerné štatistické metódy v ekonómii. M., MESI, 1995, 149 s.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Matematické štatistiky pre obchodníkov a manažérov. M., MESI, 2000, 140. roky;

10. Lukashin Yu.I. Metódy regresie a adaptívneho prognózovania: Učebnica, M., MESI, 1997.

11. Lukashin Yu.I. Adaptívne metódy krátkodobej prognózy. - M., Štatistika, 1979.


APLIKÁCIE


Príloha 1. Možnosti úloh pre nezávislý počítačový výskum.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2023 „kingad.ru“ - ultrazvukové vyšetrenie ľudských orgánov