Szerkessze meg a párkorrelációs együtthatók mátrixát! Ellenőrizze a multikollinearitást

A gazdasági adatok bármely gazdasági objektum vagy folyamat mennyiségi jellemzőit képviselik. Számos tényező hatására alakulnak ki, amelyek közül nem mindegyik hozzáférhető külső ellenőrzés számára. Az ellenőrizhetetlen tényezők véletlenszerű értékeket vehetnek fel bizonyos értékkészletekből, és ezáltal az általuk meghatározott adatok véletlenszerűvé válhatnak. A gazdaságkutatás egyik fő feladata az változók közötti függőségek elemzése.

A jellemzők közötti függőségek mérlegelésekor mindenekelőtt két típusú kapcsolatot kell megkülönböztetni:

  • funkcionális - a tényezőjellemző változása és a kapott érték változása közötti teljes megfelelés jellemzi: Egy tényezőkarakterisztika minden értéke a kapott jellemző nagyon specifikus értékeinek felel meg. Az ilyen típusú kapcsolatokat képletkapcsolatként fejezik ki. A funkcionális függés összekapcsolhat egy effektív jellemzőt egy vagy több tényezőjellemzővel. Így az időarányos bérek bérének összege a ledolgozott órák számától függ;
  • korrelációs- nincs teljes egyezés a két előjel változása között, az egyes tényezők hatása csak átlagosan, a tényleges adatok tömeges megfigyelésével nyilvánul meg. Nagyszámú különböző tényező egyidejű hatása a vizsgált tulajdonságra ahhoz a tényhez vezet, hogy egy tényezőjellemző egy és ugyanazon értéke az eredményül kapott jellemző értékeinek teljes eloszlásának felel meg, mivel minden konkrét esetben más tényezőjellemzők megváltoztathatják hatásuk erősségét és irányát.

Nem szabad megfeledkezni arról, hogy ha a jellemzők között funkcionális kapcsolat van, akkor a faktorkarakterisztika értékének ismeretében pontosan meg lehet határozni az eredő jel értéke. Korrelációs függőség jelenlétében csak az eredő jellemző változásának trendje amikor a faktorjellemző értéke megváltozik.

A jelek közötti kapcsolatok tanulmányozásakor irány, forma, tényezők száma szerint osztályozzák őket:

  • felé kapcsolatok vannak osztva egyenesÉs fordított. Közvetlen kapcsolat esetén az eredő jellemző változási iránya egybeesik a tényezőkarakterisztika változási irányával. Visszacsatolás esetén az eredő karakterisztika változásának iránya ellentétes a faktorkarakterisztika változási irányával. Például minél magasabb a munkavállaló képzettsége, annál magasabb a munkája termelékenysége (közvetlen kapcsolat). Minél magasabb a munkatermelékenység, annál alacsonyabb az egységnyi termelési költség (visszacsatolás);
  • forma szerint(funkció típusa) kapcsolatokat osztjuk fel lineáris(egyenes) és nemlineáris(görbe vonalú). A lineáris összefüggést egyenes, a nemlineáris összefüggést egy görbe (parabola, hiperbola stb.) ábrázolja. Lineáris összefüggésben egy tényezőjellemző értékének növekedésével egyenletes növekedés (csökkenés) következik be az eredményül kapott jellemző értékében;
  • a hatásos jellemzőt befolyásoló tényezők számával, kapcsolatok vannak osztva egytényezős(páros) és többtényezős.

A tulajdonságok változásának környezeti feltételektől való függésének vizsgálata a korrelációelmélet tartalma.

A korrelációs elemzés során a teljes adathalmazt változók (tényezők) halmazának tekintjük, amelyek mindegyike tartalmaz P megfigyelések.

Két tényező kapcsolatának vizsgálatakor általában kijelölik őket X=(x p x 2,...,x n)És Y= (y ( , y 2 ,..., y és).

Kovariancia - ez statisztikai kölcsönhatás mértéke két változó. Például két értékpapír hozamának kovariancia pozitív értéke azt jelzi, hogy ezeknek az értékpapíroknak a hozama egy irányba mozdul el.

Kovariancia két változó között xÉs Y a következőképpen számolva:

hol vannak a változók tényleges értékei

xÉs G;

Ha a valószínűségi változók Chi Y független, az elméleti kovariancia nulla.

A kovariancia attól függ, hogy a változókat milyen egységekben mérik Igen, ez egy nem szabványos mennyiség. Ezért mérni kapcsolat erőssége egy másik statisztikát, az úgynevezett korrelációs együtthatót használnak két változó között.

Két változóhoz xÉs Y pár korrelációs együttható

a következőképpen van meghatározva:

Ahol SSy- mennyiségek szórásának becslései Szia Y. Ezek a becslések jellemzik szóródás fokaértékeket x (, x 2, ..., x n (y 1, y 2, y n) az átlagod körül x(y ill.), vagy változékonyság(variabilitása) ezeknek a változóknak a megfigyelések halmazán keresztül.

Diszperzió(varianciabecslés) a képlet határozza meg

Általánosságban elmondható, hogy a variancia torzítatlan becsléséhez a négyzetek összegét el kell osztani a becslés szabadságfokainak számával. (stb), Ahol P - minta nagysága, R - a mintán lévő kapcsolatok száma. Mivel a mintát már egyszer felhasználták az átlag meghatározására X, akkor az egymásra helyezett kapcsolatok száma ebben az esetben eggyel egyenlő (p = 1), és a becslés szabadságfokainak száma (azaz a független mintaelemek száma) egyenlő (P - 1).

Természetesebb, ha a változó értékek szórásának mértékét ugyanazokban az egységekben mérjük, amelyekben magát a változót mérik. Ezt a problémát az ún szórás (szórás) vagy standard hiba változó x(változó Y)és a reláció határozza meg

A (3.2.1) képlet számlálójában szereplő tagok két változó kölcsönhatását fejezik ki, és meghatározzák a korreláció előjelét (pozitív vagy negatív). Ha például erős pozitív kapcsolat van a változók között (az egyik változó növekedése, míg a másik nő), minden tag pozitív szám lesz. Hasonlóképpen, ha erős negatív kapcsolat van a változók között, a számlálóban szereplő összes tag negatív szám lesz, ami negatív korrelációs értéket eredményez.

A páronkénti korrelációs együttható kifejezésének nevezője [lásd (3.2.2) képlet] egyszerűen normalizálja a számlálót oly módon, hogy a korrelációs együttható könnyen értelmezhető, dimenzió nélküli számnak bizonyul, és -1 és +1 közötti értékeket vesz fel.

A szokatlan mértékegységek miatt nehezen értelmezhető korrelációs együttható kifejezésének számlálója: kovariancia HiU. Annak ellenére, hogy néha független jellemzőként használják (például a pénzügyelméletben két tőzsde részvényárfolyamának együttes változásának leírására), kényelmesebb a korrelációs együttható használata. A korreláció és a kovariancia lényegében ugyanazt az információt képviseli, de a korreláció ezt az információt hasznosabb formában reprezentálja.

A korrelációs együttható minőségi értékeléséhez különféle skálákat használnak, leggyakrabban a Chaddock-skálát. A korrelációs együttható értékétől függően a kapcsolat a következő minősítések egyikével rendelkezhet:

  • 0,1-0,3 - gyenge;
  • 0,3-0,5 - észrevehető;
  • 0,5-0,7 - közepes;
  • 0,7-0,9 - magas;
  • 0,9-1,0 - nagyon magas.

Egy kapcsolat szorossági fokának a korrelációs együttható segítségével történő értékelése általában a vizsgált jelenségre vonatkozó többé-kevésbé korlátozott információk alapján történik. E tekintetben szükség van a lineáris korrelációs együttható szignifikanciájának felmérésére, amely lehetővé teszi a mintaeredményeken alapuló következtetések kiterjesztését az általános sokaságra.

A korrelációs együttható szignifikanciájának felmérése kis mintaméret esetén Student-féle 7-teszttel történik. Ebben az esetben ennek a kritériumnak a tényleges (megfigyelt) értékét a képlet határozza meg

Az ezzel a képlettel számított érték / obs összehasonlításra kerül a 7-es feltétel kritikus értékével, amelyet a Student-féle /-teszt értékek táblázatából veszünk (lásd 2. melléklet), figyelembe véve az adott oc szignifikancia szintet és a számot. szabadsági fokozatok (P - 2).

Ha 7 megfigyelés > 7 tabulátor, akkor a korrelációs együttható eredő értéke szignifikánsnak tekinthető (azaz a nullhipotézist, amely szerint a korrelációs együttható nullával egyenlő, elvetjük). Ebből arra következtethetünk, hogy a vizsgált változók között szoros statisztikai kapcsolat van.

Ha az érték g y x közel nulla, a változók közötti kapcsolat gyenge. Ha a valószínűségi változók közötti korreláció:

  • pozitív, akkor az egyik valószínűségi változó növekedésével a másik átlagosan nő;
  • negatív, akkor az egyik valószínűségi változó növekedésével a másik átlagosan csökken. Egy kényelmes grafikus eszköz a párosított adatok elemzésére szórványrajz, amely az egyes megfigyeléseket két tényezőnek megfelelő kétdimenziós térben reprezentálja. Szórásdiagramnak is nevezik, amely két jellemző értékkészletét ábrázolja korrelációs mező. A diagram minden pontjának x koordinátája (. és y g A lineáris kapcsolat erősségének növekedésével a grafikon pontjai közelebb kerülnek az egyeneshez és a nagysághoz G közelebb lesz az egységhez.

A páronkénti korrelációs együtthatókat arra használjuk, hogy mérjük a lineáris kapcsolatok erősségét egy halmazból származó különböző jellemzőpárok között. Számos funkcióhoz jut az ember párkorrelációs együtthatók mátrixa.

Legyen a teljes adathalmaz egy változóból Y = =(y p y 2, ..., y p)És T változók (tényezők) X, amelyek mindegyike tartalmazza P megfigyelések. Változó értékek YÉs X, táblázatban rögzítjük (3.2.1. táblázat).

3.2.1. táblázat

Változó

Szám

megfigyelések

X TZ

X tp

Számítsa ki a táblázatban szereplő adatok alapján pár korrelációs együtthatók mátrixa R, szimmetrikus a főátlóra:


A párkorrelációs együtthatók mátrixának elemzését többszörös regressziós modellek készítésekor alkalmazzuk.

Egy korrelációs mátrix nem tudja teljes mértékben leírni a mennyiségek közötti függőséget. Ebben a tekintetben a többváltozós korrelációs elemzés két feladatot vesz figyelembe:

  • 1. Egy valószínűségi változó szoros kapcsolatának meghatározása az elemzésben szereplő többi változó összességével.
  • 2. Két mennyiség közötti kapcsolat szorosságának meghatározása más mennyiségek befolyásának rögzítése vagy kizárása mellett.

Ezeket a problémákat többszörös, illetve részleges korrelációs együtthatók segítségével oldjuk meg.

Az első probléma (egy valószínűségi változó szoros kapcsolatának meghatározása az elemzésben szereplő többi változó összességével) megoldását a minta többszörös korrelációs együttható képlet szerint

Ahol R- R[cm. (3.2.6) képlet]; Rjj- ugyanazon mátrix elemének algebrai komplementere R.

Négyzetes többszörös korrelációs együttható SCHj 2 j _j J+l máltalában hívják minta többszörös determinációs együtthatója; megmutatja, hogy a vizsgált érték variációjának (véletlenszerű terjedésének) mekkora hányada Xj elmagyarázza a fennmaradó valószínűségi változók változását X ( , X 2 ,..., X t.

A többszörös korrelációs és meghatározási együtthatók pozitív mennyiségek, 0 és 1 közötti értékeket vesznek fel. Az együttható közelítésekor R 2 egységre, arra a következtetésre juthatunk, hogy a valószínűségi változók közötti kapcsolat szoros, de nem az irányára vonatkozóan. A többszörös korrelációs együttható csak akkor nőhet, ha további változókat is tartalmaz a modell, és nem fog növekedni, ha a meglévő jellemzők közül bármelyiket kizárjuk.

A determinációs együttható szignifikanciájának ellenőrzése a Fisher-féle /'-kritérium számított értékének összehasonlításával történik.

táblázatossal F rabl. A kritérium táblázatos értékét (lásd 1. függelék) az adott a szignifikancia szint és szabadságfokok határozzák meg v l = mnv 2 = n-m-l. Együttható R 2 szignifikánsan különbözik a nullától, ha az egyenlőtlenség fennáll

Ha a figyelembe vett valószínűségi változók korrelálnak egymással akkor a párkorrelációs együttható értékét részben befolyásolja más mennyiségek hatása. Ebben a tekintetben szükség van a mennyiségek közötti részleges korreláció vizsgálatára, miközben kizárjuk más (egy vagy több) valószínűségi változó hatását.

Minta parciális korrelációs együttható képlet határozza meg

Ahol R Jk , Rjj, R kk - algebrai összeadások a megfelelő mátrixelemekhez R[cm. (3.2.6) képlet].

A parciális korrelációs együttható, valamint a párkorrelációs együttható -1 és +1 között változik.

Kifejezés (3.2.9) tárgya t = 3 fog kinézni

Az r 12(3) együtthatót nevezzük x közötti korrelációs együttható (És x 2 fix x y esetén Az 1., 2. elsődleges indexhez képest szimmetrikus. 3. másodlagos indexe egy rögzített változóra vonatkozik.

Példa 3.2.1. pár együtthatók kiszámítása,

többszörös és részleges korreláció.

táblázatban A 3.2.2 tájékoztatást nyújt egy vállalat értékesítési volumenéről és hirdetési költségeiről, valamint a fogyasztói költési indexről több folyó évre vonatkozóan.

  • 1. Készítsen szóródási diagramot (korrelációs mezőt) az „értékesítési volumen” és a „fogyasztói kiadási index” változókra.
  • 2. Határozza meg a fogyasztói kiadási index befolyásának mértékét az értékesítési volumenre (számítsa ki a párkorrelációs együtthatót).
  • 3. Értékelje a számított párkorrelációs együttható jelentőségét!
  • 4. Készítsen páronkénti korrelációs együtthatók mátrixát három változóra!
  • 5. Adja meg a többszörös korrelációs együttható becslését!
  • 6. Adja meg a parciális korrelációs együtthatók becsléseit!

1. Példánkban a szórásdiagram az ábrán látható formájú. 3.2.1. A pontfelhő megnyúlása a szórási diagramon a ferde vonal mentén lehetővé teszi számunkra, hogy feltételezzük, hogy van valamilyen objektív tendencia a változók értékei közötti közvetlen lineáris kapcsolatra. X 2 Y(értékesítés volumene).

Rizs. 3.2.1.

2. Köztes számítások a változók közötti korrelációs együttható kiszámításakor X 2(Fogyasztói kiadási index) és Y(értékesítési volumen) táblázatban találhatók. 3.2.3.

Átlagos értékek Véletlen változók X 2És Y, melyek a jCj sorozatokat jellemző legegyszerűbb mutatók, x 2,..., x 16 és y v y 2 ,..., y 16, számítsa ki a következő képletekkel:


Y értékesítési mennyiség, ezer rubel.

Index

fogyaszt

telsky

költségek

Y értékesítési mennyiség, ezer rubel.

Index

fogyaszt

telsky

költségek

3.2.3. táblázat

l:, - x

(ÉS - U)(x, -x)

(x, - x) 2

(y, - - y) 2

Diszperzió az értékek terjedésének mértékét jellemzi x v x 2,x:

Tekintsük most a 3.2.1. példa megoldását Excelben.

A korreláció Excel segítségével történő kiszámításához használhatja a függvényt =correl(), amely két számoszlop címét adja meg, amint az ábra mutatja. 3.2.2. A válasz D8-ba kerül, és egyenlő 0,816-tal.

Rizs. 3.2.2.

(Megjegyzés: A függvény argumentumai a korreleknek számoknak vagy neveknek, tömböknek vagy számokat tartalmazó hivatkozásoknak kell lenniük. Ha az argumentum, amely egy tömb vagy hivatkozás, szöveget, logikai értékeket vagy üres cellákat tartalmaz, akkor ezeket az értékeket figyelmen kívül hagyja; azonban a nulla értéket tartalmazó cellák számítanak.

Ha tömb! és a tömb2 különböző számú adatponttal rendelkezik, akkor a függvény correl a #n/a hibaértéket adja vissza.

Ha a tömb1 vagy tömb2 üres, vagy ha az értékük o (szórása) nulla, akkor a függvény A correl a #div/0 hibaértéket adja vissza!)

A Student-féle t-statisztika kritikus értéke is megkapható a függvénnyel 1 Excel csomag elosztása. Függvényargumentumként meg kell adnia a szabadságfokok számát P- 2 (16. példánkban - 2= 14) és a szignifikancia szint (példánkban a = 0,1) (3.2.3. ábra). Ha jelenlegi érték A modulo vett /-statisztika nagyobb kritikai, akkor (1 - a) valószínűséggel a korrelációs együttható jelentősen eltér nullától.


Rizs. 3.2.3. A /-statisztika kritikus értéke 1,7613

Az Excel egy sor adatelemző eszközt (úgynevezett elemzési csomagot) tartalmaz, amelyek különféle statisztikai problémák megoldására szolgálnak. A párkorrelációs együtthatók mátrixának kiszámítása R használja a Korrelációs eszközt (3.2.4. ábra) és állítsa be az elemzési paramétereket a megfelelő párbeszédablakban. A válasz egy új munkalapra kerül (3.2.5. ábra).

1 Excel 2010-ben a függvény neve studrasprobr megváltozott stu-

DENT.OBR.2X.

Rizs. 3.2.4.


Rizs. 3.2.5.

  • A korrelációelmélet megalapozói F. Galton (1822-1911) és K. Pearson (1857-1936) angol statisztikusok. A „korreláció” kifejezést a természettudományból kölcsönözték, és „korrelációt, megfelelést” jelent. A korreláció mint a valószínűségi változók közötti kölcsönös függés gondolata a matematikai-statisztikai korrelációelmélet alapja.

2. feladat

1. Szerkessze meg a párkorrelációs együtthatók mátrixát! Ellenőrizze a multikollinearitást. Indokolja a faktorok kiválasztását a modellben!

2. Szerkesszen meg egy többszörös regressziós egyenletet lineáris formában kiválasztott tényezőkkel!

3. Mérje fel a regressziós egyenlet és paraméterei statisztikai szignifikanciáját Fisher és Student tesztek segítségével!

4. Szerkesszünk regressziós egyenletet statisztikailag szignifikáns tényezőkkel! Értékelje a regressziós egyenlet minőségét az R2 determinációs együttható segítségével. Értékelje a megszerkesztett modell pontosságát!

5. Értékelje a termelési mennyiség előrejelzését, ha a tényezők előrejelzett értékei a maximális értékük 75%-a.

Problémakörülmények (21. lehetőség)

Az 1. táblázatban bemutatott adatok szerint (n = 17) az Y termelési mennyiség (millió rubel) függését a következő tényezőktől (változóktól) vizsgáljuk:

X 1 – ipari termelőlétszám, fő.

X 2 – az állóeszközök átlagos éves költsége, millió rubel.

X 3 – tárgyi eszközök értékcsökkenése, %

X 4 – tápegység, kWh.

X 5 – egy munkás technikai felszerelése, millió rubel.

X 6 – piacképes termékek előállítása dolgozónként, dörzsölje.

1. táblázat: Termék kiadási adatok

Y X 1 X 2 X 3 X 4 X 5 X 6
39,5 4,9 3,2
46,4 60,5 20,4
43,7 24,9 9,5
35,7 50,4 34,7
41,8 5,1 17,9
49,8 35,9 12,1
44,1 48,1 18,9
48,1 69,5 12,2
47,6 31,9 8,1
58,6 139,4 29,7
70,4 16,9 5,3
37,5 17,8 5,6
62,0 27,6 12,3
34,4 13,9 3,2
35,4 37,3 19,0
40,8 55,3 19,3
48,1 35,1 12,4


Szerkessze meg a párkorrelációs együtthatók mátrixát! Ellenőrizze a multikollinearitást. Indokolja a faktorok kiválasztását a modellben!

A 2. táblázat mutatja pár korrelációs együttható mátrix a mérlegelésben érintett összes változóra. A mátrixot az eszköz segítségével kaptuk Korreláció a csomagból Adatelemzés V Excel.

2. táblázat. Párkorrelációs együtthatók mátrixa

Y X1 X2 X3 X4 X5 X6
Y
X1 0,995634
X2 0,996949 0,994947
X3 -0,25446 -0,27074 -0,26264
X4 0,12291 0,07251 0,107572 0,248622
X5 0,222946 0,166919 0,219914 -0,07573 0,671386
X6 0,067685 -0,00273 0,041955 -0,28755 0,366382 0,600899

A mátrix vizuális elemzése lehetővé teszi a következők megállapítását:

1) U meglehetősen magas páronkénti korrelációja van az X1, X2 változókkal (>0,5) és alacsony változókkal X3,X4,X5,X6 (<0,5);

2) Az X1, X2 elemzési változók meglehetősen magas páronkénti korrelációt mutatnak, ami szükségessé teszi a köztük lévő multikollinearitás meglétének faktorok ellenőrzését. Ráadásul a klasszikus regressziós modell egyik feltétele a magyarázó változók függetlenségének feltételezése.

A faktorok multikollinearitásának azonosítására végezzük Farrar-Glouber teszt X1, X2 tényezőkkel, X3,X4,X5,X6.

A Farrar-Glouber teszt ellenőrzése a faktorok multikollinearitása szempontjából több szakaszból áll.

1) A változók teljes tömbjének multikollinearitásának ellenőrzése .

A klasszikus regressziós modell egyik feltétele a magyarázó változók függetlenségének feltételezése. A faktorok közötti multikollinearitás azonosításához az R interfaktor-korrelációk mátrixát az Adatelemzési csomag segítségével számítjuk ki (3. táblázat).

3. táblázat Interfaktor korrelációk mátrixa R

X1 X2 X3 X4 X5 X6
X1 0,994947 -0,27074 0,07251 0,166919 -0,00273
X2 0,994947 -0,26264 0,107572 0,219914 0,041955
X3 -0,27074 -0,26264 0,248622 -0,07573 -0,28755
X4 0,07251 0,107572 0,248622 0,671386 0,366382
X5 0,166919 0,219914 -0,07573 0,671386 0,600899
X6 -0,00273 0,041955 -0,28755 0,366382 0,600899

Erős (>0,5) függőség van az X1 és X2, X5 és X4, X6 és X5 faktorok között.

A determináns det (R) = 0,001488 a MOPRED függvény segítségével kerül kiszámításra. Az R mátrix determinánsa nullára hajlik, ami lehetővé teszi, hogy a faktorok általános multikollinearitásáról feltételezzünk.

2) Az egyes változók multikollinearitásának ellenőrzése más változókkal:

· Számítsuk ki az R -1 inverz mátrixot a MOBR Excel függvény segítségével (4. táblázat):

4. táblázat: Inverz mátrix R -1

X1 X2 X3 X4 X5 X6
X1 150,1209 -149,95 3,415228 -1,70527 6,775768 4,236465
X2 -149,95 150,9583 -3,00988 1,591549 -7,10952 -3,91954
X3 3,415228 -3,00988 1,541199 -0,76909 0,325241 0,665121
X4 -1,70527 1,591549 -0,76909 2,218969 -1,4854 -0,213
X5 6,775768 -7,10952 0,325241 -1,4854 2,943718 -0,81434
X6 4,236465 -3,91954 0,665121 -0,213 -0,81434 1,934647

· F-kritériumok számítása, ahol a mátrix átlós elemei vannak, n=17, k = 6 (5. táblázat).

5. táblázat. F-teszt értékei

F1 (X1) F2 (X2) F3 (X3) F4 (X4) F5 (X5) F6 (X6)
89,29396 89,79536 0,324071 0,729921 1,163903 0,559669

· A tényleges F-teszt értékeket összehasonlítja a táblázat értékével F táblázat = 3,21(FDIST(0,05;6;10)), ahol n1= 6 és n2 = n - k – 1=17-6-1=10 szabadságfok és α=0,05 szignifikanciaszint, ahol k a tényezők száma.

· Az X1 és X2 faktorok F-kritériumértékei nagyobbak, mint a táblázatban szereplők, ami a multikollinearitás jelenlétét jelzi e tényezők között. Az X3 faktornak van a legkevesebb hatása a faktorok általános multikollinearitására.

3) Az egyes változópárok multikollinearitásának ellenőrzése

· Számítsuk ki a parciális korrelációs együtthatókat a képlettel, ahol a mátrix elemei vannak (6. táblázat)

6. táblázat. Parciális korrelációs együtthatók mátrixa

X1 X2 X3 X4 X5 X6
X1
X2 0,996086
X3 -0,22453 0,197329
X4 0,093432 -0,08696 0,415882
X5 -0,32232 0,337259 -0,1527 0,581191
X6 -0,24859 0,229354 -0,38519 0,102801 0,341239

· Számítás t-kritériumok a képlet szerint (7. táblázat)

n - adatok száma = 17

K - tényezők száma = 6

7. táblázat.t-próbák parciális korrelációs együtthatókra

X1 X2 X3 X4 X5 X6
X1
X2 35,6355
X3 -0,72862 0,636526
X4 0,296756 -0,27604 1,446126
X5 -1,07674 1,13288 -0,4886 2,258495
X6 -0,81158 0,745143 -1,31991 0,326817 1,147999

t táblázat = STUDARSOBR(0,05;10) = 2,23

A t-próbák tényleges értékeit összehasonlítjuk a táblázat értékével n-k-1 = 17-6-1=10 szabadsági fokokkal és α=0,05 szignifikancia szinttel;

t21 > ttable

t54 > ttable

A 6. és 7. táblázatból jól látható, hogy két faktorpár X1 és X2, X4 és X5 nagy statisztikailag szignifikáns parciális korrelációt mutat, azaz multikollineárisak. A multikollinearitás elkerülése érdekében kizárhatja a kollineáris pár egyik változóját. Az X1 és X2 párban X2-t hagyunk, az X4 és X5 párban X5-öt.

Így a Farrar-Glouber teszt ellenőrzése eredményeként a következő tényezők maradnak meg: X2, X3, X5, X6.

A korrelációelemzési eljárások elvégzésekor célszerű megnézni a kiválasztott faktorok parciális összefüggéseit az eredménnyel Y.

A 8. táblázat adatai alapján építsük fel a páros korrelációs együtthatók mátrixát.

8. táblázat: Termékkimeneti adatok X2, X3, X5, X6 kiválasztott tényezőkkel.

Megfigyelés sz. Y X 2 X 3 X 5 X 6
39,5 3,2
46,4 20,4
43,7 9,5
35,7 34,7
41,8 17,9
49,8 12,1
44,1 18,9
48,1 12,2
47,6 8,1
58,6 29,7
70,4 5,3
37,5 5,6
12,3
34,4 3,2
35,4
40,8 19,3
48,1 12,4

A 9. táblázat utolsó oszlopa az Y oszlop t-teszt értékeit mutatja be.

9. táblázat Az eredménnyel való parciális korrelációs együtthatók mátrixa Y

Y X2 X3 X5 X6 t kritérium (t táblázat (0,05;11) = 2,200985
Y 0,996949 -0,25446 0,222946 0,067685
X2 0,996949 -0,26264 0,219914 0,041955 44,31676
X3 -0,25446 -0,26264 -0,07573 -0,28755 0,916144
X5 0,222946 0,219914 -0,07573 0,600899 -0,88721
X6 0,067685 0,041955 -0,28755 0,600899 1,645749

A 9. táblázatból jól látható, hogy a változó Y magas és egyben statisztikailag szignifikáns parciális korrelációt mutat a faktor X2.


Y x 1 x 2 x 3 x 4 x 5 x 6
Y
x 1 0,519
x 2 -0,273 0,030
x 3 0,610 0,813 -0,116
x 4 -0,572 -0,013 -0,022 -0,091
x 5 0,297 0,043 -0,461 0,120 -0,359
x 6 0,118 -0,366 -0,061 -0,329 -0,100 -0,290

Elemzés interfaktorális(az „X-ek” között!) korrelációs együtthatók azt mutatják, hogy a 0,8 érték meghaladja abszolút értékben csak a faktorpár közötti korrelációs együttható x 1 –x 3 (félkövér). Tényezők x 1 –xígy a 3. ábrát kollineárisnak ismerjük el.

2. Ahogy az 1. bekezdésben látható, tényezők x 1 –x A 3. ábrák kollineárisak, ami azt jelenti, hogy gyakorlatilag egymás másodpéldányai, és egyidejű felvételük a modellbe a megfelelő regressziós együtthatók hibás értelmezéséhez vezet. Egyértelmű, hogy a tényező x 3 van egy nagyobb modulo korrelációs együttható az eredménnyel Y mint tényező x 1: r y , x 1 =0,519; r y , x 3 = 0,610; (cm. asztal 1). Ez a faktor erősebb hatását jelzi x Változásonként 3 Y. Tényező x Az 1. pont ezért ki van zárva a mérlegelésből.

A regressziós egyenlet összeállításához a használt változók értékeit ( Y,x 2 , x 3 , x 4 , x 5 , x 6) másolás egy üres munkalapra ( adj. 3). A regressziós egyenletet a " bővítmény segítségével állítjuk össze Adatelemzés...Regresszió" (menü " Szolgáltatás"® « Adatelemzés…» ® « Regresszió"). Megjelenik a kitöltött mezőket tartalmazó regressziós elemzés panel rizs. 2.

A regressziós analízis eredményeit az alábbiakban közöljük adj. 4és odaköltözött asztal 2. A regressziós egyenlet alakja (lásd " Esély" V asztal 2):

A regressziós egyenlet statisztikailag szignifikánsnak tekinthető, mivel véletlenszerű kialakulásának valószínűsége abban a formában, amelyben megkaptuk, 8,80 × 10 -6 (lásd. "F szignifikancia" V asztal 2), ami szignifikánsan alacsonyabb, mint az elfogadott a=0,05 szignifikanciaszint.

x 3 , x 4 , x 6 az elfogadott szignifikanciaszint alatt, a=0,05 (lásd „ P-érték" V asztal 2), amely jelzi az együtthatók statisztikai szignifikanciáját és e tényezők szignifikáns hatását az éves eredmény változására Y.

Tényezők együtthatóinak véletlenszerű képződésének valószínűsége x 2 és x 5 meghaladja az elfogadott szignifikancia szintet a=0,05 (lásd " P-érték" V asztal 2), és ezek az együtthatók statisztikailag nem tekinthetők szignifikánsnak.

rizs. 2. Modell regresszióelemző panel Y(x 2 , x 3 , x 4 , x 5 , x 6)

2. táblázat

Y(x 2 , x 3 , x 4 , x 5 , x 6)

Regressziós statisztika
Többes szám R 0,868
R-négyzet 0,753
Normalizált R-négyzet 0,694
Standard hiba 242,3
Észrevételek
Varianciaanalízis
df SS KISASSZONY F Jelentősége F
Regresszió 3749838,2 749967,6 12,78 8.80E-06
Maradék 1232466,8 58688,9
Teljes 4982305,0
Regressziós egyenlet
Esély Standard hiba t-statisztika P-érték
Y kereszteződés 487,5 641,4 0,760 0,456
X2 -0,0456 0,0373 -1,224 0,235
X3 0,1043 0,0194 5,375 0,00002
X4 -0,0965 0,0263 -3,674 0,001
X5 2,528 6,323 0,400 0,693
X6 248,2 113,0 2,197 0,039

3. Az előző bekezdésben elvégzett regressziós egyenletegyütthatók statisztikai szignifikancia ellenőrzésének eredményei alapján új, csak informatív tényezőket tartalmazó regressziós modellt építünk fel, amely a következőket tartalmazza:

· olyan tényezők, amelyek együtthatói statisztikailag szignifikánsak;

tényezők, amelyek együtthatói t-statisztika abszolút értékben meghaladja az egyet (más szóval, az együttható abszolút értéke nagyobb, mint a standard hibája).

Az első csoportba a tényezők tartoznak x 3 , x 4 , x 6, a második - tényező x 2. Tényező x Az 5. minta nem informatív, és a végső regressziós modell faktorokat fog tartalmazni x 2 , x 3 , x 4 , x 6 .

Regressziós egyenlet felépítéséhez másolja át a használt változók értékeit egy üres munkalapra ( adj. 5)és végezzen regressziós elemzést ( rizs. 3). Eredményeit közöljük adj. 6és odaköltözött asztal 3. A regressziós egyenlet a következő:

(cm." Esély" V asztal 3).

rizs. 3. Modell regresszióelemző panel Y(x 2 , x 3 , x 4 , x 6)

3. táblázat

A modell regressziós elemzésének eredményei Y(x 2 , x 3 , x 4 , x 6)

Regressziós statisztika
Többes szám R 0,866
R-négyzet 0,751
Normalizált R-négyzet 0,705
Standard hiba 237,6
Észrevételek
Varianciaanalízis
df SS KISASSZONY F Jelentősége F
Regresszió 3740456,2 935114,1 16,57 2.14E-06
Maradék 1241848,7 56447,7
Teljes 4982305,0
Regressziós egyenlet
Esély Standard hiba t-statisztika P-érték
Y kereszteződés 712,2 303,0 2,351 0,028
X2 -0,0541 0,0300 -1,806 0,085
X3 0,1032 0,0188 5,476 0,00002
X4 -0,1017 0,0223 -4,560 0,00015
X6 227,5 98,5 2,310 0,031

A regressziós egyenlet statisztikailag szignifikáns: véletlenszerű kialakulásának valószínűsége az a=0,05 elfogadható szignifikancia szint alatt van (lásd “ Jelentősége F" V asztal 3).

A tényezők együtthatói statisztikailag is szignifikánsnak minősülnek x 3 , x 4 , x 6: véletlenszerű kialakulásuk valószínűsége az a=0,05 elfogadható szignifikanciaszint alatt van (lásd “ P-érték" V asztal 3). Ez az éves biztosítási díjak jelentős hatását jelzi x 3, a biztosítási kifizetések éves összege x 4. és a tulajdoni formák x 6 éves nyereség változásonként Y.

Tényező együttható x 2 (biztosítási tartalék éves nagysága) statisztikailag nem szignifikáns. Ez a tényező azonban továbbra is informatívnak tekinthető, hiszen t-együtthatójának statisztikája meghaladja modulo egység, bár további következtetések a faktorral kapcsolatban x 2-vel némi óvatossággal kell bánni.

4. Értékeljük az utolsó regressziós egyenlet minőségét és pontosságát a regresszióanalízis során kapott statisztikai jellemzők segítségével (ld. . « Regressziós statisztika"V asztal 3):

többszörös determinációs együttható

azt mutatja, hogy a regressziós modell az éves profit változásának 75,1%-át magyarázza Y, és ez a változás a regressziós modellben szereplő tényezők változásaiból adódik x 2 , x 3 , x 4 és x 6 ;

standard regressziós hiba

ezer rubel.

azt mutatja, hogy a regressziós egyenlet által megjósolt éves nyereség értékei Yátlagosan 237,6 ezer rubel eltér a tényleges értékektől.

Az átlagos relatív közelítési hibát a közelítő képlet határozza meg:

Ahol ezer rubel. - átlagos éves nyereség (a beépített függvény segítségével meghatározva" ÁTLAGOS»; adj. 1).

E rel azt mutatja, hogy a regressziós egyenlet által megjósolt éves nyereség értékei Yátlagosan 26,7%-kal térnek el a tényleges értékektől. A modell pontossága nem kielégítő (at - a modell pontossága magas, - jó, vele - kielégítő, - nem kielégítő).

5. A regressziós egyenlet együtthatóinak közgazdasági értelmezéséhez táblázatba foglaljuk a forrásadatokban szereplő változók átlagértékeit és szórását ( asztal 4) . Az átlagértékeket a beépített függvény segítségével határoztuk meg. ÁTLAGOS", szórás - a beépített funkció segítségével" SZABVÁNYELTÉRÉS" (cm. adj. 1).

A 2011-es adatok az Orosz Föderáció déli szövetségi körzetének területeire vonatkoznak

A szövetségi körzet területei

Bruttó regionális termék, milliárd rubel, Y

Befektetett eszközök, milliárd rubel, X1

1. Rep. Adygea

2. Rep. Dagesztán

3. Rep. Ingusföld

4. Kabard-Balkár Köztársaság

5. Rep. Kalmykia

6. Karacsáj-Cserkesz Köztársaság

7. Rep. Észak-Oszétia Alania

8. Krasznodari régió)

9. Sztavropol régió

10. Asztrahán régió.

11. Volgográdi régió.

12. Rostov régió.

  • 1. Számítsa ki a párkorrelációs együtthatók mátrixát! értékelje a korrelációs együtthatók statisztikai szignifikanciáját.
  • 2. Szerkesszen meg egy korrelációs mezőt az effektív jellemző és a vele legszorosabban kapcsolódó tényező között!
  • 3. Számítsa ki a lineáris párregresszió paramétereit minden X faktorhoz.
  • 4. Értékelje az egyes modellek minőségét a determinációs együttható, a közelítés átlagos hibája és a Fisher-féle F teszt segítségével. Válassza ki a legjobb modellt.

a maximális érték 80%-a lesz. Grafikus bemutatása: tényleges és modellértékek, előrejelzési pontok.

  • 6. Lépésről lépésre többszörös regressziót alkalmazva (kizárási módszer vagy inklúziós módszer) építse fel a lakások árképzésének modelljét jelentős tényezők hatására. Adja meg a regressziós modell együtthatóinak közgazdasági értelmezését!
  • 7. Értékelje az elkészített modell minőségét! Javult a modell minősége az egytényezős modellhez képest? Értékelje a szignifikáns tényezők hatását az eredményre a rugalmassági együtthatók segítségével, - és -? együtthatók

A probléma megoldása során számításokat végzünk, grafikonokat és diagramokat készítünk az Excel adatelemzési beállításaival.

1. Számítsa ki a párkorrelációs együtthatók mátrixát és értékelje a korrelációs együtthatók statisztikai szignifikanciáját

A Korreláció párbeszédpanel Beviteli intervallum mezőjében adja meg a forrásadatokat tartalmazó cellák tartományát. Mivel az oszlopfejléceket is kijelöltük, az első sorban bejelöljük a Címkék jelölőnégyzetet.

A következő eredményeket kaptuk:

1.1. táblázat Párkorrelációs együtthatók mátrixa

A páronkénti korrelációs együtthatók mátrixának elemzése azt mutatja, hogy az Y függő változó, azaz a bruttó regionális termék szorosabb kapcsolatban áll X1-gyel (állandó tőkebefektetés). A korrelációs együttható 0,936. Ez azt jelenti, hogy az Y függő változó (bruttó regionális termék) 93,6%-a az X1 mutatótól (állandó tőkebefektetés) függ.

A korrelációs együtthatók statisztikai szignifikanciáját Student-féle t-próbával határozzuk meg. Összehasonlítjuk a táblázat értékét a számított értékekkel.

Számítsuk ki a táblázat értékét a STUDISCOVER függvény segítségével.

t táblázat = 0,129 0,9-es konfidenciaszinttel és szabadságfokkal (n-2).

Az X1 faktor statisztikailag szignifikáns.

2. Szerkesszünk meg egy korrelációs mezőt az effektív tulajdonság (bruttó regionális termék) és a vele legszorosabban kapcsolódó tényező (állandó tőkebefektetés) között!

Ehhez az Excel szóródási eszközét fogjuk használni.

Ennek eredményeként egy korrelációs mezőt kapunk a bruttó regionális termék árára, milliárd rubelre. és tárgyi eszközökbe történő befektetések, milliárd rubel. (1.1. ábra).

1.1. ábra

3. Számítsa ki a lineáris párregresszió paramétereit minden X faktorhoz!

A lineáris páronkénti regresszió paramétereinek kiszámításához az Adatelemzés beállításban található Regresszió eszközt fogjuk használni.

A Regresszió párbeszédpanel Y Beviteli intervallum mezőjében adja meg a függő változó által képviselt cellatartomány címét. A terepen

Az X beviteli intervallum megadjuk annak a tartománynak a címét, amely a független változók értékeit tartalmazza. Számítsuk ki a páros regresszió paramétereit X faktorra.

X1-re az 1.2. táblázatban bemutatott alábbi adatokat kaptuk:

1.2. táblázat

A bruttó regionális termék árának az állótőke-befektetéstől való függésének regressziós egyenlete a következő:

4. Értékeljük az egyes modellek minőségét a determinációs együttható, a közelítés átlagos hibája és a Fisher-féle F-próba segítségével. Határozzuk meg, melyik modell a legjobb.

A determinációs együtthatót, a közelítés átlagos hibáját a 3. bekezdésben elvégzett számítások eredményeként kaptuk meg. A kapott adatokat a következő táblázatok mutatják be:

X1 adatok:

1.3a. táblázat

1.4b. táblázat

A) A determinációs együttható határozza meg, hogy az Y tulajdonság változásának mekkora hányadát veszi figyelembe a modell, és az X faktor rá gyakorolt ​​hatásának köszönhető. Minél nagyobb a determinációs együttható értéke, annál szorosabb a kapcsolat a jellemzők a felépített matematikai modellben.

Az Excel az R-négyzetre utal.

E kritérium alapján a legmegfelelőbb modell a bruttó regionális termék árának az állótőke-befektetéstől való függésének regressziós egyenlete (X1).

B) Kiszámoljuk az átlagos közelítési hibát a következő képlettel:

ahol a számláló a számított értékek és a tényleges értékektől való eltérés négyzeteinek összege. A táblázatokban az SS oszlopban, a maradék sorban található.

Egy lakás átlagárát Excelben számoljuk ki az AVERAGE függvény segítségével. = 24,18182 milliárd rubel.

A gazdaságossági számítások elvégzésekor egy modell akkor tekinthető kellően pontosnak, ha a közelítés átlagos hibája 5%-nál kisebb, a modellt pedig akkor tekintjük elfogadhatónak, ha a közelítés átlagos hibája 15%-nál kisebb.

E kritérium szerint a legmegfelelőbb a regionális bruttó termék árának az állótőke-befektetéstől való függésének regressziós egyenletének matematikai modellje (X1).

C) Az F-próba a regressziós modell szignifikanciájának tesztelésére szolgál. Ehhez a Fisher F-teszt kritikus (táblázatos) értékeit is összehasonlítjuk.

A számított értékeket az 1.4b táblázat tartalmazza (F betűvel jelölve).

A Fisher-féle F-teszt táblázatos értékét Excelben az FDIST függvény segítségével számítjuk ki. Vegyük a 0,05 valószínűséget. Beérkezett: = 4,75

A Fisher-féle F-teszt kiszámított értékei az egyes tényezőkre összehasonlíthatók a táblázatban szereplő értékekkel:

71,02 > = 4,75 a modell e kritérium szerint megfelelő.

Az adatokat mindhárom kritérium szerint elemezve megállapíthatjuk, hogy a legjobb matematikai modell a bruttó regionális terméktényezőre épül fel, amelyet a lineáris egyenlet ír le.

5. A bruttó regionális termék árának függőségi modelljéhez

A mutató átlagos értékét szignifikancia szinten fogjuk megjósolni, ha a faktor előrejelzett értéke a maximális érték 80%-a. Mutassuk be grafikusan: tényleges és modell értékek, előrejelzési pontok.

Számítsuk ki X előrejelzett értékét, amely a feltétel szerint a maximális érték 80%-a lesz.

Számítsuk ki az X max-ot az Excelben a MAX függvény segítségével.

0,8 *52,8 = 42,24

A függő változó prediktív becsléséhez a független változó kapott értékét behelyettesítjük a lineáris egyenletbe:

5,07+2,14*42,24 = 304,55 milliárd rubel.

Határozzuk meg az előrejelzés konfidencia intervallumát, amelynek a következő határai lesznek:

Az előrejelzett érték konfidenciaintervallumának kiszámításához kiszámítjuk a regressziós egyenestől való eltérést.

Páros regressziós modell esetén az eltérési érték kiszámítása:

azok. standard hibaérték az 1.5a táblázatból.

(Mivel a szabadságfok száma eggyel egyenlő, a nevező n-2 lesz). korrelációs pár regressziós előrejelzés

Az együttható kiszámításához az Excel STUDISCOVER függvényét használjuk, amelynek valószínűsége 0,1, a szabadságfok száma pedig 38.

Az értéket Excel segítségével számítjuk ki, és 12294-et kapunk.


Határozzuk meg az intervallum felső és alsó határát.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Így az előrejelzett érték = 304,55 ezer dollár a 277,078 ezer dollárral egyenlő alsó határ között lesz. és felső határa 332,022 milliárd. Dörzsölés.

A tényleges és modell értékeket, előrejelzési pontokat grafikusan az 1.2. ábra mutatja be.


1.2. ábra

6. Lépésről lépésre többszörös regresszióval (eliminációs módszerrel) modellt építünk a bruttó regionális termék árának jelentős tényezők hatására történő alakulására.

Többszörös regresszió felépítéséhez az Excel regressziós függvényét használjuk, beleértve az összes tényezőt. Ennek eredményeként megkapjuk az eredménytáblázatokat, amelyekből szükségünk van a Student-féle t-próbára.

1.8a. táblázat

1.8b. táblázat

1.8c. táblázat.

Ilyen modellt kapunk:

Mert a< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Válasszuk ki a Student-féle t-próba legkisebb abszolút értékét, ez egyenlő 8,427-tel, hasonlítsuk össze a táblázatos értékkel, amelyet Excelben számolunk, vegyük a 0,10-es szignifikanciaszintet, a szabadságfokok száma n-m-1= 12-4=8: =1,8595

Mivel a 8.427>1.8595 a modell megfelelőnek tekinthető.

7. A kapott matematikai modell szignifikáns tényezőjének értékeléséhez kiszámítjuk a rugalmassági együtthatókat, és - együtthatókat

A rugalmassági együttható megmutatja, hogy az effektív attribútum hány százalékkal változik, ha a faktorattribútum 1%-kal változik:

E X4 = 2,137 * (10,69/24,182) = 0,94%

Azaz az állótőke-befektetés 1%-os növekedésével a költség átlagosan 0,94%-kal nő.

Az együttható megmutatja, hogy a szórás mekkora részével változik a függő változó átlagos értéke a független változó egy szórásnyi változásával.

2,137* (14.736/33,632) = 0,936.

A szórásadatok a Leíró statisztika eszközzel nyert táblázatokból származnak.

1.11. táblázat Leíró statisztikák (Y)

1.12. táblázat Leíró statisztikák (X4)

Az együttható meghatározza a tényező befolyásának arányát az összes tényező összhatásában:

A párkorrelációs együtthatók kiszámításához kiszámítjuk a párkorrelációs együtthatók mátrixát az Excelben az Adatelemzés beállításaiban található Korrelációs eszköz segítségével.

1.14. táblázat

(0,93633*0,93626) / 0,87 = 1,00.

Következtetés: A kapott számításokból arra a következtetésre juthatunk, hogy az Y effektív attribútum (bruttó regionális termék) nagymértékben (100%-kal) függ az X1 tényezőtől (állandó tőkebefektetés).

Bibliográfia

  • 1. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ökonometria. Kezdő tanfolyam. Oktatóanyag. 2. kiadás - M.: Delo, 1998. - p. 69-74.
  • 2. Workshop az ökonometriáról: Tankönyv / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko és munkatársai 2002. - p. 49-105.
  • 3. Dougherty K. Bevezetés az ökonometriába: Ford. angolról - M.: INFRA-M, 1999. - XIV, p. 262-285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Alkalmazott matematika és az ökonometria alapjai. -1998., 115-147.
  • 5. Kremer N.Sh., Putko B.A. Ökonometria. -2007. 175-251 között.
y x (1) x (2) x (3) x (4) x (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

A páros korrelációs együtthatók mátrixának elemzése azt mutatja, hogy az effektív mutató a legszorosabban kapcsolódik az indikátorhoz x(4) - az 1 hektáronként elfogyasztott műtrágya mennyisége ().

Ugyanakkor az attribútumok-argumentumok között meglehetősen szoros a kapcsolat. Így gyakorlatilag funkcionális kapcsolat van a kerekes traktorok száma között ( x(1) bekezdése) és a felszíni talajművelő szerszámok száma .

A multikollinearitás jelenlétét a és a korrelációs együtthatók is jelzik. Figyelembe véve a mutatók közötti szoros kapcsolatot x (1) , x(2) és x(3) szerint ezek közül csak egy szerepelhet a hozamregressziós modellben.

A multikollinearitás negatív hatásának bemutatásához vegye figyelembe a hozam regressziós modelljét, amely tartalmazza az összes bemeneti mutatót:

F obs = 121.

Az egyenlet együtthatóinak becslései szórásának korrigált becsléseinek értékei zárójelben vannak feltüntetve .

A regressziós egyenlet alatt a következő megfelelőségi paramétereket mutatjuk be: többszörös determinációs együttható; a reziduális variancia korrigált becslése, a közelítés átlagos relatív hibája és az F obs = 121 kritérium számított értéke.

A regressziós egyenlet azért jelentős, mert F obs = 121 > F kp = 2,85 a táblázatból találva F-eloszlások a=0,05-nél; n1=6 és n2=14.

Ebből következik, hogy Q¹0, i.e. és a q egyenlet legalább egyik együtthatója j (j= 0, 1, 2, ..., 5) nem nulla.

A H0 egyéni regressziós együtthatók szignifikanciájára vonatkozó hipotézis teszteléséhez: q j =0, ahol j=1,2,3,4,5, hasonlítsa össze a kritikus értéket t kp = 2,14, a táblázatból megállapítva t-eloszlások szignifikancia szinten a=2 K=0,05 és a szabadságfokok száma n=14, a számított értékkel. Az egyenletből következik, hogy a regressziós együttható statisztikailag csak akkor szignifikáns x(4) ½ óta t 4 ½ = 2,90 > t kp = 2,14.



A regressziós együtthatók negatív előjelei nem alkalmasak közgazdasági értelmezésre, amikor x(1) és x(5) . Az együtthatók negatív értékeiből az következik, hogy a mezőgazdaság kerekes traktorokkal való telítettségének növekedése ( x(1) és növény-egészségügyi termékek ( x(5) bekezdése) negatív hatással van a hozamra. Ezért a kapott regressziós egyenlet elfogadhatatlan.

Ahhoz, hogy szignifikáns együtthatókat tartalmazó regressziós egyenletet kapjunk, lépésenkénti regresszióelemző algoritmust használunk. Kezdetben lépésenkénti algoritmust használunk a változók kiiktatásával.

Zárjuk ki a változót a modellből x(1) , amely ½ minimális abszolút értékének felel meg t 1½ = 0,01. A többi változóhoz ismét megszerkesztjük a regressziós egyenletet:

A kapott egyenlet szignifikáns, mert F megfigyelt = 155 > F kp = 2,90, a szignifikancia szinten a = 0,05 és a szabadsági fokok száma n 1 = 5 és n 2 = 15 a táblázat szerint. F-elosztás, azaz. vektor q¹0. Azonban csak a regressziós együttható at x(4) . Becsült értékek ½ t j ½ más együtthatók esetén kisebb t kr = 2,131, a táblázatból megállapítva t-eloszlások a=2-nél K= 0,05 és n = 15.

A változó modellből való kizárásával x(3) , amely a minimális értéknek felel meg t 3 =0,35 és megkapjuk a regressziós egyenletet:

(2.9)

A kapott egyenletben az együttható at x(5) . Kizárással x(5) megkapjuk a regressziós egyenletet:

(2.10)

Szignifikáns regressziós egyenletet kaptunk szignifikáns és értelmezhető együtthatókkal.

A kapott egyenlet azonban nem az egyetlen „jó” és nem a „legjobb” hozammodell a példánkban.

Mutassuk meg multikollinearitási feltételben a változók beépítésével végzett lépésenkénti algoritmus hatékonyabb. A hozammodell első lépése y változó tartalmazza x(4) , amely a legmagasabb korrelációs együtthatóval rendelkezik y, a - változóval magyarázható r(y,x(4) = 0,58. A második lépésben, beleértve az egyenletet együtt x(4) változók x(1) vagy x(3) alapján olyan modelleket kapunk, amelyek gazdasági okokból és statisztikai jellemzők miatt meghaladja a (2.10):

(2.11)

(2.12)

A három fennmaradó változó bármelyikének az egyenletbe való belefoglalása rontja annak tulajdonságait. Lásd például a (2.9) egyenletet.

Így van három „jó” hozammodellünk, amelyek közül közgazdasági és statisztikai okokból egyet kell választanunk.

A statisztikai kritériumok szerint a (2.11) modell a legmegfelelőbb. Ez megfelel a reziduális variancia minimális értékeinek = 2,26 és a közelítés átlagos relatív hibájának és a legnagyobb értékeknek és a Fob = 273-nak.

A (2.12) modellnek valamivel rosszabbak a megfelelőségi mutatói, ezt követi a (2.10) modell.

Most a (2.11) és (2.12) modellek közül a legjobbat választjuk ki. Ezek a modellek változókban különböznek egymástól x(1) és x(3) . A hozammodellekben azonban a változó x(1) (kerekes traktorok száma 100 ha-ra) előnyösebb, mint a változó x(3) (felszíni talajművelő eszközök száma 100 ha-ra), amely bizonyos mértékig másodlagos (vagy abból ered x (1)).

E tekintetben gazdasági okokból előnyben kell részesíteni a (2.12) modellt. Így a lépésenkénti regresszióanalízis algoritmus változók bevonásával történő megvalósítása után, figyelembe véve azt a tényt, hogy a három kapcsolódó változó közül csak egy kerüljön be az egyenletbe ( x (1) , x(2) vagy x(3)) válassza ki a végső regressziós egyenletet:

Az egyenlet szignifikáns a=0,05-nél, mert F obs = 266 > F kp = 3,20, a táblázatból találva F-elosztások a=-nál K=0,05; n1=3 és n2=17. A ½ egyenletben szereplő összes regressziós együttható szintén szignifikáns t j½> t kp(a=2 K=0,05; n=17)=2,11. A q 1 regressziós együtthatót gazdasági okokból szignifikánsnak kell tekinteni (q 1 ¹0), míg t 1 = 2,09 csak valamivel kevesebb t kp = 2,11.

A regressziós egyenletből az következik, hogy a 100 hektár szántóterületre jutó traktorok számának eggyel növekedése (fix értéken x(4)) a szemtermés átlagosan 0,345 c/ha-os növekedéséhez vezet.

Az e 1 »0,068 és e 2 »0,161 rugalmassági együtthatók közelítő számítása azt mutatja, hogy növekvő mutatók mellett x(1) és x(4) 1%-kal, a szemtermés átlagosan 0,068, illetve 0,161%-kal nő.

A többszörös determinációs együttható azt jelzi, hogy a hozamingadozásnak csak 46,9%-át magyarázzák a modellben szereplő mutatók ( x(1) és x(4)), vagyis a növénytermesztés traktorokkal és műtrágyákkal való telítése. Az eltérés többi része fel nem vett tényezők hatására ( x (2) , x (3) , x(5), időjárási viszonyok stb.). A közelítés átlagos relatív hibája jellemzi a modell megfelelőségét, valamint a reziduális variancia értékét. A regressziós egyenlet értelmezésekor a közelítés relatív hibáinak értékei érdekesek . Emlékezzünk vissza, hogy - az effektív mutató modellértéke a vizsgált régiók összességére jellemző termésátlagértéket jellemzi, feltéve, hogy a magyarázó változók értékei x(1) és x(4) ugyanazon a szinten vannak rögzítve, nevezetesen x (1) = x i(1) és x (4) = x i(4) . Ezután a d értékei szerint énÖsszehasonlíthatja a régiókat hozam alapján. Területek, amelyeknek d értékek felelnek meg én>0, átlag feletti hozamúak, és d én<0 - ниже среднего.

Példánkban a terméshozam szempontjából a d-nek megfelelő területen a legeredményesebb a növénytermesztés 7 =28%, ahol a hozam 28%-kal magasabb a régiós átlagnál, és a legkevésbé hatékony a d 20 =-27,3%.


Feladatok és gyakorlatok

2.1. Az általános lakosságból ( y, x (1) , ..., x(p)), hol y normális eloszlási törvénye van feltételes matematikai várakozással és s 2 szórással, véletlenszerű mintával n, elengedni ( y i, x i (1) , ..., x i(p)) - eredmény én megfigyelés ( én=1, 2, ..., n). Határozzuk meg: a) a vektor legkisebb négyzetes becslésének matematikai elvárását! q; b) a vektor legkisebb négyzetes becslésének kovarianciamátrixa q; c) az értékelés matematikai elvárása.

2.2. A 2.1. feladat feltételei szerint keresse meg a regresszióból adódó eltérések négyzetes összegének matematikai elvárását, azaz! EQ R, Ahol

.

2.3. A 2.1. feladat feltételei szerint határozza meg a regressziós egyenesekhez viszonyított reziduális variáció okozta eltérések négyzetes összegének matematikai elvárását, azaz! EQ ost, hol

2.4. Bizonyítsuk be, hogy ha a H 0 hipotézis teljesül: q=0 statisztika

F-eloszlása ​​n 1 =p+1 és n 2 =n-p-1 szabadsági fokokkal rendelkezik.

2.5. Bizonyítsuk be, hogy a H 0: q j =0 hipotézis teljesülésekor a statisztika n=n-p-1 szabadságfokszámú t-eloszlású.

2.6. A takarmánykenyér zsugorodása függésének adatai alapján (2.3. táblázat) ( y) a tárolás időtartamáról ( x) keresse meg a feltételes várakozás pontbecslését azzal a feltételezéssel, hogy az általános regressziós egyenlet lineáris.

2.3. táblázat.

Szükséges: a) keresse meg az s 2 maradék variancia becsléseit azzal a feltételezéssel, hogy az általános regressziós egyenlet alakja ; b) ellenőrizze a=0,05-nél a regressziós egyenlet szignifikanciáját, i.e. hipotézis H 0: q=0; c) g=0,9 megbízhatósággal határozza meg a q 0, q 1 paraméterek intervallumbecsléseit; d) g=0,95 megbízhatósággal határozza meg a feltételes matematikai elvárás intervallumbecslését x 0 =6; e) határozza meg g=0,95-nél az előrejelzés konfidencia intervallumát a pontban x=12.

2.7. Táblázatban szereplő, a részvényárak növekedési ütemének 5 hónapos dinamikájára vonatkozó adatok alapján. 2.4.

2.4. táblázat.

hónapok ( x)
y (%)

és feltételezve, hogy az általános regressziós egyenlet alakja , szükséges: a) becslések meghatározása mind a regressziós egyenlet paramétereire, mind az s 2 maradék variancia értékére; b) ellenőrizze a=0,01-nél a regressziós együttható szignifikanciáját, azaz. hipotézisek H 0: q 1 =0;

c) g=0,95 megbízhatósággal keresse meg a q 0 és q 1 paraméterek intervallumbecsléseit; d) g=0,9 megbízhatósággal állítsa fel a feltételes matematikai elvárás intervallumbecslését x 0 = 4; e) határozza meg g=0,9-nél az előrejelzés konfidencia intervallumát a pontban x=5.

2.8. A fiatal állatok súlygyarapodási dinamikájának vizsgálatának eredményeit a 2.5. táblázat tartalmazza.

2.5. táblázat.

Feltételezve, hogy az általános regressziós egyenlet lineáris, szükséges: a) meghatározni a regressziós egyenlet paramétereinek és az s 2 reziduális variancia becsléseit; b) ellenőrizze a=0,05-nél a regressziós egyenlet szignifikanciáját, i.e. hipotézisek H 0: q=0;

c) g=0,8 megbízhatósággal keresse meg a q 0 és q 1 paraméterek intervallumbecslését; d) g=0,98 megbízhatósággal határozza meg és hasonlítsa össze a feltételes matematikai várakozás intervallumbecsléseit x 0 =3 és x 1 =6;

e) határozza meg g=0,98-nál az előrejelzés konfidencia intervallumát a pontban x=8.

2.9. Költség ( y) egy példány a könyvből a példányszámtól függően ( x) (ezer példányban) a kiadó által gyűjtött adatok jellemzik (2.6. táblázat). Határozza meg egy hiperbolikus regressziós egyenlet legkisebb négyzetes becsléseit és paramétereit g=0,9 megbízhatósággal, alkosson konfidenciaintervallumot a q 0 és q 1 paraméterekhez, valamint a feltételes várakozást x=10.

2.6. táblázat.

Határozza meg a forma regressziós egyenletének becsléseit és paramétereit, tesztelje a H 0 hipotézist a = 0,05: q 1 = 0 mellett, és alkosson konfidenciaintervallumokat g = 0,9 megbízhatósággal a q 0 és q 1 paraméterekre, valamint a feltételes matematikai várakozásra x=20.

2.11. táblázatban A 2.8 a következő makrogazdasági mutatók növekedési ütemére (%) mutatott be adatokat n= a világ 10 fejlett országa 1992-ben: GNP - x(1) , ipari termelés - x(2) , árindex - x (3) .

2.8. táblázat.

Országok x és a regressziós egyenlet paraméterei, a reziduális variancia becslése; b) ellenőrizze a=0,05-nél a regressziós együttható szignifikanciáját, azaz. H 0: q 1 = 0; c) g=0,9 megbízhatósággal keressük meg a q 0 és q 1 intervallumbecsléseket; d) keresse meg g=0,95-nél a pont konfidenciaintervallumát x 0 =x i, Ahol én=5; e) hasonlítsa össze az 1., 2. és 3. regressziós egyenletek statisztikai jellemzőit!

2.12. Oldja meg a 2.11. feladatot úgy, hogy ( nál nél) index x(1) , valamint a magyarázó ( x) változó x (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Alkalmazott statisztika és az ökonometria alapjai: Tankönyv. M., UNITY, 1998 (2. kiadás, 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Alkalmazott statisztika feladatokban és gyakorlatokban: Tankönyv. M. UNITY - DANA, 2001;

3. Ayvazyan S.A., Enyukov I.S., Meshalkin L.D. Alkalmazott statisztika. Függőségkutatás. M., Pénzügy és Statisztika, 1985, 487 pp.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov I.S., Meshalkin L.D. Alkalmazott statisztika. Osztályozás és méretcsökkentés. M., Pénzügy és Statisztika, 1989, 607 pp.;

5. Johnston J. Ökonometriai módszerek, M.: Statisztika, 1980, 446 pp.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Többváltozós statisztikai módszerek. M., Pénzügy és Statisztika, 2000;

7. Mkhitaryan V.S., Troshin L.I. Függőségek vizsgálata korrelációs és regressziós módszerekkel. M., MESI, 1995, 120 pp.;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Többváltozós statisztikai módszerek a közgazdaságtanban. M., MESI, 1995, 149 pp.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Matematikai statisztikák üzletemberek és vezetők számára. M., MESI, 2000, 140 pp.;

10. Lukashin Yu.I. Regressziós és adaptív előrejelzési módszerek: Tankönyv, M., MESI, 1997.

11. Lukasin Yu.I. A rövid távú előrejelzés adaptív módszerei. - M., Statisztika, 1979.


ALKALMAZÁSOK


1. számú melléklet. Önálló számítógépes kutatások feladatainak lehetőségei.

KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2023 „kingad.ru” - az emberi szervek ultrahangvizsgálata