Többszörös korrelációs együttható meghatározása MS Excelben.

Kezdetben a modellbe nál nél tartalmazza az összes fő összetevőt (a számított értékek zárójelben vannak feltüntetve t-kritériumok):

A modell minőségét a következők jellemzik: többszörös determinációs együttható r= 0,517, átlagos relatív közelítési hiba = 10,4%, reziduális variancia s2= 1,79 és F obs = 121. Tekintettel arra, hogy F obs > F cr = 2,85, α = 0,05, v1 = 6, v2= 14, a regressziós egyenlet szignifikáns, és a regressziós együtthatók legalább egyike - β 1, β 2, β 3, β 4 - nem egyenlő nullával.

Ha a regressziós egyenlet jelentősége (hipotézis H 0:β 1 = β 2 = β 3 = β 4 = 0-t α = 0,05-nél ellenőriztük, majd a regressziós együtthatók szignifikanciáját, i.e. hipotéziseket H0: β j = 0 (j= 1, 2, 3, 4), 0,05-nél nagyobb szignifikanciaszinten kell ellenőrizni, például α-nál = 0.1. Ekkor α = 0,1 esetén v= 14 érték t kr = 1,76, és az (53,41) egyenletből következően szignifikánsak a β 1 ​​, β 2 , β 3 regressziós együtthatók.

Tekintettel arra, hogy a fő komponensek nem korrelálnak egymással, azonnal kizárhatunk minden jelentéktelen együtthatót az egyenletből, és az egyenlet a következő formát ölti

(53.42)

Az (53.41) és (53.42) egyenleteket összehasonlítva azt látjuk, hogy a jelentéktelen főkomponensek kiiktatása f4és f5, nem befolyásolta az egyenlet együtthatóinak értékeit b 0 = 9,52, b 1 = 0,93, b 2 = 0,66 és ennek megfelelő tj (j = 0, 1, 2, 3).

Ez a nem korrelált főkomponenseknek köszönhető. Itt érdekes a kezdeti mutatók (53,22), (53,23) és a főkomponensek (53,41), (53,42) regressziós egyenletek párhuzama.

Az (53.42) egyenlet azért jelentős F obs = 194 > F kr = 3,01, α = 0,05-nél, v1 = 4, v2= 16. Az egyenlet együtthatói is szignifikánsak, hiszen t j > t kr . = 1,746, ami α = 0,01-nek felel meg, v= 16 érte j= 0, 1, 2, 3. Meghatározási együttható r= 0,486 azt jelzi, hogy a variáció 48,6%-a nál nél az első három főkomponens hatása miatt.

Az (53.42) egyenletet a közelítés átlagos relatív hibája = 9,99% és a maradék variancia jellemzi s2 = 1,91.

A főkomponensekre vonatkozó regressziós egyenlet (53,42) valamivel jobb közelítő tulajdonságokkal rendelkezik a regressziós modellhez (53,23) képest a kezdeti mutatók tekintetében: r= 0,486 > r= 0,469; = 9,99% < (x) = 10,5% és s 2 (f) = 1,91 < s 2 (x) = 1.97. Ezenkívül az (53.42) egyenletben a főkomponensek az összes bemeneti mutató lineáris függvényei, míg az (53.23) egyenlet csak két változót ( x 1és x 4). Bizonyos esetekben figyelembe kell venni, hogy az (53.42) modell nehezen értelmezhető, mivel a harmadik főkomponenst tartalmazza. f 3, amelyet nem értelmeztünk, és amelyek hozzájárulása a kezdeti mutatók teljes szórásához ( x 1, ..., x 5) csak 8,6%. Azonban a kivétel f 3 az (53.42) egyenletből jelentősen rontja a modell közelítő tulajdonságait: r= 0,349; = 12,4% és s2(f) = 2,41. Ekkor célszerű az (53.23) egyenletet választani a termelékenység regressziós modelljeként.

klaszteranalízis

A statisztikai kutatásban a primer adatok csoportosítása a fő döntés osztályozási feladatok,és ezért minden további munka alapja az összegyűjtött információkkal.

Hagyományosan ezt a problémát a következő módon oldják meg. Az objektumot leíró jellemzők halmazából kiválasztunk egyet, amely a kutató szempontjából a leginformatívabb, és az adatokat e jellemző értékeinek megfelelően csoportosítja. Ha több jellemző szerint kell osztályozni, fontossági sorrendben egymás között, akkor először az első jellemző szerint történik az osztályozás, majd a kapott osztályok mindegyikét a második jellemző szerint alosztályokra osztjuk, és így tovább. A legtöbb kombinációs statisztikai csoportosítás hasonló módon épül fel.

Azokban az esetekben, amikor az osztályozási jellemzők racionalizálása nem lehetséges, a többdimenziós csoportosítás legegyszerűbb módszerét alkalmazzák - az eredeti jellemzőktől funkcionálisan függő integrált mutató (index) létrehozását, majd ezt a mutató szerinti osztályozást.

Ennek a megközelítésnek a kidolgozása a faktor- vagy komponensanalízis módszereivel kapott több általánosító mutató (főkomponens) szerinti osztályozás egy változata.

Ha több jellemző van (kezdeti vagy általánosított), akkor az osztályozási probléma megoldható klaszteranalízis módszerekkel, amelyek eltérnek a többi többváltozós osztályozási módszertől a betanítási minták hiányában, pl. a priori információk az általános populáció megoszlásáról.

Az osztályozási probléma megoldására szolgáló sémák közötti különbségeket nagymértékben meghatározza a „hasonlóság” és a „hasonlóság foka” fogalmak jelentése.

A munka céljának megfogalmazása után természetes, hogy megpróbáljuk meghatározni azokat a minőségi kritériumokat, a célfüggvényt, amelyek értékei lehetővé teszik a különböző osztályozási sémák összehasonlítását.

A közgazdasági tanulmányokban a célfüggvénynek általában minimálisra kell csökkentenie az objektumok halmazán meghatározott paramétereket (például a berendezések osztályozásának célja lehet olyan csoportosítás, amely minimalizálja a javítási munkák teljes idő- és pénzköltségét).

Azokban az esetekben, amikor a probléma céljának formalizálása nem lehetséges, az osztályozás minőségének kritériuma lehet a talált csoportok értelmes értelmezésének lehetősége.

Vegye figyelembe a következő problémát. Hagyja a gyűjteményt P objektumok, amelyek mindegyike jellemző k mért tulajdonságok. Ezt a gyűjteményt bizonyos értelemben homogének csoportokra (osztályokra) kell bontani. Ugyanakkor gyakorlatilag nincs előzetes információ az elosztás jellegéről k-dimenziós vektor x osztályokon belül.

A particionálás eredményeként kapott csoportokat általában klasztereknek* (taxonoknak**, képeknek), a megtalálásukra szolgáló módszereket klaszteranalízisnek (illetve numerikus taxonómia vagy mintafelismerés öntanulással) szokták nevezni.

* Fürt(angol) - olyan elemek csoportja, amelyeket valamilyen közös tulajdonság jellemez.

**takhop(angol) - bármely kategória rendszerezett csoportja.

Már a kezdet kezdetén világosan meg kell érteni, hogy a két osztályozási probléma közül melyiket kell megoldani. Ha a szokásos tipizálási problémát megoldjuk, akkor a megfigyelések halmazát viszonylag kis számú csoportosító tartományra (például egydimenziós megfigyelések esetén intervallumvariációs sorozatra) osztjuk úgy, hogy egy ilyen régió elemei a lehető legközelebb egymáshoz.

Egy másik probléma megoldása a megfigyelések eredményeinek természetes rétegződésének meghatározása egymástól bizonyos távolságra elhelyezkedő, jól meghatározott klaszterekbe.

Ha az első tipizálási feladatnak mindig van megoldása, akkor a második esetben kiderülhet, hogy a megfigyelések halmaza nem mutat természetes klaszterekbe rétegződést, azaz. egy klasztert alkot.

Bár a klaszteranalízis számos módszere meglehetősen elemi, a legtöbb munka, amelyben ezeket javasolták, az elmúlt évtizedből származik. Ez azzal magyarázható, hogy a nagyszámú aritmetikai és logikai műveletet igénylő klaszterkeresési feladatok hatékony megoldása csak a számítástechnika megjelenésével és fejlődésével vált lehetségessé.

A klaszteranalízis problémáiban a kiindulási adatok szokásos megjelenítési formája a mátrix

amelynek minden sora mérési eredményeket jelöl k figyelembe vett jellemzőket valamelyik vizsgált objektumban. Konkrét helyzetekben mind az objektumok csoportosítása, mind a jellemzők csoportosítása érdekes lehet. Azokban az esetekben, amikor a két feladat közötti különbség nem jelentős, például egyes algoritmusok leírásakor csak az "objektum" kifejezést használjuk, beleértve a "szolgáltatás" kifejezést is.

Mátrix x nem az egyetlen módja az adatok megjelenítésének a klaszterelemzési problémákban. Néha a kezdeti információt négyzetmátrixként adják meg

elem rij amely meghatározza a közelség mértékét én-th kifogás j-mu.

A klaszterelemző algoritmusok többsége teljes mértékben a távolság- (vagy közelség-) mátrixból indul ki, vagy annak egyes elemeinek kiszámítását igényli, tehát ha az adatokat a formában jelenítjük meg x, akkor a klaszterek megtalálásának problémájának megoldásának első lépése az objektumok vagy jellemzők közötti távolság vagy közelség kiszámítására szolgáló módszer kiválasztása lesz.

A jellemzők közötti közelség meghatározásának kérdése valamivel könnyebben megoldható. A jellemzők klaszteranalízise általában ugyanazokat a célokat követi, mint a faktoranalízis: az egymással összefüggő jellemzők csoportjainak kiválasztása, amelyek a vizsgált objektumok egy bizonyos aspektusát tükrözik. Ebben az esetben különféle statisztikai csatolási együtthatók szolgálnak a közelség mértékéül.


Hasonló információk.


2. sz. vizsga

5-ös számú opció

1. Feladat. Számítástechnika segítségével végezze el a vizsgált gazdasági mutatók korrelációs-regressziós elemzését, és építsen fel egy regressziós modellt………………………..…..3

1.1 A korrelációs mező felépítése ………………………………………………4

1.2 Párkorrelációs együtthatók mátrixának felépítése……………6

6

1.4 Lineáris egytényezős regressziós modell felépítése……….10

1.5 Következtetések……………………………………………………………………… 15

2. feladat Számítástechnika segítségével oldjon meg lineáris programozási feladatokat…………………………………………………….18

a) Az optimális termeléstervezés problémája……………….19

1. A feladat matematikai megfogalmazása………………………………………..19

2. Kiindulási adatok elhelyezése az MS Excel TP munkalapon, kényszerértékek számítása, célfüggvényértékek számítása………………19

3. A probléma matematikai modelljének megfogalmazása az MS Excel TP munkalap celláiban…………………………………………………………..20

4. Keresse meg a probléma optimális megoldását a „Megoldás keresése” kiegészítő segítségével…………………………………………………………………………………………………………………………………………………

5. Az eredmények elemzése…………………………………………………………….21

b) A szállítási terv optimalizálásának feladata (szállítási feladat) ... 23

1. A feladat matematikai megfogalmazása………………………………………..23

2. Adatok elhelyezése az MS Excel TP munkalapon ………………………24

3. A probléma megfogalmazása egy Excel munkalap formájában a „Megoldás keresése” segédprogram használatához…………………………………25

4. Az eredmények elemzése…………………………………………………………….26

Felhasznált irodalom jegyzéke…………………………………………..28

Feladat 1. Számítástechnika segítségével végezze el a vizsgált gazdasági mutatók korrelációs és regressziós elemzését, és építsen fel regressziós modellt!

Kutatási eszközként használja:



Kiegészítő eszközök TP Analysis Package MS Excel;

A Stats (Statisztika) CKM Maple könyvtár beépített funkciói.

Az 1. feladat feltételei:

A mintaadatok alapján vizsgálja meg az X1, X2 és X3 faktorok hatását az Y effektív attribútumra.

Építsen fel korrelációs mezőt, és tegyen feltételezést a vizsgált tényezők közötti kapcsolat meglétéről és típusáról;

A vizsgált tényezők közötti kapcsolat szorosságának felmérése után alkossanak egy multifaktoriális (egytényezős) lineáris Y=f(X1,X2 X3) vagy Y=f(X) alakú regressziós modell.

Becslés:

A regressziós egyenlet megfelelősége az R 2 determinizmus együttható értékével;

A Student-féle t-próba szerinti regressziós egyenlet együtthatóinak jelentősége adott megbízhatósági valószínűségi szinten p=0,05;

Az egyes X tényezők és az Y előjel közötti összefüggés véletlenszerűségének mértéke (Fisher-kritérium);

Az állóeszközök X 1, X 2, X 3 mutatói és a vállalkozás bruttó kibocsátásának volumene közötti kapcsolatot az egyik iparágban a következő adatok jellemzik:

5. lehetőség

x1 1.5 2.6 3.5 4.8 5.9 6.3 7.2 8.9 9.5 11.1 15.0
x2 10.2 15.3 18.4 20.5 24.7 25.6 27.3 28.3 29.6 30.1 31.0
x3 1.1 2.3 3.5 4.1 5.7 6.6 7.3 8.5 9.8 10.1 12.0
Y

Problémamegoldás 1.

Az 1. feladat megoldása feltételezi.

1. A korrelációs mező felépítése.

2. Párkorrelációs együtthatók mátrixának felépítése.

3. Lineáris és exponenciális típusú egytényezős regressziós modellek felépítése és elemzése az MS Excel TP beépített függvényei segítségével.

4. Lineáris egytényezős regressziós modellek felépítése az "Analysis Package" bővítmény segítségével.

5. Következtetések.

A korrelációs mező felépítése.

Helyezzük el a táblázatot a forrásadatokkal az Excel munkalap A3:D15 celláiba.

Alkalmazás1.1
Y X1 X2 X3
1,5 10,2 1,1
2,6 15,3 2,3
3,5 18,4 3,5
4,8 20,5 4,1
5,9 24,7 5,7
6,3 25,6 6,6
7,2 27,3 7,3
8,9 28,3 8,5
9,5 29,6 9,8
11,1 30,1 10,1
?

Az MS Excel TP diagram varázslójának lehetőségeit felhasználva korrelációs mezőt készítünk, azaz grafikusan ábrázoljuk az eredményül kapott Y jellemző és az egyes X tényezők közötti kapcsolatot. A grafikonok azt mutatják, hogy a kapott Y jellemző és az egyes tényezők között Az X tényezők közül egyenesen arányos, lineárishoz közelítő összefüggés van.

.

.

Vizsgáljuk a tényezők közötti kapcsolat szorosságát és jellegét.

Párkorrelációs együtthatók mátrixának felépítése.

Az MS Excel TP (Service - Data Analysis - Correlation) "Analysis Package" bővítményével párkorrelációs együtthatók mátrixát építjük fel. A "Korreláció" eszköz ablaka az 1. ábrán látható. A párkorrelációs együtthatók mátrixa a 2. ábrán látható.

1. ábra. – Korrelációs ablak

2. ábra. – Párkorrelációs együtthatók mátrixa.

Ebből a mátrixból látható, hogy az összes figyelembe vett X1-X3 faktor szoros kapcsolatban áll az effektív Y jellemzővel. Ráadásul az összes X faktor multikollineáris egymással. Ezért az Y=f(X1,X2,X3) formájú többtényezős modell felépítése lehetetlen.

A korrelációs együttható két mutató közötti kapcsolat mértékét tükrözi. Mindig -1 és 1 közötti értéket vesz fel. Ha az együttható 0 közelében van, akkor azt mondják, hogy nincs kapcsolat a változók között.

Ha az érték közel van egyhez (például 0,9-től), akkor erős közvetlen kapcsolat van a megfigyelt objektumok között. Ha az együttható közel van a tartomány másik szélső pontjához (-1), akkor a változók között erős inverz kapcsolat van. Ha az érték valahol a közepén van 0 és 1 között, vagy 0 és -1 között, akkor gyenge kapcsolatról beszélünk (előre vagy hátra). Ezt a kapcsolatot általában nem veszik figyelembe: úgy tekintik, hogy nem létezik.

A korrelációs együttható kiszámítása Excelben

Tekintsük például a korrelációs együttható számítási módszereit, a változók közötti közvetlen és inverz kapcsolat jellemzőit.

Az x és y mutatók értékei:

Y a független változó, x a függő változó. Meg kell találni a köztük lévő kapcsolat erősségét (erős / gyenge) és irányát (előre / hátra). A korrelációs együttható képlete így néz ki:


A megértés egyszerűsítése érdekében több egyszerű elemre bontjuk.

Erős közvetlen kapcsolat van a változók között.

A beépített CORREL funkció elkerüli a bonyolult számításokat. Számítsuk ki a párkorrelációs együtthatót Excelben ennek segítségével. A függvények mesterének hívjuk. Megtaláljuk, amire szükségünk van. A függvény argumentumai egy y értékből és egy x értékből álló tömbből állnak:

Mutassuk meg a változók értékeit a diagramon:


Erős kapcsolat van y és x között, mert A vonalak szinte párhuzamosan futnak egymással. A kapcsolat közvetlen: növekvő y - növekvő x, csökkenő y - csökkenő x.



Páronkénti korrelációs együtthatók mátrixa Excelben

A korrelációs mátrix egy táblázat, amelynek sorainak és oszlopainak metszéspontjában korrelációs együtthatók vannak a megfelelő értékek között. Érdemes több változóra is felépíteni.

A korrelációs együtthatók mátrixa az Excelben az "Adatelemzés" csomag "Korreláció" eszközével épül fel.


Erős közvetlen kapcsolatot találtunk y és x1 értékei között. Erős visszacsatolás van x1 és x2 között. Gyakorlatilag nincs kapcsolat az x3 oszlop értékeivel.

1. Számítsa ki a páros korrelációs együtthatók mátrixát! elemezze a kapott jellemző kapcsolatának szorosságát és irányát Y az egyes tényezőkkel. x; értékelje a korrelációs együtthatók statisztikai szignifikanciáját r(Y,xén); válassza ki a leginkább informatív tényezőt.

2. Párosított regressziós modell felépítése a leginformatívabb faktorral; adja meg a regressziós együttható közgazdasági értelmezését.

3. Értékelje a modell minőségét a közelítés átlagos relatív hibájával, a determinációs együtthatóval és az F - Fisher-kritériummal (vegye az α = 0,05 szignifikancia szintet).

4. γ=80% konfidenciavalószínűséggel a mutató átlagos értékének előrejelzésére Y(a tényezők előrejelzési értékeit a 6. melléklet tartalmazza). Jelenítse meg grafikusan a tényleges és modellértékeket Y, előrejelzési eredmények.

5. Az inklúziós módszerrel kéttényezős modellek felépítése, a leginformatívabb tényező megtartásával; építeni egy háromfaktoros modellt a tényezők teljes listájával.

6. Válassza ki a legjobbat a beépített többmodellek közül. Adja meg együtthatóinak közgazdasági értelmezését!

7. Ellenőrizze a többszörös regressziós együtthatók szignifikanciáját a segítségével t–Hallgatói teszt (α=0,05 szignifikanciaszint elfogadása). Javult a többszörös modell minősége a páros modellhez képest?

8. Mérje fel a tényezők hatását az eredményre rugalmassági együtthatók, béta és delta együtthatók segítségével!

2. feladat Egydimenziós idősor modellezése

A 7. függelék mutatja az idősorokat I(t) Az Altáj Terület társadalmi-gazdasági mutatói a 2000-től 2011-ig tartó időszakra vonatkozóan. Tanulmányozni kell a feladatváltozatnak megfelelő mutató dinamikáját.

választási lehetőség A mutató megnevezése, neve, mértékegysége
Y1 Átlagos fogyasztói kiadások egy főre jutó (havonta), dörzsölje.
Y2 Szennyezőanyag-kibocsátás a légköri levegőbe, ezer tonna
Y3 Átlagárak a másodlagos lakáspiacon (az év végén a teljes terület négyzetméterére vonatkoztatva), dörzsölje
Y4 Fizetett szolgáltatások egy főre jutó mennyisége, dörzsölje
Y5 A gazdaságban foglalkoztatottak átlagos éves létszáma ezer fő
Y6 1000 főre jutó saját gépkocsik száma (év végén), db
Y7 Átlagos egy főre jutó készpénzjövedelem (havonta), dörzsölje
Y8 Fogyasztói árindex (előző év decembertől decemberig), %
Y9 Befektetett eszközökbe való befektetés (tényleges áron), millió rubel
Y10 Egy főre jutó kiskereskedelmi forgalom (tényleges áron), dörzsölje


Munkarend

1. Készítse el az idősor lineáris modelljét, amelynek paramétereit a legkisebb négyzetekkel becsüljük meg. Magyarázza meg a regressziós együttható jelentését!

2. Értékelje a felépített modell adekvátságát a véletlenszerűség, a függetlenség és a maradék komponens normális eloszlási törvénynek való megfelelésének segítségével!

3. Értékelje a modell pontosságát az átlagos relatív közelítési hiba felhasználása alapján!

4. A vizsgált mutató előrejelzése egy évre előre (az előrejelzési intervallumot 70%-os konfidenciaszinttel számítsa).

5. Mutassa be grafikusan a mutató aktuális értékeit, a modellezés és előrejelzés eredményeit.

6. Számítsa ki a logaritmikus, polinomiális (2. fokú polinom), hatvány-, exponenciális és hiperbolikus trendek paramétereit! A grafikus kép és a determinációs index értéke alapján válassza ki a legmegfelelőbb trendtípust.

7. A legjobb nemlineáris modell segítségével végezze el a figyelembe vett mutató pont előrejelzését a következő évre! Hasonlítsa össze a kapott eredményt a lineáris modell segítségével felépített prediktív konfidenciaintervallummal.

PÉLDA

Ellenőrző munka végzése

1. feladat

A cég használt autók értékesítésével foglalkozik. Az ökonometriai modellezéshez szükséges mutatók és kiindulási adatok neveit a táblázat tartalmazza:

Realizációs ár, ezer eu. ( Y) Egy új autó ára ezer cu. ( X1) Élettartam, év ( x2) Balkormányos - 1, jobbkormányos - 0, ( x3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Kívánt:

1. Számítsa ki a páros korrelációs együtthatók mátrixát! elemezze a kapott Y jellemző kapcsolatának szorosságát és irányát az egyes X tényezőkkel; értékelje az r(Y, X i) korrelációs együtthatók statisztikai szignifikanciáját; válassza ki a leginkább informatív tényezőt.

Az Excel használata (Adatok / Adatelemzés / KORRELÁCIÓ):

Vegyünk egy mátrixot az összes elérhető változó párkorrelációs együtthatóiból:

Nál nél X1 x2 x3
Nál nél
X1 0,910987
x2 -0,4156 -0,2603
x3 0,190785 0,221927 -0,30308

Elemezzük a kapott jellemzők közötti korrelációs együtthatókat Yés az egyes tényezők x j:

> 0, tehát a változók között Yés x 1 közvetlen összefüggés van: minél magasabb egy új autó ára, annál magasabb az eladási ára.

> 0,7 – ez a függőség közeli.

< 0, значит, между переменными Yés x 2 megfigyelt

fordított korreláció: az eladási ár alacsonyabb az auto-

hosszú élettartamú mobiltelefonok.

– ez a függőség mérsékelt, közelebb áll a gyengéhez.

> 0, tehát a változók között Yés x A 3. ábra közvetlen összefüggést mutat: a balkormányos autók eladási ára magasabb.

< 0,4 – эта зависимость слабая.

A talált korrelációs együtthatók szignifikanciájának ellenőrzésére Student-féle tesztet használunk.

Minden korrelációs együtthatóhoz kiszámít t-statisztika képlet alapján és írja be a számítási eredményeket a korrelációs táblázat egy további oszlopába:

Nál nél X1 x2 x3 t-statisztika
Nál nél
X1 0,910987 7,651524603
x2 -0,4156 -0,2603 1,582847988
x3 0,190785 0,221927 -0,30308 0,673265587

A Student-féle megoszlás kritikus pontjainak táblázata szerint a szignifikancia szintjén és a szabadsági fokok számát, meghatározzuk a kritikus értéket (1. melléklet, vagy a STUDRASP függvény).Y és az élettartam x 2 megbízható.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Yés a kormánykerék helyzetét x 3 megbízható.

Így a legszorosabb és legjelentősebb kapcsolat az eladási ár között figyelhető meg Yés egy új autó ára x egy ; tényező x 1 a leginformatívabb.

A páros korrelációs együtthatók mátrixának elemzése azt mutatja, hogy a teljesítménymutató a legszorosabban kapcsolódik az indikátorhoz. x(4) - a felhasznált műtrágya mennyisége 1 ha-ra ().

Ugyanakkor a jellemzők-érvek közötti kapcsolat meglehetősen szoros. Tehát gyakorlatilag funkcionális kapcsolat van a kerekes traktorok száma között ( x(1) bekezdése) és a felszíni talajművelő szerszámok száma
.

A multikollinearitás jelenlétét a korrelációs együtthatók is bizonyítják
és
. Tekintettel a mutatók szoros kapcsolatára x (1) , x(2) és x(3) , csak az egyikük léphet be a hozamregressziós modellbe.

A multikollinearitás negatív hatásának bemutatásához vegyen fontolóra egy hozamregressziós modellt, amely az összes bemenetet tartalmazza:


Fob = 121.

Zárójelben az egyenlet együtthatóinak becslései szórásának korrigált becsléseinek értékei
.

A regressziós egyenlet alatt a következő megfelelőségi paramétereket mutatjuk be: többszörös determinációs együttható
; korrigált reziduális varianciabecslés
, a közelítés átlagos relatív hibája és a számított érték-kritérium Fobs = 121.

A regressziós egyenlet azért jelentős, mert F obl = 121 > F kp = 2,85 a táblázatból találva F-eloszlások =0,05-nél,  1 =6 és  2 =14.

Ebből következik, hogy 0, azaz. és a  egyenlet legalább egyik együtthatója j (j= 0, 1, 2, ..., 5) nem egyenlő nullával.

A H0 egyéni regressziós együtthatók szignifikanciájára vonatkozó hipotézis teszteléséhez:  j =0, ahol j=1,2,3,4,5, hasonlítsa össze a kritikus értéket t kp = 2,14, a táblázatból megállapítva t-megoszlások szignifikancia szinten=2 K=0,05 és a szabadságfok száma=14, a számított értékkel . Az egyenletből következik, hogy a regressziós együttható statisztikailag csak akkor szignifikáns x(4) , mivel t 4 =2,90 > t kp=2,14.

A regressziós együtthatók negatív előjelei at x(1) és x(5) . Az együtthatók negatív értékeiből az következik, hogy a mezőgazdaság kerekes traktorokkal való telítettségének növekedése ( x(1) és növény-egészségügyi termékek ( x(5) bekezdése) negatívan befolyásolja a hozamot. Így a kapott regressziós egyenlet elfogadhatatlan.

Ahhoz, hogy szignifikáns együtthatókat tartalmazó regressziós egyenletet kapjunk, lépésenkénti regresszióelemző algoritmust használunk. Kezdetben lépésenkénti algoritmust használunk a változók kiiktatásával.

Változó kizárása a modellből x(1) , amely megfelel a minimális abszolút értéknek t 1 =0,01. A többi változóhoz ismét megszerkesztjük a regressziós egyenletet:

A kapott egyenlet szignifikáns, mert F obs = 155 > F kp = 2,90, =0,05 szignifikanciaszinten és  1 =5 és  2 =15 szabadságfokszámoknál található a táblázat szerint F-elosztások, pl. vektor0. Az at egyenletben azonban csak a regressziós együttható szignifikáns x(négy) . Becsült értékek t j  más együtthatók esetén kisebb, mint t kr = 2,131 található a táblázatban t-elosztások =2-nél K=0,05 és =15.

Változó kizárása a modellből x(3) , amely a minimális értéknek felel meg t 3 =0,35, és kapjuk meg a regressziós egyenletet:

(2.9)

A kapott egyenletben ez statisztikailag nem szignifikáns, és nem tudjuk gazdaságilag értelmezni az at együtthatót x(5) . Kizárás x(5) megkapjuk a regressziós egyenletet:

(2.10)

Értelmes regressziós egyenletet kaptunk értelmes és értelmezhető együtthatókkal.

A kapott egyenlet azonban nem az egyetlen „jó” vagy „legjobb” hozammodell a példánkban.

Mutassuk meg multikollinearitás esetén a változók bevonásával járó lépésről lépésre történő algoritmus hatékonyabb. A hozammodell első lépése y változót tartalmaz x(4) , amely a legmagasabb korrelációs együtthatóval rendelkezik y, magyarázza a változó r(y,x(4) = 0,58. A második lépésben, beleértve az egyenletet együtt x(4) változók x(1) vagy x(3) , akkor olyan modelleket kapunk, amelyek gazdasági okokból és statisztikai jellemzők miatt jobbak a (2.10)-nél:

(2.11)

(2.12)

A három fennmaradó változó bármelyikének felvétele az egyenletbe rontja annak tulajdonságait. Lásd például a (2.9) egyenletet.

Így van három „jó” hozammodellünk, amelyek közül közgazdasági és statisztikai okokból egyet kell választani.

A statisztikai szempontok szerint a (2.11) modell a legmegfelelőbb. Ez megfelel a reziduális variancia minimális értékeinek =2,26 és a közelítés átlagos relatív hibája és a legnagyobb értékek
és Fobs = 273.

A (2.12) modellnek valamivel rosszabbak a megfelelőségi mutatói, majd a (2.10) modellnek.

Most a (2.11) és (2.12) modellek közül a legjobbat választjuk ki. Ezek a modellek változókban különböznek egymástól x(1) és x(3) . A hozammodellekben azonban a változó x(1) (kerekes traktorok száma 100 ha-ra) előnyösebb, mint változó x(3) (felszíni talajművelő eszközök száma 100 ha-ra), amely némileg másodlagos (vagy abból ered x (1)).

Ezzel kapcsolatban gazdasági okokból a (2.12) modellt kell előnyben részesíteni. Így a lépésenkénti regresszióanalízis algoritmus változók bevonásával történő megvalósítása után, figyelembe véve azt a tényt, hogy a három kapcsolódó változó közül csak egy kerüljön be az egyenletbe ( x (1) ,x(2) vagy x(3)) válassza ki a végső regressziós egyenletet:

Az egyenlet =0,05-nél szignifikáns, mert táblázatból találva F obl = 266 > F kp = 3,20 F-elosztások: = K\u003d 0,05;  1 \u003d 3 és  2 \u003d 17. Minden regressziós együttható is szignifikáns. és az egyenletben t j> t kp (=2 K\u003d 0,05;  \u003d 17) \u003d 2,11. Az  1 regressziós együtthatót gazdasági okokból szignifikánsnak ( 1  0) kell elismerni, míg t 1 = 2,09 csak valamivel kevesebb t kp = 2,11.

A regressziós egyenletből következik, hogy 100 hektár szántóterületre jutó traktorok számának egységnyi növekedése (fix értékkel x(4)) a szemtermés átlagosan 0,345 c/ha-os növekedéséhez vezet.

Az e 1  0,068 és e 2  0,161 rugalmassági együtthatók közelítő számítása azt mutatja, hogy a mutatók növekedésével x(1) és x(4) 1%-kal, a szemtermés átlagosan 0,068, illetve 0,161%-kal nő.

Többszörös determinációs együttható
azt jelzi, hogy a hozamingadozásnak csak 46,9%-át magyarázzák a modellben szereplő mutatók ( x(1) és x(4)), vagyis a növénytermesztés traktorokkal és műtrágyákkal való telítése. Az eltérés többi része fel nem számolt tényezők hatására ( x (2) ,x (3) ,x(5), időjárási körülmények stb.). Az átlagos relatív közelítési hiba jellemzi a modell megfelelőségét, valamint a reziduális variancia értékét
. A regressziós egyenlet értelmezésekor a relatív közelítési hibák értékei érdekesek
. Emlékezzen arra - az eredő mutató modellértéke, az átlagos terméshozamot jellemzi a vizsgált területek összességére, feltéve, hogy a magyarázó változók értékei x(1) és x(4) ugyanazon a szinten rögzítve, nevezetesen x (1) =x én(1) és x (4) = x én(négy) . Majd az értékek szerint én a hozamokat össze lehet hasonlítani. Területek, amelyeknek az értékek megfelelnek én>0, átlag feletti hozamúak, a én <0 - ниже среднего.

Példánkban hozam szempontjából a növénytermesztés a -nek megfelelő területen a leghatékonyabb 7 = 28%, ahol a hozam 28%-kal magasabb a régió átlagánál, és a legkevésbé hatékony - a c régióban 20 =27,3%.

KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2022 "kingad.ru" - az emberi szervek ultrahangvizsgálata