Többszörös korrelációs együttható meghatározása MS Excelben.

Kezdetben a modellben nál nél tartalmazza az összes fő összetevőt (a számított értékek zárójelben vannak feltüntetve t-kritériumok):

A modell minőségét a következők jellemzik: többszörös determinációs együttható r = 0,517, a közelítés átlagos relatív hibája = 10,4%, maradék variancia s 2= 1,79 és F megfigyelhető = 121. Annak a ténynek köszönhetően F obs > F kr = 2,85, α = 0,05, v 1 = 6, v 2= 14, a regressziós egyenlet szignifikáns, és a regressziós együtthatók legalább egyike - β 1, β 2, β 3, β 4 - nem egyenlő nullával.

Ha a regressziós egyenlet jelentősége (hipotézis H 0:β 1 = β 2 = β 3 = β 4 = 0-t α = 0,05-nél ellenőriztük, majd a regressziós együtthatók szignifikanciáját, i.e. hipotéziseket H0: β j = 0 (j = 1, 2, 3, 4), 0,05-nél nagyobb szignifikanciaszinten kell tesztelni, például α-nál = 0.1. Ekkor α = 0,1-nél, v= 14 magnitúdó t cr = 1,76, és az (53,41) egyenletből következően szignifikánsak a β 1, β 2, β 3 regressziós együtthatók.

Tekintettel arra, hogy a fő komponensek nem korrelálnak egymással, azonnal kiszűrhetjük az összes jelentéktelen együtthatót az egyenletből, és az egyenlet a következő formát ölti

(53.42)

Az (53.41) és (53.42) egyenleteket összehasonlítva azt látjuk, hogy a jelentéktelen főkomponensek kizárásával f 4És f 5, nem befolyásolta az egyenlet együtthatóinak értékeit b 0 = 9,52, b 1 = 0,93, b 2 = 0,66 és ennek megfelelő t j (j = 0, 1, 2, 3).

Ennek oka a főkomponensek nem korrelált jellege. Érdekes itt a kezdeti mutatók (53.22), (53.23) és a főkomponensek (53.41), (53.42) regressziós egyenletei párhuzam.

Az (53.42) egyenlet azért jelentős F obs = 194 > F cr = 3,01, α = 0,05-nél találva, v 1 = 4, v 2= 16. Az egyenlet együtthatói is szignifikánsak, hiszen t j > t cr . = 1,746, ami α = 0,01-nek felel meg, v= 16 érte j= 0, 1, 2, 3. Meghatározási együttható r= 0,486 azt jelzi, hogy a variáció 48,6%-a nál nél az első három fő komponens hatása miatt.

Az (53.42) egyenletet a közelítés átlagos relatív hibája = 9,99% és a maradék szórása jellemzi s 2 = 1,91.

A főkomponensekre vonatkozó regressziós egyenlet (53,42) a kezdeti mutatók alapján valamivel jobb közelítő tulajdonságokkal rendelkezik, mint a regressziós modell (53,23): r= 0,486 > r= 0,469; = 9,99% < (x) = 10,5% és s 2 (f) = 1,91 < s 2 (x) = 1.97. Ezenkívül az (53.42) egyenletben a főkomponensek az összes kezdeti mutató lineáris függvényei, míg az (53.23) egyenlet csak két változót ( x 1És x 4). Számos esetben figyelembe kell venni, hogy az (53.42) modell nehezen értelmezhető, mivel egy harmadik főkomponenst is tartalmaz. f 3, amelyet nem értelmeztünk, és amelyek hozzájárulása a kezdeti mutatók teljes szórásához ( x 1, ..., x 5) csak 8,6%. Azonban a kivétel f 3 az (53.42) egyenletből jelentősen rontja a modell közelítő tulajdonságait: r= 0,349; = 12,4% és s 2(f) = 2,41. Ekkor célszerű az (53.23) egyenletet választani a hozam regressziós modelljeként.

Klaszteranalízis

A statisztikai kutatásban a primer adatok csoportosítása a fő döntési technika osztályozási problémák,és ezért minden további munka alapja az összegyűjtött információkkal.

Hagyományosan ezt a problémát a következőképpen oldják meg. Az objektumot leíró számos jellemző közül kiválasztják az egyiket, amely a kutató szempontjából a leginformatívabb, és az adatokat ennek a tulajdonságnak az értékeinek megfelelően csoportosítják. Ha több szempont alapján, fontossági fok szerint egymás között rangsorolt ​​osztályozást kell végezni, akkor először az első jellemző szerint történik az osztályozás, majd az így kapott osztályok mindegyikét alosztályokra osztjuk a második jellemző szerint. stb. A legtöbb kombinációs statisztikai csoportosítás hasonló módon épül fel.

Azokban az esetekben, amikor az osztályozási jellemzők rendszerezése nem lehetséges, a többdimenziós csoportosítás legegyszerűbb módszerét alkalmazzák - egy integrált mutató (index) létrehozását, amely funkcionálisan függ a kezdeti jellemzőktől, majd ezt követi a mutató szerinti osztályozás.

Ennek a megközelítésnek a továbbfejlesztése egy több általános mutatón (főkomponensen) alapuló osztályozási lehetőség, amelyet faktor- vagy komponenselemzési módszerekkel nyernek.

Több jellemző (kezdeti vagy általánosított) esetén az osztályozási probléma megoldható klaszterelemzési módszerekkel, amelyek a többi többdimenziós osztályozási módszertől a betanítási minták hiányában térnek el, pl. a priori információ a lakosság megoszlásáról.

Az osztályozási probléma megoldására szolgáló sémák közötti különbségeket nagymértékben meghatározza a „hasonlóság” és a „hasonlóság mértéke” fogalma.

A munka céljának megfogalmazása után természetes, hogy megpróbálunk minőségi kritériumokat, célfüggvényt meghatározni, amelynek értékei lehetővé teszik a különböző osztályozási sémák összehasonlítását.

A közgazdasági tanulmányokban a célfüggvénynek általában minimálisra kell csökkentenie az objektumok halmazán meghatározott paramétereket (például a berendezések osztályozásának célja lehet olyan csoportosítás, amely minimalizálja a javítási munkák teljes idő- és pénzköltségét).

Azokban az esetekben, amikor a feladat céljának formalizálása nem lehetséges, az osztályozás minőségének kritériuma lehet a talált csoportok értelmes értelmezésének lehetősége.

Tekintsük a következő problémát. Tanulmányozzuk a halmazt P objektumok, amelyek mindegyike jellemző k mért jelek. Ezt a teljességet bizonyos értelemben homogének csoportokra (osztályokra) kell felosztani. Ugyanakkor gyakorlatilag nincs előzetes információ az elosztás jellegéről k-dimenziós vektor x osztályokon belül.

A particionálás eredményeként kapott csoportokat általában klasztereknek* (taxonoknak**, képeknek), a megtalálásukra szolgáló módszereket klaszteranalízisnek (illetve numerikus taxonómia vagy mintafelismerés öntanulással) szokták nevezni.

* Fürt(angol) - olyan elemek csoportja, amelyeket valamilyen közös tulajdonság jellemez.

**Tahop(angol) - bármely kategória szisztematikus csoportja.

Már a kezdet kezdetén világosan meg kell érteni, hogy a két osztályozási probléma közül melyiket kell megoldani. Ha a szokásos tipizálási feladatot oldjuk meg, akkor a megfigyelések halmazát viszonylag kis számú csoportosító területre osztjuk fel (például egydimenziós megfigyelések esetén intervallum variációs sorozatra), így egy ilyen terület elemei a lehető legközelebb egymáshoz.

Egy másik probléma megoldása a megfigyelési eredmények természetes rétegződésének meghatározása egymástól bizonyos távolságra elhelyezkedő, világosan meghatározott klaszterekbe.

Ha az első tipizálási problémára mindig van megoldás, akkor a második esetben kiderülhet, hogy a megfigyelések halmaza nem mutat természetes klaszterekbe való rétegződést, pl. egy klasztert alkot.

Bár sok klaszterelemzési módszer meglehetősen elemi, a legtöbb munka, amelyben javasolták őket, az elmúlt évtizedből származik. Ez azzal magyarázható, hogy a klaszterkeresési feladatok hatékony megoldása, amely nagyszámú aritmetikai és logikai művelet elvégzését igényli, csak a számítástechnika megjelenésével és fejlődésével vált lehetségessé.

A klaszterelemzési feladatokban a kezdeti adatok szokásos megjelenítési formája a mátrix

amelynek minden sora mérési eredményeket jelöl k a figyelembe vett jelek valamelyik vizsgált objektumban. Különleges helyzetekben az objektumok csoportosítása és a jellemzők csoportosítása egyaránt érdekes lehet. Azokban az esetekben, amikor a két feladat közötti különbség nem jelentős, például egyes algoritmusok leírásánál csak az „objektum” kifejezést használjuk, beleértve a „szolgáltatás” kifejezést is.

Mátrix x nem az egyetlen módja az adatok bemutatásának a klaszterelemzési problémákban. Néha a kezdeti információkat négyzetmátrix formájában adják meg

elem r ij amely meghatározza a közelség mértékét én-th kifogás j-mu.

A legtöbb klaszterelemző algoritmus teljes mértékben távolságok (vagy közelség) mátrixán alapul, vagy annak egyes elemeinek kiszámítását igényli, tehát ha az adatokat a következő formában jelenítjük meg: X, akkor a klaszterek keresési problémájának megoldásának első lépése az objektumok vagy jellemzők közötti távolság vagy közelség kiszámításának módszerének kiválasztása lesz.

A jellemzők közötti közelség meghatározásának kérdése valamivel könnyebben megoldható. A jellemzők klaszteranalízise általában ugyanazokat a célokat követi, mint a faktoranalízis: a kapcsolódó jellemzők csoportjainak azonosítása, amelyek a vizsgált objektumok egy bizonyos aspektusát tükrözik. A közelség mértéke ebben az esetben a különböző statisztikai kapcsolódási együtthatók.


Kapcsolódó információ.


2. számú teszt

5. lehetőség

1. Feladat. Számítástechnika segítségével végezze el a vizsgált gazdasági mutatók korrelációs és regressziós elemzését, és építsen fel egy regressziós modellt………………………………..3

1.1 A korrelációs mező felépítése…………………………………………………………4

1.2 Párkorrelációs együtthatók mátrixának felépítése……………6

1.3 Lineáris és exponenciális formájú egytényezős regressziós modellek felépítése és elemzése a TP MS Excel beépített függvényeivel……………………………………………………………………… ………………………………………………………6

1.4 Lineáris egytényezős regressziós modell felépítése……….10

1.5 Következtetések…………………………………………………………………………………15

2. Feladat. Számítástechnika segítségével oldjon meg lineáris programozási feladatokat………………………………………………………….18

a) Optimális termeléstervezési probléma……………….19

1. A feladat matematikai megfogalmazása………………………………………..19

2. Forrásadatok elhelyezése a TP MS Excel munkalapon, kényszerértékek számítása, célfüggvényértékek számítása……………………19

3. A probléma matematikai modelljének megfogalmazása a TP MS Excel munkalap celláiban……………………………………………………..20

4. Keressen optimális megoldást egy adott problémára a „Megoldás keresése” kiegészítővel………………………………………………..20

5. Az eredmények elemzése………………………………………………………….21

b) Közlekedési terv optimalizálási probléma (közlekedési probléma)…23

1. A feladat matematikai megfogalmazása………………………………………..23

2. Adatok elhelyezése a TP MS Excel munkalapon ………………………24

3. A probléma megfogalmazása egy Excel-munkalap formájában a „Megoldás keresése” segédprogram használatához………………………………25

4. Az eredmények elemzése………………………………………………………….26

Hivatkozások listája………………………………………………………………..28

Feladat 1. Számítástechnika segítségével végezze el a vizsgált gazdasági mutatók korrelációs és regressziós elemzését és építsen fel regressziós modellt!

Használja a következőket kutatási eszközként:



Kiegészítő eszközök TP Analysis Package MS Excel;

A Stats (Statisztika) CKM Maple könyvtár beépített funkciói.

Az 1. feladat feltételei:

Mintaadatok felhasználásával vizsgálja meg az X1, X2 és X3 faktorok hatását az Y effektív tulajdonságra.

Szerkesszen meg egy korrelációs mezőt, és tegyen feltételezést a vizsgált tényezők közötti kapcsolat meglétéről és típusáról;

A vizsgált tényezők közötti kapcsolat szorosságának felmérése után alkossanak egy multifaktoriális (egytényezős) lineáris Y=f(X1,X2 X3) vagy Y=f(X) típusú regressziós modell.

Becslés:

A regressziós egyenlet megfelelősége az R 2 determinációs együttható értéke szerint;

A Student-féle t-próba szerinti regressziós egyenlet együtthatóinak szignifikanciája adott konfidenciaszinten p = 0,05;

Az egyes X faktorok és Y tulajdonságok közötti kapcsolat véletlenszerűségének mértéke (Fisher-kritérium);

Az állóeszközök X 1, X 2, X 3 mutatói és a vállalkozás bruttó kibocsátásának volumene közötti kapcsolatot az egyik iparágban a következő adatok jellemzik:

5. lehetőség

X 1 1.5 2.6 3.5 4.8 5.9 6.3 7.2 8.9 9.5 11.1 15.0
X 2 10.2 15.3 18.4 20.5 24.7 25.6 27.3 28.3 29.6 30.1 31.0
X 3 1.1 2.3 3.5 4.1 5.7 6.6 7.3 8.5 9.8 10.1 12.0
Y

Az 1. feladat megoldása.

Az 1. feladat megoldása feltételezi.

1. Korrelációs mező felépítése.

2. Párkorrelációs együtthatók mátrixának felépítése.

3. Lineáris és exponenciális formájú egytényezős regressziós modellek felépítése és elemzése a TP MS Excel beépített függvényeivel.

4. Lineáris egytényezős regressziós modellek felépítése az „Analysis Package” bővítmény segítségével.

5. Következtetések.

Korrelációs mező felépítése.

Helyezzük el a táblázatot a forrásadatokkal az Excel munkalap A3:D15 celláiba.

Függelék 1.1
Y X1 X2 X3
1,5 10,2 1,1
2,6 15,3 2,3
3,5 18,4 3,5
4,8 20,5 4,1
5,9 24,7 5,7
6,3 25,6 6,6
7,2 27,3 7,3
8,9 28,3 8,5
9,5 29,6 9,8
11,1 30,1 10,1
?

Az MS Excel TP diagram varázslójának lehetőségeit felhasználva korrelációs mezőt készítünk, azaz grafikusan ábrázoljuk az eredményül kapott Y jellemző és az egyes X tényezők közötti kapcsolatot. A grafikonok azt mutatják, hogy az eredményül kapott Y jellemző és az egyes tényezők között Az X faktorok közül egyenesen arányos, lineárishoz közelítő összefüggés van.

.

.

Feltárjuk a tényezők közötti kapcsolat szorosságát és természetét.

Párkorrelációs együtthatók mátrixának felépítése.

Az MS Excel TP (Service – Data Analysis – Correlation) „Analysis Package” bővítményével párkorrelációs együtthatók mátrixát építjük fel. A „Korreláció” eszközablak az 1. ábrán látható. A párkorrelációs együtthatók mátrixát a 2. ábra mutatja be.

1. ábra. – „Korreláció” ablak

2. ábra. – Párkorrelációs együtthatók mátrixa.

Ebből a mátrixból jól látható, hogy az összes vizsgált X1 – X3 faktor szoros kapcsolatban áll az eredő Y karakterisztikával. Ráadásul az összes X faktor multikollineáris egymással. Ezért egy Y=f(X1,X2,X3) formájú többtényezős modell felépítése lehetetlen.

A korrelációs együttható két mutató közötti kapcsolat mértékét tükrözi. Mindig -1 és 1 közötti értéket vesz fel. Ha az együttható 0 körül van, akkor nincs kapcsolat a változók között.

Ha az érték közel van egyhez (például 0,9-től), akkor erős közvetlen kapcsolat van a megfigyelt objektumok között. Ha az együttható közel van a tartomány másik szélső pontjához (-1), akkor a változók között erős inverz kapcsolat van. Ha az érték valahol 0 és 1 vagy 0 és -1 között van, akkor gyenge kapcsolatról beszélünk (közvetlen vagy fordított). Ezt a kapcsolatot általában nem veszik figyelembe: azt hiszik, hogy nem létezik.

Korrelációs együttható számítása Excelben

Nézzünk egy példát a korrelációs együttható számítási módszereire, a változók közötti közvetlen és inverz kapcsolatok jellemzőire.

Az x és y mutatók értékei:

Y független változó, x függő változó. Meg kell találni a köztük lévő kapcsolat erősségét (erős/gyenge) és irányát (előre/fordított). A korrelációs együttható képlete így néz ki:


A könnyebb érthetőség érdekében bontsuk több egyszerű elemre.

A változók között erős közvetlen kapcsolat van meghatározva.

A beépített CORREL függvény elkerüli a bonyolult számításokat. Számítsuk ki a párkorrelációs együtthatót Excelben ennek segítségével. Hívja a függvényvarázslót. Megtaláljuk a megfelelőt. A függvény argumentumai egy y értékből és egy x értékből álló tömbből állnak:

Mutassuk meg a változók értékeit a grafikonon:


Erős kapcsolat látható y és x között, mert a vonalak szinte párhuzamosan futnak egymással. A kapcsolat közvetlen: y növekszik - x nő, y csökken - x csökken.



Páros korrelációs együttható mátrix Excelben

A korrelációs mátrix egy táblázat a sorok és oszlopok metszéspontjában, amelyben a megfelelő értékek közötti korrelációs együtthatók találhatók. Érdemes több változóra is felépíteni.

A korrelációs együtthatók mátrixa az Excelben az „Adatelemzés” csomag „Korreláció” eszközével készül.


Erős közvetlen kapcsolatot találtunk y és x1 értékei között. Erős visszacsatolás van x1 és x2 között. Gyakorlatilag nincs kapcsolat az x3 oszlop értékeivel.

1. Számítsa ki a párkorrelációs együtthatók mátrixát! elemezze az eredő jellemző kapcsolatának szorosságát és irányát Y minden tényezővel x; értékelje a korrelációs együtthatók statisztikai szignifikanciáját r(Y,xén); válassza ki a leginkább informatív tényezőt.

2. Készítsen páros regressziós modellt a leginkább informatív tényezővel; adja meg a regressziós együttható közgazdasági értelmezését.

3. Értékelje a modell minőségét a közelítés átlagos relatív hibájával, a determinációs együtthatóval és a Fisher-féle F-próbával (α=0,05 szignifikancia szint elfogadása).

4. γ=80%-os megbízhatósági valószínűséggel jósolja meg a mutató átlagos értékét! Y(a tényezők előrejelzett értékeit a 6. melléklet tartalmazza). Jelenítse meg grafikusan a tényleges és modellértékeket Y,jóslási eredmények.

5. Az inklúziós módszerrel kéttényezős modellek felépítése, a leginformatívabb tényező megtartásával; építeni egy háromfaktoros modellt a tényezők teljes listájával.

6. Válassza ki a legjobbat a megépített többmodellek közül. Adja meg együtthatóinak közgazdasági értelmezését!

7. Ellenőrizze a többszörös regressziós együtthatók jelentőségét a segítségével t–Hallgatói teszt (α=0,05 szignifikanciaszint elfogadása). Javult a többszörös modell minősége a párosított modellhez képest?

8. Mérje fel a tényezők eredményre gyakorolt ​​hatását rugalmassági együtthatók, béta és delta együtthatók segítségével!

2. feladat Egyváltozós idősor modellezése

A 7. függelék idősorokat mutat be I(t) Az Altáj Terület társadalmi-gazdasági mutatói a 2000 és 2011 közötti időszakra vonatkozóan. Tanulmányozni kell a feladatlehetőségnek megfelelő mutató dinamikáját.

választási lehetőség A mutató megnevezése, neve, mértékegysége
Y1 Átlagos fogyasztói kiadások egy főre jutó (havonta), dörzsölje.
Y2 Szennyezőanyag-kibocsátás a légköri levegőbe, ezer tonna
Y3 Átlagárak a másodlagos lakáspiacon (év végén a teljes terület négyzetméterére), rubel
Y4 Fizetett szolgáltatások egy főre jutó mennyisége, dörzsölje
Y5 A gazdaságban foglalkoztatottak átlagos éves létszáma ezer fő
Y6 1000 lakosra jutó saját személygépkocsik száma (év végén), db
Y7 Átlagos egy főre jutó készpénzjövedelem (havonta), dörzsölje.
Y8 Fogyasztói árindex (december az előző év decemberéhez képest), %
Y9 Befektetett eszközökbe való befektetés (tényleges áron), millió rubel
Y10 Egy főre jutó kiskereskedelmi forgalom (tényleges áron), rubel


Munkarend

1. Készítsen lineáris idősor-modellt, amelynek paraméterei a legkisebb négyzetekkel becsülhetők. Magyarázza meg a regressziós együttható jelentését!

2. Értékelje a megszerkesztett modell megfelelőségét a véletlenszerűség, a függetlenség és a maradék komponens normális eloszlási törvénynek való megfelelésének tulajdonságaival!

3. A közelítés átlagos relatív hibája alapján értékelje a modell pontosságát!

4. A figyelembe vett mutató előrejelzése egy évre előre (az előrejelzési intervallumot 70%-os megbízhatósági valószínűséggel számítsa ki).

5. Mutassa be grafikusan a mutató aktuális értékeit, a modellezés és előrejelzés eredményeit.

6. Számítsa ki a logaritmikus, polinomiális (2. fokú polinom), hatványos, exponenciális és hiperbolikus trendek paramétereit! A grafikus kép és a determinációs index értéke alapján válassza ki a legmegfelelőbb trendtípust.

7. A legjobb nemlineáris modell segítségével készítsen pont előrejelzést a kérdéses mutatóról a következő évre. Hasonlítsa össze a kapott eredményt a lineáris modell segítségével megszerkesztett konfidencia-előrejelzési intervallummal.

PÉLDA

A teszt elvégzése

1. probléma

A cég használt autók értékesítésével foglalkozik. Az ökonometriai modellezéshez szükséges mutatók és kiindulási adatok neveit a táblázat tartalmazza:

Eladási ár, ezer.e. ( Y) Új autó ára ezer.e. ( X1) Élettartam, év ( X2) Balkormányos - 1, jobbkormányos - 0, ( X3)
8,33 13,99 3,8
10,40 19,05 2,4
10,60 17,36 4,5
16,58 25,00 3,5
20,94 25,45 3,0
19,13 31,81 3,5
13,88 22,53 3,0
8,80 16,24 5,0
13,89 16,54 2,0
11,03 19,04 4,5
14,88 22,61 4,6
20,43 27,56 4,0
14,80 22,51 3,3
26,05 31,75 2,3

Kívánt:

1. Számítsa ki a párkorrelációs együtthatók mátrixát! elemzi az eredő Y jellemző és az egyes X tényezők közötti kapcsolat szorosságát és irányát; értékelje az r(Y, X i) korrelációs együtthatók statisztikai szignifikanciáját; válassza ki a leginkább informatív tényezőt.

Excelt használunk (Adat / Adatelemzés / KORRELÁCIÓ):

Kapunk egy páronkénti korrelációs együtthatók mátrixát az összes elérhető változó között:

U X1 X2 X3
U
X1 0,910987
X2 -0,4156 -0,2603
X3 0,190785 0,221927 -0,30308

Elemezzük a kapott jellemző közötti korrelációs együtthatókat Yés az egyes tényezők x j:

> 0, tehát a változók között YÉs x 1 közvetlen összefüggés van: minél magasabb egy új autó ára, annál magasabb az eladási ára.

> 0,7 – ez a függőség közeli.

< 0, значит, между переменными YÉs x 2 megfigyelt

fordított korreláció: az autók eladási ára alacsonyabb

hosszú élettartamú mobiltelefonok.

– ez a függőség mérsékelt, közelebb áll a gyengéhez.

> 0, ami változók között van YÉs x 3 közvetlen összefüggés van: a balkormányos autók eladási ára magasabb.

< 0,4 – эта зависимость слабая.

A talált korrelációs együtthatók szignifikanciájának ellenőrzésére a Student-féle tesztet használjuk.

Minden korrelációs együtthatóhoz számoljunk t-statisztika a képlet szerint és írja be a számítási eredményeket a korrelációs táblázat egy további oszlopába:

U X1 X2 X3 t-statisztika
U
X1 0,910987 7,651524603
X2 -0,4156 -0,2603 1,582847988
X3 0,190785 0,221927 -0,30308 0,673265587

A Student-eloszlás kritikus pontjainak táblázata szerint a szignifikancia szinten és a szabadságfokok számát, meghatározzuk a kritikus értéket (1. melléklet, vagy a STUDARSOBR függvény).Y és az élettartam x 2 megbízható.

< , следовательно, коэффициент не является значимым. На основании выборочных данных нет оснований утверждать, что зависимость между ценой реализации Yés a kormánykerék helyzetét x 3 megbízható.

Így a legszorosabb és legjelentősebb kapcsolat az eladási ár között figyelhető meg Yés egy új autó ára x 1; tényező x 1 a leginformatívabb.

A páros korrelációs együtthatók mátrixának elemzése azt mutatja, hogy az effektív mutató a legszorosabban kapcsolódik az indikátorhoz x(4) - az 1 hektáronként elfogyasztott műtrágya mennyisége ().

Ugyanakkor az attribútumok-argumentumok között meglehetősen szoros a kapcsolat. Így gyakorlatilag funkcionális kapcsolat van a kerekes traktorok száma között ( x(1) bekezdése) és a felszíni talajművelő szerszámok száma
.

A multikollinearitás jelenlétét korrelációs együtthatók is jelzik
És
. Figyelembe véve a mutatók közötti szoros kapcsolatot x (1) , x(2) és x(3) szerint ezek közül csak egy szerepelhet a hozamregressziós modellben.

A multikollinearitás negatív hatásának bemutatásához vegye figyelembe a hozam regressziós modelljét, amely tartalmazza az összes bemeneti mutatót:


F obs = 121.

Az egyenlet együtthatóinak becslései szórásának korrigált becsléseinek értékei zárójelben vannak feltüntetve
.

A regressziós egyenlet alatt a következő megfelelőségi paramétereket mutatjuk be: többszörös determinációs együttható
; korrigált reziduális variancia becslő
, a közelítés átlagos relatív hibája és az F obs = 121 kritérium számított értéke.

A regressziós egyenlet azért jelentős, mert F obs = 121 > F kp = 2,85 a táblázatból találva F-eloszlások:=0,05; 1 =6 és 2 =14.

Ebből következik, hogy 0, azaz. és az egyenlet együtthatói közül legalább az egyik j (j= 0, 1, 2, ..., 5) nem nulla.

A H0 egyéni regressziós együtthatók szignifikanciájára vonatkozó hipotézis teszteléséhez:  j =0, ahol j=1,2,3,4,5, hasonlítsa össze a kritikus értéket t kp = 2,14, a táblázatból megállapítva t-megoszlások szignifikancia szinten=2 K=0,05 és a szabadságfok száma=14, a számított értékkel . Az egyenletből következik, hogy a regressziós együttható statisztikailag csak akkor szignifikáns x(4) , mivel t 4 =2,90 > t kp = 2,14.

A regressziós együtthatók negatív előjelei nem alkalmasak közgazdasági értelmezésre, amikor x(1) és x(5) . Az együtthatók negatív értékeiből az következik, hogy a mezőgazdaság kerekes traktorokkal való telítettségének növekedése ( x(1) és növény-egészségügyi termékek ( x(5) bekezdése) negatív hatással van a hozamra. Ezért a kapott regressziós egyenlet elfogadhatatlan.

Ahhoz, hogy szignifikáns együtthatókat tartalmazó regressziós egyenletet kapjunk, lépésenkénti regresszióelemző algoritmust használunk. Kezdetben lépésenkénti algoritmust használunk a változók kiiktatásával.

Zárjuk ki a változót a modellből x(1) , amely megfelel a minimális abszolút értéknek t 1 =0,01. A többi változóhoz ismét megszerkesztjük a regressziós egyenletet:

A kapott egyenlet szignifikáns, mert F megfigyelt = 155 > F kp = 2,90, szignifikancia szinten  = 0,05 és a szabadsági fokok számai  1 = 5 és  2 = 15 a táblázat szerint F-elosztás, azaz. vektor0. Azonban csak a regressziós együttható at x(4) . Becsült értékek t j más együtthatók esetén kisebb t kr = 2,131, a táblázatból megállapítva t-eloszlások at=2 K=0,05 és=15.

A változó modellből való kizárásával x(3) , amely a minimális értéknek felel meg t 3 =0,35 és megkapjuk a regressziós egyenletet:

(2.9)

A kapott egyenletben az együttható at x(5) . Kizárással x(5) megkapjuk a regressziós egyenletet:

(2.10)

Szignifikáns regressziós egyenletet kaptunk szignifikáns és értelmezhető együtthatókkal.

A kapott egyenlet azonban nem az egyetlen „jó” és nem a „legjobb” hozammodell a példánkban.

Mutassuk meg multikollinearitási feltételben a változók beépítésével végzett lépésenkénti algoritmus hatékonyabb. A hozammodell első lépése y változó tartalmazza x(4) , amely a legmagasabb korrelációs együtthatóval rendelkezik y, magyarázza a változó r(y,x(4) = 0,58. A második lépésben, beleértve az egyenletet együtt x(4) változók x(1) vagy x(3) alapján olyan modelleket kapunk, amelyek gazdasági okokból és statisztikai jellemzők miatt meghaladja a (2.10):

(2.11)

(2.12)

A három fennmaradó változó bármelyikének az egyenletbe való belefoglalása rontja annak tulajdonságait. Lásd például a (2.9) egyenletet.

Így van három „jó” hozammodellünk, amelyek közül közgazdasági és statisztikai okokból egyet kell választanunk.

A statisztikai kritériumok szerint a (2.11) modell a legmegfelelőbb. Ez megfelel a reziduális variancia minimális értékeinek =2,26 és a közelítés átlagos relatív hibája és a legnagyobb értékek
és F obs = 273.

A (2.12) modellnek valamivel rosszabbak a megfelelőségi mutatói, ezt követi a (2.10) modell.

Most a (2.11) és (2.12) modellek közül a legjobbat választjuk ki. Ezek a modellek változókban különböznek egymástól x(1) és x(3) . A hozammodellekben azonban a változó x(1) (kerekes traktorok száma 100 ha-ra) előnyösebb, mint a változó x(3) (felszíni talajművelő eszközök száma 100 ha-ra), amely bizonyos mértékig másodlagos (vagy abból ered x (1)).

E tekintetben gazdasági okokból előnyben kell részesíteni a (2.12) modellt. Így a lépésenkénti regresszióanalízis algoritmus változók bevonásával történő megvalósítása után, figyelembe véve azt a tényt, hogy a három kapcsolódó változó közül csak az egyiknek kell belépnie az egyenletbe ( x (1) ,x(2) vagy x(3)) válassza ki a végső regressziós egyenletet:

Az egyenlet =0,05-nél szignifikáns, mert F obs = 266 > F kp = 3,20, a táblázatból találva F-elosztások at= K=0,05; 1 =3 és 2 =17. Minden regressziós együttható is szignifikáns És az egyenletben t j > t kp (=2 K=0,05;=17)=2,11. A  1 regressziós együtthatót gazdasági okokból szignifikánsnak ( 1 0) kell tekinteni, míg t 1 = 2,09 csak valamivel kevesebb t kp = 2,11.

A regressziós egyenletből az következik, hogy a 100 hektár szántóterületre jutó traktorok számának eggyel növekedése (fix értéken x(4)) a szemtermés átlagosan 0,345 c/ha-os növekedéséhez vezet.

Az e 1 0,068 és e 2 0,161 rugalmassági együtthatók közelítő számítása azt mutatja, hogy növekvő mutatók mellett x(1) és x(4) 1%-kal, a szemtermés átlagosan 0,068, illetve 0,161%-kal nő.

Többszörös determinációs együttható
azt jelzi, hogy a hozamingadozásnak csak 46,9%-át magyarázzák a modellben szereplő mutatók ( x(1) és x(4)), vagyis a növénytermesztés traktorokkal és műtrágyákkal való telítése. Az eltérés többi része fel nem vett tényezők hatására ( x (2) ,x (3) ,x(5), időjárási viszonyok stb.). A közelítés átlagos relatív hibája jellemzi a modell megfelelőségét, valamint a reziduális variancia értékét
. A regressziós egyenlet értelmezésekor a közelítés relatív hibáinak értékei érdekesek
. Hadd emlékeztessük erre - az effektív mutató modellértéke, amely a vizsgált régiók összességére jellemzi az átlagos termésértéket, feltéve, hogy a magyarázó változók értékei x(1) és x(4) ugyanazon a szinten vannak rögzítve, nevezetesen x (1) =x én(1) és x (4) = x én(4) . Majd az értékek szerint énÖsszehasonlíthatja a régiókat hozam alapján. Területek, amelyeknek az értékek megfelelnek én>0, átlag feletti hozamú, a én <0 - ниже среднего.

Példánkban a hozam szempontjából a leghatékonyabb növénytermesztést azon a területen végzik, amelynek  felel meg. 7 =28%, ahol a terméshozam 28%-kal magasabb a régiós átlagnál, és a legkevésbé hatékony a 20 =27,3%.

KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2023 „kingad.ru” - az emberi szervek ultrahangvizsgálata