Az együtthatók legkisebb négyzetes meghatározásának módszere. Kísérleti adatok közelítése

3. Függvények közelítése a módszerrel

legkisebb négyzetek

A kísérlet eredményeinek feldolgozásakor a legkisebb négyzetek módszerét alkalmazzuk közelítések (közelítések) kísérleti adatok analitikai képlet. A képlet konkrét formáját általában fizikai megfontolások alapján választják ki. Ezek a képletek lehetnek:

és mások.

A legkisebb négyzetek módszerének lényege a következő. Mutassuk be a mérési eredményeket a táblázatban:

asztal 4

x n

y n

(3.1)

ahol f ismert függvény, a 0, a 1, …, a m - ismeretlen állandó paraméterek, amelyek értékét meg kell találni. A legkisebb négyzetek módszerében a (3.1) függvény kísérleti függőséghez való közelítése tekinthető a legjobbnak, ha a feltétel

(3.2)

vagyis összegeket a a kívánt analitikai függvénynek a kísérleti függőségtől való négyzetes eltérése minimális legyen .

Vegye figyelembe, hogy a függvény K hívott inviscid.


Az eltérés óta

akkor van egy minimuma. A több változóból álló függvény minimumának szükséges feltétele, hogy a függvény összes parciális deriváltja nullával egyenlő legyen a paraméterek tekintetében. Így megtaláljuk a közelítő függvény (3.1) paramétereinek legjobb értékeit, vagyis azokat az értékeket, amelyekre Q = Q (a 0, a 1, …, a m ) minimális, az egyenletrendszer megoldására redukálódik:

(3.3)

A legkisebb négyzetek módszere a következő geometriai értelmezéssel adható: egy adott típusú egyenesek végtelen családja között találunk egy olyan egyenest, amelyre a kísérleti pontok ordinátáinak és a pontok megfelelő ordinátáinak négyzetes különbségeinek összege. ennek az egyenesnek az egyenlete által talált lesz a legkisebb.

Lineáris függvény paramétereinek megkeresése

Legyen a kísérleti adatok egy lineáris függvénnyel ábrázolva:

Ilyen értékeket kell választani a és b , amelyhez a függvény

(3.4)

minimális lesz. A (3.4) függvény minimumához szükséges feltételeket az egyenletrendszerre redukáljuk:

Transzformációk után egy két lineáris egyenletrendszert kapunk két ismeretlennel:

(3.5)

amelynek megoldásával megtaláljuk a paraméterek kívánt értékeit a és b .

Másodfokú függvény paramétereinek megkeresése

Ha a közelítő függvény másodfokú függés

akkor a paraméterei a , b , c keresse meg a függvény minimális feltételéből:

(3.6)

A (3.6) függvény minimális feltételeit az egyenletrendszerre redukáljuk:


A transzformációk után három, három ismeretlennel rendelkező lineáris egyenletrendszert kapunk:

(3.7)

nál nél amelynek megoldásával megtaláljuk a paraméterek kívánt értékeit a , b és c .

Példa . Legyen a kísérlet eredményeként az alábbi értéktáblázat x és y:

asztal 5

y i

0,705

0,495

0,426

0,357

0,368

0,406

0,549

0,768

A kísérleti adatokat lineáris és másodfokú függvényekkel kell közelíteni.

Megoldás. A közelítő függvények paramétereinek megtalálása a (3.5) és (3.7) lineáris egyenletrendszerek megoldására redukálódik. A probléma megoldásához táblázatkezelő processzort használunk excel.

1. Először kapcsoljuk össze az 1. és 2. lapot. Adjuk meg a kísérleti értékeket x i és y i oszlopokba A és B, a második sortól kezdve (az első sorba helyezzük az oszlopfejléceket). Ezután kiszámítjuk ezeknek az oszlopoknak az összegeit, és a tizedik sorba helyezzük őket.

A C–G oszlopokban helyezze el a számítást és az összegzést

2. Akassza le a lapokat A további számításokat hasonló módon végezzük el az 1. laptól való lineáris és a 2. lap másodfokú függésének meghatározásához.

3. A kapott táblázat alatt az együtthatók mátrixát és a szabad tagok oszlopvektorát alkotjuk. Oldjuk meg a lineáris egyenletrendszert a következő algoritmus szerint:

Az inverz mátrix kiszámításához és a mátrixok szorzásához használjuk funkciókatés funkciókat MOBRés MUMNOZH.

4. A H2 cellablokkban: H 9 a kapott együtthatók alapján kiszámítjuk a közelítő értékeit polinomy i kalc., I. blokkban 2: I 9 - eltérések D y i = y i exp. - y i kalc., a J oszlopban - az eltérés:

Táblázatok előállítása és felhasználása Diagramvarázslók grafikonok a 6., 7., 8. ábrákon láthatók.


Rizs. 6. Táblázat egy lineáris függvény együtthatóinak kiszámításához,

közelítő kísérleti adatok.


Rizs. 7. táblázat a másodfokú függvény együtthatóinak kiszámításához,

közelítőkísérleti adatok.


Rizs. 8. A közelítés eredményeinek grafikus ábrázolása

kísérleti adatok lineáris és másodfokú függvények.

Válasz. A kísérleti adatokat a lineáris függéssel közelítettük y = 0,07881 x + 0,442262 maradékkal K = 0,165167 és másodfokú függés y = 3,115476 x 2 – 5,2175 x + 2,529631 maradékkal K = 0,002103 .

Feladatok. Közelítse a táblázatos, lineáris és másodfokú függvényekkel adott függvényt.

6. táblázat

№0

x

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

y

3,030

3,142

3,358

3,463

3,772

3,251

3,170

3,665

1

3,314

3,278

3,262

3,292

3,332

3,397

3,487

3,563

2

1,045

1,162

1,264

1,172

1,070

0,898

0,656

0,344

3

6,715

6,735

6,750

6,741

6,645

6,639

6,647

6,612

4

2,325

2,515

2,638

2,700

2,696

2,626

2,491

2,291

5

1.752

1,762

1,777

1,797

1,821

1,850

1,884

1,944

6

1,924

1,710

1,525

1,370

1,264

1,190

1,148

1,127

7

1,025

1,144

1,336

1,419

1,479

1,530

1,568

1,248

8

5,785

5,685

5,605

5,545

5,505

5,480

5,495

5,510

9

4,052

4,092

4,152

4,234

4,338

4,468

4,599

Példa.

Kísérleti adatok a változók értékeiről xés nál nél táblázatban vannak megadva.

Igazításuk eredményeképpen a funkció

Használata legkisebb négyzetes módszer, közelítse ezeket az adatokat lineáris függéssel y=ax+b(keresse meg a paramétereket aés b). Nézze meg, hogy a két egyenes közül melyik a jobb (a legkisebb négyzetek módszere értelmében) igazítja a kísérleti adatokat. Készítsen rajzot.

A legkisebb négyzetek módszerének (LSM) lényege.

A feladat az, hogy megtaláljuk azokat a lineáris függőségi együtthatókat, amelyekre két változó függvénye aés b a legkisebb értéket veszi fel. Vagyis az adatok ismeretében aés b a kísérleti adatok négyzetes eltéréseinek összege a talált egyenestől lesz a legkisebb. Ez a legkisebb négyzetek módszerének lényege.

Így a példa megoldása két változó függvényének szélsőértékének megtalálására redukálódik.

Együttható-kereső képletek származtatása.

Összeállítunk és megoldunk egy két egyenletrendszert két ismeretlennel. Függvények parciális deriváltjainak keresése változók szerint aés b, ezeket a származékokat nullával egyenlővé tesszük.

A kapott egyenletrendszert bármilyen módszerrel megoldjuk (pl helyettesítési módszer vagy Cramer módszere), és kapjunk képleteket az együtthatók megtalálásához a legkisebb négyzetek módszerével (LSM).

Adatokkal aés b funkció a legkisebb értéket veszi fel. Ennek a ténynek a bizonyítéka adott az oldal végén található szöveg alatt.

Ez a legkisebb négyzetek módszere. Képlet a paraméter megtalálásához a tartalmazza a ,,, összegeket és a paramétert n- kísérleti adatok mennyisége. Ezen összegek értékét ajánlatos külön kiszámolni. Együttható b számítás után találtuk meg a.

Ideje emlékezni az eredeti példára.

Megoldás.

Példánkban n=5. A táblázatot a szükséges együtthatók képleteiben szereplő összegek kiszámításának megkönnyítése érdekében töltjük ki.

A táblázat negyedik sorában szereplő értékeket úgy kapjuk meg, hogy minden számhoz megszorozzuk a 2. sor értékét a 3. sor értékével én.

A táblázat ötödik sorában lévő értékeket úgy kapjuk meg, hogy a 2. sor értékét minden számhoz négyzetre emeljük én.

A táblázat utolsó oszlopának értékei a sorok közötti értékek összegei.

Az együtthatók meghatározásához a legkisebb négyzetek módszerének képleteit használjuk aés b. Helyettesítjük bennük a megfelelő értékeket a táblázat utolsó oszlopából:

Következésképpen, y=0,165x+2,184 a kívánt közelítő egyenes.

Azt kell kideríteni, hogy melyik sorból y=0,165x+2,184 vagy jobban közelíti az eredeti adatokat, azaz a legkisebb négyzetek módszerével becslést készít.

A legkisebb négyzetek módszerének hibájának becslése.

Ehhez ki kell számítani az eredeti adatok négyzetes eltéréseinek összegét ezekből a sorokból és , egy kisebb érték egy olyan vonalnak felel meg, amely jobban közelíti az eredeti adatokat a legkisebb négyzetek módszere szempontjából.

Mivel , majd a vonal y=0,165x+2,184 jobban közelíti az eredeti adatokat.

A legkisebb négyzetek módszerének (LSM) grafikus illusztrációja.

Minden remekül néz ki a grafikonokon. A piros vonal a talált vonal y=0,165x+2,184, a kék vonal az , a rózsaszín pöttyök az eredeti adatok.

A gyakorlatban a különböző folyamatok - különösen gazdasági, fizikai, műszaki, társadalmi - modellezésekor széles körben alkalmazzák a függvények hozzávetőleges értékeinek kiszámításának egyik vagy másik módszerét az ismert értékekből bizonyos rögzített pontokon.

Az ilyen jellegű függvények közelítésével kapcsolatos problémák gyakran felmerülnek:

    közelítő képletek összeállításakor a vizsgált folyamat jellemző mennyiségei értékeinek kiszámításához a kísérlet eredményeként kapott táblázatos adatok szerint;

    numerikus integrálásban, differenciálásban, differenciálegyenletek megoldásában stb.;

    ha ki kell számítani a függvények értékét a vizsgált intervallum közbenső pontjain;

    a folyamat jellemző mennyiségeinek a vizsgált intervallumon kívüli értékeinek meghatározásakor, különösen az előrejelzéskor.

Ha egy táblázat által meghatározott folyamat modellezéséhez olyan függvényt szerkesztünk, amely megközelítőleg leírja ezt a folyamatot a legkisebb négyzetek módszere alapján, akkor azt közelítő függvénynek (regresszió) nevezzük, és maga a közelítő függvények létrehozásának feladata. közelítési probléma lehet.

Ebben a cikkben az MS Excel csomagban rejlő lehetőségeket tárgyaljuk az ilyen jellegű problémák megoldására, ezen túlmenően táblázatosan megadott függvényekhez (amely a regresszióanalízis alapját képező) regressziókat készíthetünk (létrehozhatunk) módszereket és technikákat.

Két lehetőség van a regressziók felépítésére az Excelben.

    Kiválasztott regressziók (trendvonalak) hozzáadása a vizsgált folyamatjellemző adattáblázata alapján összeállított diagramhoz (csak diagram felépítése esetén érhető el);

    Az Excel munkalap beépített statisztikai funkcióinak felhasználása, amely lehetővé teszi a regressziók (trendvonalak) beszerzését közvetlenül a forrásadattáblázatból.

Trendvonalak hozzáadása a diagramhoz

Egy bizonyos folyamatot leíró és diagrammal ábrázolt adattáblázathoz az Excel hatékony regresszióelemző eszközzel rendelkezik, amely lehetővé teszi:

    építsünk a legkisebb négyzetek módszere alapján, és adjunk a diagramhoz ötféle regressziót, amelyek változó pontossággal modellezik a vizsgált folyamatot;

    add hozzá a diagramhoz a megszerkesztett regresszió egyenletét;

    határozza meg a kiválasztott regressziónak a diagramon megjelenített adatokkal való megfelelésének mértékét.

A diagram adatai alapján az Excel lehetővé teszi, hogy lineáris, polinomiális, logaritmikus, exponenciális, exponenciális típusú regressziókat kapjunk, amelyeket az egyenlet ad meg:

y = y(x)

ahol x egy független változó, amely gyakran egy természetes számsorozat (1; 2; 3; ...) értékeit veszi fel, és például a vizsgált folyamat (karakterisztikák) idejét visszaszámlálja. .

1 . A lineáris regresszió jó olyan jellemzők modellezésére, amelyek állandó sebességgel növekednek vagy csökkennek. Ez a vizsgált folyamat legegyszerűbb modellje. Az egyenlet szerint épül fel:

y=mx+b

ahol m a lineáris regresszió meredekségének érintője az x tengelyhez képest; b - a lineáris regresszió metszéspontjának koordinátája az y tengellyel.

2 . A polinomiális trendvonal hasznos olyan jellemzők leírására, amelyeknek több különálló szélsőségük van (magas és mélypont). A polinom mértékének megválasztását a vizsgált jellemző szélsőértékeinek száma határozza meg. Így egy másodfokú polinom jól leírhat egy olyan folyamatot, amelynek csak egy maximuma vagy minimuma van; a harmadik fokú polinom - legfeljebb két szélsőség; a negyedik fokú polinom - legfeljebb három szélsőség stb.

Ebben az esetben a trendvonal a következő egyenlet szerint épül fel:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

ahol a c0, c1, c2,...c6 együtthatók olyan állandók, amelyek értékeit az építés során határozzák meg.

3 . A logaritmikus trendvonalat sikeresen alkalmazzák olyan jellemzők modellezésére, amelyek értékei először gyorsan változnak, majd fokozatosan stabilizálódnak.

y = c ln(x) + b

4 . A teljesítménytrendvonal jó eredményeket ad, ha a vizsgált függőség értékeit a növekedési ütem állandó változása jellemzi. Az ilyen függőség példája az autó egyenletesen gyorsított mozgásának grafikonjaként szolgálhat. Ha az adatok nulla vagy negatív értékeket tartalmaznak, nem használhatja a teljesítmény trendvonalat.

Az egyenletnek megfelelően épül fel:

y = cxb

ahol a b, c együtthatók állandók.

5 . Exponenciális trendvonalat kell használni, ha az adatok változási üteme folyamatosan növekszik. A nulla vagy negatív értékeket tartalmazó adatok esetében ez a fajta közelítés szintén nem alkalmazható.

Az egyenletnek megfelelően épül fel:

y=cebx

ahol a b, c együtthatók állandók.

Trendvonal kiválasztásakor az Excel automatikusan kiszámolja az R2 értékét, ami a közelítés pontosságát jellemzi: minél közelebb van az R2 érték egyhez, a trendvonal annál megbízhatóbban közelíti meg a vizsgált folyamatot. Ha szükséges, az R2 értéke mindig megjeleníthető a diagramon.

A képlet határozza meg:

Trendvonal hozzáadása adatsorhoz:

    aktiválja az adatsorok alapján felépített diagramot, azaz kattintson a diagram területen belülre. A Diagram elem megjelenik a főmenüben;

    erre az elemre kattintva egy menü jelenik meg a képernyőn, amelyben a Trendvonal hozzáadása parancsot kell kiválasztani.

Ugyanezek a műveletek egyszerűen végrehajthatók, ha az egyik adatsornak megfelelő grafikon fölé viszi az egérmutatót, és rákattint a jobb gombbal; a megjelenő helyi menüben válassza a Trendvonal hozzáadása parancsot. Megjelenik a képernyőn a Trendline párbeszédpanel a Típus fül megnyitásával (1. ábra).

Ezek után szüksége van:

A Típus lapon válassza ki a kívánt trendvonaltípust (alapértelmezés szerint a Lineáris van kiválasztva). A Polinom típushoz a Fok mezőben adja meg a kiválasztott polinom fokszámát.

1 . A Built on Series mező felsorolja a kérdéses diagram összes adatsorát. Ha trendvonalat szeretne hozzáadni egy adott adatsorozathoz, válassza ki a nevét a sorozatra épített mezőben.

Ha szükséges, a Paraméterek fülre lépve (2. ábra) a következő paramétereket állíthatja be a trendvonalhoz:

    módosítsa a trendvonal nevét a Közelítő (simított) görbe neve mezőben.

    állítsa be az előrejelzés periódusainak számát (előre vagy hátra) az Előrejelzés mezőben;

    jelenítse meg a trendvonal egyenletét a diagram területén, amelynél engedélyeznie kell az egyenlet megjelenítése a diagramon jelölőnégyzetet;

    jelenítse meg az R2 közelítési megbízhatóság értékét a diagram területén, amelynél engedélyeznie kell a jelölőnégyzetet, tegye a diagramra a közelítési megbízhatóság (R^2) értékét;

    állítsa be a trendvonal metszéspontját az Y tengellyel, amelynél engedélyeznie kell a Görbe metszéspontja az Y tengellyel egy pontban jelölőnégyzetet;

    kattintson az OK gombra a párbeszédpanel bezárásához.

Háromféleképpen kezdheti meg a már felépített trendvonal szerkesztését:

    használja a Formátum menü Kijelölt trendvonal parancsát a trendvonal kiválasztása után;

    a helyi menüből válassza ki a Trendvonal formázása parancsot, amelyet a trendvonalra való jobb kattintással hívunk meg;

    dupla kattintással a trendvonalra.

A képernyőn megjelenik a Trendvonal formázása párbeszédpanel (3. ábra), amely három fület tartalmaz: Nézet, Típus, Paraméterek, és az utolsó kettő tartalma teljesen egybeesik a Trendline párbeszédpanel hasonló lapjaival (1-2. ábra). ). A Nézet lapon beállíthatja a vonal típusát, színét és vastagságát.

Egy már felépített trendvonal törléséhez válassza ki a törölni kívánt trendvonalat, és nyomja meg a Delete gombot.

A vizsgált regresszióelemző eszköz előnyei a következők:

    a trendvonal diagramokon való ábrázolásának viszonylagos egyszerűsége adattábla létrehozása nélkül;

    a javasolt trendvonalak típusainak meglehetősen széles listája, és ez a lista tartalmazza a leggyakrabban használt regressziós típusokat;

    a vizsgált folyamat viselkedésének előrejelzésének lehetősége tetszőleges (józan ész) számú lépésre előre és hátra;

    a trendvonal egyenletének analitikus formában való megszerzésének lehetősége;

    szükség esetén a közelítés megbízhatóságának értékelésének lehetősége.

A hátrányok közé tartoznak a következő pontok:

    trendvonal felépítésére csak akkor kerül sor, ha van egy adatsorra épített diagram;

    a vizsgált karakterisztikára vonatkozó adatsorok generálásának folyamata a rá kapott trendvonal-egyenletek alapján kissé zsúfolt: a kívánt regressziós egyenletek az eredeti adatsor értékeinek minden változásával frissülnek, de csak a diagram területén belül , míg a régi egyenes egyenlet trendje alapján képzett adatsor változatlan marad;

    A kimutatásdiagram-jelentésekben a diagramnézet vagy a kapcsolódó kimutatás-jelentés módosításakor a meglévő trendvonalak nem maradnak meg, ezért a trendvonalak rajzolása vagy a kimutatás-jelentés más módon történő formázása előtt meg kell győződnie arról, hogy a jelentés elrendezése megfelel a követelményeknek.

Trendvonalak hozzáadhatók a diagramokon megjelenített adatsorokhoz, például grafikonon, hisztogramon, lapos, nem normalizált területdiagramon, oszlopdiagramon, szórási, buborék- és részvénydiagramon.

Nem adhat trendvonalakat adatsorokhoz 3D, Standard, Radar, Pie és Donut diagramokon.

A beépített Excel-függvények használata

Az Excel egy regresszióelemző eszközt is biztosít a trendvonalak diagramterületen kívüli ábrázolásához. Számos statisztikai munkalapfüggvény használható erre a célra, de ezek mindegyike csak lineáris vagy exponenciális regressziót tesz lehetővé.

Az Excel számos funkcióval rendelkezik a lineáris regresszió felépítéséhez, különösen:

    IRÁNYZAT;

  • SLOPE és VÁGÁS.

Valamint számos funkció egy exponenciális trendvonal felépítéséhez, különösen:

    LGRFPkb.

Megjegyzendő, hogy a TREND és a GROWTH függvények segítségével történő regressziók létrehozásának technikái gyakorlatilag megegyeznek. Ugyanez mondható el a LINEST és az LGRFPRIBL funkciópárról is. Az értéktáblázat létrehozásakor ehhez a négy függvényhez olyan Excel-funkciókat használnak, mint a tömbképletek, ami némileg megzavarja a regressziók felépítésének folyamatát. Megjegyezzük továbbá, hogy véleményünk szerint a lineáris regresszió felépítése a legkönnyebben a SLOPE és INTERCEPT függvényekkel valósítható meg, ahol az első a lineáris regresszió meredekségét, a második pedig a regresszió által levágott szakaszt határozza meg. az y tengelyen.

A regressziós elemzéshez beépített függvényeszköz előnyei a következők:

    a vizsgált jellemző adatsorainak azonos típusú képzésének meglehetősen egyszerű folyamata az összes trendvonalat meghatározó beépített statisztikai függvényre;

    szabványos technika trendvonalak felépítésére a generált adatsorok alapján;

    a vizsgált folyamat viselkedésének előrejelzésének képessége a szükséges számú lépésre előre vagy hátra.

A hátrányok közé tartozik, hogy az Excel nem rendelkezik beépített függvényekkel más (a lineáris és exponenciális) típusú trendvonalak létrehozására. Ez a körülmény gyakran nem teszi lehetővé a vizsgált folyamat kellően pontos modelljének kiválasztását, valamint a valósághoz közeli előrejelzések készítését. Ezenkívül a TREND és a GROW függvények használatakor a trendvonalak egyenlete nem ismert.

Megjegyzendő, hogy a szerzők nem azt tűzték ki célul, hogy a regresszióanalízis menetét változó fokú teljességgel mutassa be a cikknek. Fő feladata, hogy konkrét példákon keresztül bemutassa az Excel csomag képességeit a közelítési feladatok megoldásában; bemutatni, milyen hatékony eszközei vannak az Excelnek a regressziók felépítéséhez és az előrejelzésekhez; szemléltesse, milyen könnyen megoldható az ilyen problémák még olyan felhasználó számára is, aki nem ismeri a regresszióanalízist.

Példák konkrét problémák megoldására

Fontolja meg konkrét problémák megoldását az Excel csomag felsorolt ​​eszközeivel.

1. feladat

Gépjármű-közlekedési vállalkozás 1995-2002. évi nyereségének adattáblázatával. a következőket kell tennie.

    Készítsen diagramot.

    Lineáris és polinomiális (négyzetes és köbös) trendvonalak hozzáadása a diagramhoz.

    A trendvonal-egyenletek segítségével táblázatos adatokat kapjon a vállalkozás nyereségéről az 1995-2004 közötti trendvonalakonként.

    Készítsen nyereség-előrejelzést a vállalkozás számára 2003-ra és 2004-re.

A probléma megoldása

    Az Excel munkalap A4:C11 celláinak tartományába beírjuk az ábrán látható munkalapot. négy.

    A B4:C11 cellatartomány kiválasztását követően diagramot készítünk.

    Aktiváljuk a felépített diagramot, és a fent leírt módszerrel a Trend Line párbeszédpanelen a trendvonal típusának kiválasztása után (lásd 1. ábra) felváltva lineáris, másodfokú és köbös trendvonalakat adunk a diagramhoz. Ugyanebben a párbeszédablakban nyissa meg a Paraméterek lapot (lásd 2. ábra), a Közelítő (simított) görbe neve mezőbe írja be a hozzáadni kívánt trend nevét, és az Előrejelzés előre: időszakokra mezőben állítsa be. a 2-es érték, mivel a tervek szerint két évre előrejelzést készítenek. A regressziós egyenlet és az R2 közelítési megbízhatóság értékének megjelenítéséhez a diagramterületen jelölje be az Egyenlet megjelenítése a képernyőn jelölőnégyzeteket, és helyezze el a közelítési megbízhatóság (R^2) értékét a diagramon. A jobb vizuális érzékelés érdekében megváltoztatjuk a kirajzolt trendvonalak típusát, színét és vastagságát, ehhez a Trend Line Format párbeszédpanel Nézet fülét használjuk (lásd 3. ábra). Az eredményül kapott diagram a hozzáadott trendvonalakkal az ábrán látható. 5.

    Táblázatos adatok beszerzése a vállalkozás nyereségéről az egyes trendvonalakban 1995-2004 között. Használjuk az ábrán bemutatott trendvonalak egyenleteit. 5. Ehhez a D3:F3 tartomány celláiba írjon be szöveges információkat a kiválasztott trendvonal típusáról: Lineáris trend, Kvadratikus trend, Köbtrend. Ezután írja be a lineáris regressziós képletet a D4 cellába, és a kitöltési marker segítségével másolja ezt a képletet a D5:D13 cellatartomány relatív hivatkozásaival. Megjegyzendő, hogy a D4:D13 cellatartományból származó lineáris regressziós képlettel rendelkező cellákhoz argumentumként tartozik egy megfelelő cella az A4:A13 tartományból. Hasonlóképpen, másodfokú regresszió esetén az E4:E13 cellatartomány, a köbös regressziónál pedig az F4:F13 cellatartomány van kitöltve. Így a vállalkozás 2003. és 2004. évi nyereségére prognosztizáltak. három irányzattal. Az így kapott értéktáblázat az ábrán látható. 6.

2. feladat

    Készítsen diagramot.

    Adjon hozzá logaritmikus, exponenciális és exponenciális trendvonalakat a diagramhoz.

    Vezesse le a kapott trendvonalak egyenleteit, valamint mindegyikre az R2 közelítési megbízhatóság értékeit.

    A trendvonal-egyenletek segítségével táblázatos adatokat kapjon a vállalkozás nyereségéről az 1995-2002 közötti trendvonalakonként.

    Készítsen nyereség-előrejelzést a vállalkozás számára 2003-ra és 2004-re ezen trendvonalak segítségével.

A probléma megoldása

Az 1. feladat megoldásánál megadott módszertant követve egy diagramot kapunk logaritmikus, exponenciális és exponenciális trendvonalak hozzáadásával (7. ábra). Továbbá a kapott trendvonal-egyenletek felhasználásával kitöltjük a vállalkozás nyereségére vonatkozó értéktáblázatot, amely tartalmazza a 2003-as és 2004-es előrejelzett értékeket. (8. ábra).

ábrán. 5. és 3. ábra. látható, hogy a logaritmikus trendű modell a közelítési megbízhatóság legalacsonyabb értékének felel meg

R2 = 0,8659

Az R2 legmagasabb értékei polinomiális trenddel rendelkező modelleknek felelnek meg: másodfokú (R2 = 0,9263) és köbös (R2 = 0,933).

3. feladat

Az 1. feladatban megadott, egy gépjármű-közlekedési vállalkozás 1995-2002. évi nyereségére vonatkozó adattáblázattal a következő lépéseket kell végrehajtania.

    A TREND és a GROW függvények segítségével adatsorokat kaphat a lineáris és exponenciális trendvonalakról.

    A TREND és GROWTH függvények segítségével készítsen nyereség-előrejelzést a vállalkozás számára 2003-ra és 2004-re.

    A kiindulási adatokhoz és a kapott adatsorokhoz készítsen diagramot.

A probléma megoldása

Használjuk az 1. feladat munkalapját (lásd 4. ábra). Kezdjük a TREND függvénnyel:

    válassza ki a D4:D11 cellák tartományát, amelyet fel kell tölteni a TREND függvény értékeivel, amelyek megfelelnek a vállalkozás nyereségére vonatkozó ismert adatoknak;

    hívja meg a Funkció parancsot a Beszúrás menüből. A megjelenő Funkcióvarázsló párbeszédpanelen válassza ki a TREND függvényt a Statisztikai kategóriából, majd kattintson az OK gombra. Ugyanez a művelet elvégezhető a szabványos eszköztár gombjának (Beszúrás funkció) megnyomásával.

    A megjelenő Függvényargumentumok párbeszédpanelen írja be a C4:C11 cellatartományt az Ismert_értékek_y mezőbe; az Ismert_értékek_x mezőben - a B4:B11 cellatartomány;

    a beírt képlet tömbképletté alakításához használja a + + billentyűkombinációt.

A képletsorba beírt képlet így fog kinézni: =(TREND(C4:C11;B4:B11)).

Ennek eredményeként a D4:D11 cellák tartománya megtelik a TREND funkció megfelelő értékeivel (9. ábra).

A vállalat 2003-as és 2004-es nyereségére vonatkozó előrejelzést készíteni. szükséges:

    válassza ki a D12:D13 cellák tartományát, ahol a TREND funkció által előrejelzett értékek kerülnek beírásra.

    hívja meg a TREND függvényt, és a megjelenő Függvényargumentumok párbeszédpanelen írja be a Known_values_y mezőbe - a C4:C11 cellatartományt; az Ismert_értékek_x mezőben - a B4:B11 cellatartomány; az Új_értékek_x mezőben pedig a B12:B13 cellatartomány.

    alakítsa ezt a képletet tömbképletté a Ctrl + Shift + Enter billentyűparancs segítségével.

    A beírt képlet így fog kinézni: =(TREND(C4:C11;B4:B11;B12:B13)), és a D12:D13 cellák tartománya ki lesz töltve a TREND függvény előrejelzett értékeivel (lásd az ábrát). 9).

Hasonlóképpen, egy adatsor kitöltése a GROWTH függvénnyel történik, amelyet a nemlineáris függőségek elemzésére használnak, és pontosan ugyanúgy működik, mint a TREND lineáris megfelelője.

A 10. ábra a táblázatot képlet megjelenítési módban mutatja.

A kiinduló adatokhoz és a kapott adatsorokhoz az ábrán látható diagram. tizenegy.

4. feladat

A gépjárművek diszpécserszolgálata által a tárgyhó 1-től 11-ig terjedő időszakra vonatkozó szolgáltatási igények beérkezésének adattáblázatával a következő műveleteket kell elvégezni.

    Adatsorok beszerzése a lineáris regresszióhoz: a SLOPE és INTERCEPT függvények használatával; a LINEST funkció használatával.

    Kérjen le egy adatsort az exponenciális regresszióhoz a LYFFPRIB függvény használatával.

    A fenti funkciók segítségével készítsen előrejelzést a diszpécserszolgálathoz történő jelentkezések beérkezéséről a tárgyhó 12-től 14-ig terjedő időszakra.

    Az eredeti és a kapott adatsorokhoz készítsen diagramot.

A probléma megoldása

Vegye figyelembe, hogy a TREND és GROW függvényekkel ellentétben a fent felsorolt ​​függvények (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) egyike sem regresszió. Ezek a függvények csak segéd szerepet játszanak, meghatározzák a szükséges regressziós paramétereket.

A SLOPE, INTERCEPT, LINEST, LGRFPRIB függvényekkel felépített lineáris és exponenciális regresszióknál ezek egyenletei megjelenése mindig ismert, ellentétben a TREND és GROWTH függvényeknek megfelelő lineáris és exponenciális regressziókkal.

1 . Építsünk fel egy lineáris regressziót, amelynek az egyenlete:

y=mx+b

a SLOPE és INTERCEPT függvények használatával, ahol a regresszió m meredekségét a SLOPE függvény, a b konstans tagot pedig az INTERCEPT függvény határozza meg.

Ehhez a következő műveleteket hajtjuk végre:

    írja be a forrástáblázatot az A4:B14 cellák tartományába;

    az m paraméter értéke a C19 cellában lesz meghatározva. Válassza ki a Statisztikai kategóriából a Slope függvényt; írja be a B4:B14 cellatartományt az ismert_értékek_y mezőbe és az A4:A14 cellák tartományát az ismert_értékek_x mezőbe. A képlet a C19 cellába kerül: =SLOPE(B4:B14;A4:A14);

    hasonló módszerrel határozzuk meg a b paraméter értékét a D19 cellában. A tartalma pedig így fog kinézni: = INTERCEPT(B4:B14;A4:A14). Így a lineáris regresszió felépítéséhez szükséges m és b paraméterek értékei a C19, D19 cellákban lesznek tárolva;

    majd a C4 cellába beírjuk a lineáris regressziós képletet a következő formában: = $ C * A4 + $ D. Ebben a képletben a C19 és D19 cellák abszolút hivatkozásokkal vannak írva (a cella címe nem változhat az esetleges másolással). A $ abszolút referenciajel beírható a billentyűzetről vagy az F4 billentyűvel, miután a kurzort a cellacímre helyeztük. A kitöltő fogantyú segítségével másolja ezt a képletet a C4:C17 cellatartományba. Megkapjuk a kívánt adatsort (12. ábra). Tekintettel arra, hogy a kérelmek száma egész szám, a Cellaformátum ablak Szám lapján a számformátumot a tizedesjegyek számával 0-ra kell beállítani.

2 . Most építsünk fel egy lineáris regressziót, amelyet az egyenlet ad meg:

y=mx+b

a LINEST funkció használatával.

Ezért:

    írja be a LINEST függvényt tömbképletként a C20:D20 cellatartományba: =(LINEST(B4:B14;A4:A14)). Ennek eredményeként a C20 cellában az m paraméter értékét, a D20 cellában a b paraméter értékét kapjuk;

    írja be a képletet a D4 cellába: =$C*A4+$D;

    másolja ezt a képletet a kitöltési marker segítségével a D4:D17 cellatartományba, és kapja meg a kívánt adatsort.

3 . Építünk egy exponenciális regressziót, amely a következő egyenletet tartalmazza:

az LGRFPRIBL funkció segítségével hasonlóan hajtja végre:

    a C21:D21 cellatartományba írja be az LGRFPRIBL függvényt tömbképletként: =( LGRFPRIBL (B4:B14;A4:A14)). Ebben az esetben az m paraméter értéke a C21 cellában, a b paraméter értéke pedig a D21 cellában kerül meghatározásra;

    a képlet az E4 cellába kerül: =$D*$C^A4;

    a kitöltési marker segítségével ezt a képletet az E4:E17 cellatartományba másoljuk, ahol az exponenciális regresszió adatsorai lesznek (lásd 12. ábra).

ábrán. A 13. ábra egy táblázatot mutat, ahol láthatjuk az általunk használt függvényeket a szükséges cellatartományokkal, valamint képleteket.

Érték R 2 hívott determinációs együttható.

A regressziós függés megalkotásának feladata, hogy megtaláljuk az (1) modell m együtthatóinak azt a vektorát, amelynél az R együttható a legnagyobb értéket veszi fel.

Az R szignifikanciájának értékelésére Fisher-féle F-próbát használunk, amelyet a képlet alapján számítunk ki

ahol n- mintanagyság (kísérletek száma);

k a modell együtthatók száma.

Ha F túllép az adatok valamelyik kritikus értékén nés kés az elfogadott konfidenciaszintet, akkor R értéke szignifikánsnak tekinthető. Az F kritikus értékeinek táblázatait a matematikai statisztika referenciakönyvei tartalmazzák.

Így az R jelentőségét nemcsak az értéke határozza meg, hanem a kísérletek számának és a modell együtthatóinak (paramétereinek) számának aránya is. Valójában az n=2 korrelációs arány egy egyszerű lineáris modellnél 1 (a síkon 2 ponton keresztül mindig rajzolhat egyetlen egyenest). Ha azonban a kísérleti adatok véletlen változók, akkor az R ilyen értékében nagyon óvatosan kell bízni. Általában a szignifikáns R és megbízható regresszió elérése érdekében az a cél, hogy a kísérletek száma jelentősen meghaladja a modell együtthatók számát (n>k).

Lineáris regressziós modell felépítéséhez a következőket kell tennie:

1) készítsen n sorból és m oszlopból álló listát a kísérleti adatokkal (a kimeneti értéket tartalmazó oszlop Y elsőnek vagy utolsónak kell lennie a listán); például vegyük az előző feladat adatait, adjunk hozzá egy "időszakszám" nevű oszlopot, számozzuk a periódusok számát 1-től 12-ig. (ezek lesznek az értékek x)

2) lépjen az Adatok/Adatelemzés/Regresszió menübe

Ha az "Eszközök" menüből hiányzik az "Adatelemzés" pont, akkor ugyanennek a menünek a "Kiegészítők" menüpontjában kell bejelölni az "Elemzési csomag" négyzetet.

3) a "Regresszió" párbeszédpanelen állítsa be:

beviteli intervallum Y;

beviteli intervallum X;

kimeneti intervallum - annak az intervallumnak a bal felső cellája, amelybe a számítási eredmények kerülnek (ajánlott egy új munkalapon elhelyezni);

4) kattintson az "Ok" gombra, és elemezze az eredményeket.

A módszer lényege abban rejlik, hogy a vizsgált megoldás minőségének kritériuma a négyzetes hibák összege, amelyet igyekeznek minimalizálni. Ennek alkalmazásához a lehető legtöbb mérést kell elvégezni egy ismeretlen valószínűségi változóról (minél több - annál nagyobb a megoldás pontossága) és egy bizonyos várt megoldáskészletet, amelyek közül ki kell választani a legjobbat. . Ha a megoldások halmaza paraméterezett, akkor meg kell találni a paraméterek optimális értékét.

Miért van minimalizálva a hibanégyzet, és miért nem magukat a hibákat? A helyzet az, hogy a legtöbb esetben mindkét irányban előfordulnak hibák: a becslés lehet nagyobb a mérésnél, vagy kisebb is annál. Ha különböző előjelű hibákat adunk hozzá, akkor azok kioltják egymást, és ennek eredményeként az összeg helytelen képet ad a becslés minőségéről. Gyakran annak érdekében, hogy a végső becslés mérete megegyezzen a mért értékekkel, a négyzetgyököt a hibák négyzetes összegéből veszik.


Fénykép:

Az LSM-et a matematikában használják, különösen a valószínűségszámításban és a matematikai statisztikában. Ennek a módszernek a legnagyobb alkalmazása a szűrési problémákban, amikor a hasznos jelet el kell választani a rárakódó zajtól.

A matematikai elemzésben is használják egy adott függvény egyszerűbb függvényekkel történő közelítő ábrázolására. Az LSM másik alkalmazási területe olyan egyenletrendszerek megoldása, amelyeknél kevesebb az ismeretlen, mint az egyenletek száma.

Eszembe jutott még néhány nagyon váratlan alkalmazás az LSM-ből, amelyekről ebben a cikkben szeretnék beszélni.

MNC-k és elírások

A gépelési és helyesírási hibák az automatikus fordítók és keresőmotorok csapásai. Valóban, ha a szó csak 1 betűvel tér el, akkor a program egy másik szónak tekinti, és hibásan fordítja/keresi, vagy egyáltalán nem fordítja/nem találja.

Hasonló problémám volt: két adatbázis volt a moszkvai házak címeivel, és ezeket össze kellett vonni egybe. De a címeket más stílusban írták. Az egyik adatbázisban ott volt a KLADR szabvány (Összoroszországi címosztályozó), például: "BABUSHKINA PILOT UL., D10K3". És egy másik adatbázisban volt egy postai stílus, például: „St. Babuskin pilóta, 10. ház, 3. épület. Úgy tűnik, hogy mindkét esetben nincs hiba, a folyamat automatizálása pedig hihetetlenül nehéz (minden adatbázis 40 000 rekordot tartalmaz!). Bár volt benne elgépelés is elég... Hogyan lehet megértetni a számítógéppel, hogy a fenti 2 cím ugyanahhoz a házhoz tartozik? Itt jött be nekem az MNC.

Mit tettem? Miután megtaláltam a következő levelet az első címen, ugyanazt a levelet kerestem a második címen. Ha mindkettő ugyanazon a helyen volt, akkor az adott betű hibáját 0-nak feltételeztem. Ha szomszédos pozíciókban voltak, akkor a hiba 1 volt. Ha 2 pozícióval volt eltolás, akkor a hiba 2, és így tovább Ha a másik címben egyáltalán nem volt ilyen betű, akkor a hibát n+1-nek feltételeztük, ahol n az 1. cím betűinek száma. Így kiszámítottam a négyzetes hibák összegét, és összekötöttem azokat a rekordokat, amelyekben ez az összeg minimális volt.

Természetesen a házak és épületek számát külön feldolgoztuk. Nem tudom, hogy én találtam-e fel egy másik „biciklit”, vagy tényleg az volt, de a probléma gyorsan és hatékonyan megoldódott. Kíváncsi vagyok, hogy ezt a módszert használják-e a keresők? Talán használják, hiszen minden önmagát tisztelő keresőmotor, amikor egy ismeretlen szóval találkozik, felkínálja az ismerős szavak helyettesítését ("talán úgy értette..."). Ezt az elemzést azonban másként is meg tudják csinálni.

OLS és keresés képek, arcok és térképek alapján

Ez a módszer használható képek, rajzok, térképek, sőt emberek arcai alapján történő keresésre is.

Fénykép:

Mostantól minden keresőmotor a képek szerinti keresés helyett a képfeliratok szerinti keresést használja. Ez kétségtelenül hasznos és kényelmes szolgáltatás, de azt javaslom, hogy kiegészítsük egy valódi képkeresővel.

Bevezetésre kerül egy mintakép, és a jellemző pontok eltéréseinek négyzetes összegéből minden képre értékelés készül. Ezeknek a nagyon jellemző pontoknak a meghatározása önmagában nem triviális feladat. Viszont eléggé megoldható: például arcoknál ezek a szemzugok, az ajkak, az orrhegy, az orrlyukak, a szemöldök szélei és középpontjai, pupillák stb.

Ezeket a paramétereket összehasonlítva találhat egy olyan arcot, amely leginkább hasonlít a mintához. Láttam már olyan oldalakat, ahol működik egy ilyen szolgáltatás, és lehet találni egy olyan hírességet, amely leginkább hasonlít az általad javasolt fotóhoz, sőt olyan animációt is összeállíthat, amely híressé varázsol és vissza. Bizonyára ugyanez a módszer működik a Belügyminisztérium bázisain is, ahol a bűnözők identikit képeket tartalmaznak.

Fotó: pixabay.com

Igen, és az ujjlenyomatok is ugyanúgy kereshetők. A térképes keresés a földrajzi objektumok – folyók kanyarulatai, hegyvonulatok, partok, erdők és mezők körvonalai – természetes egyenetlenségeire fókuszál.

Itt van egy ilyen csodálatos és sokoldalú OLS-módszer. Biztos vagyok benne, hogy Önök, kedves olvasók, sok szokatlan és váratlan alkalmazást találhatnak majd maguknak ennek a módszernek.

Számos alkalmazása van, mivel lehetővé teszi egy adott függvény közelítő ábrázolását más egyszerűbbekkel. Az LSM rendkívül hasznos lehet a megfigyelések feldolgozásában, és aktívan használják bizonyos mennyiségek becslésére mások véletlenszerű hibákat tartalmazó mérési eredményeiből. Ebből a cikkből megtudhatja, hogyan lehet a legkisebb négyzetek számításait végrehajtani az Excelben.

A probléma megfogalmazása egy konkrét példán

Tegyük fel, hogy két mutató van X és Y. Sőt, Y függ X-től. Mivel az OLS a regresszióanalízis szempontjából érdekes számunkra (Excelben a metódusait beépített függvényekkel valósítják meg), azonnal tovább kell lépnünk egy konkrét probléma mérlegelésére.

Tehát legyen X egy élelmiszerbolt eladási területe négyzetméterben, Y pedig az éves forgalom, millió rubelben.

Előrejelzést kell készíteni arra vonatkozóan, hogy mekkora (Y) forgalma lesz az üzletnek, ha van egy vagy másik üzlethelyisége. Nyilvánvalóan az Y = f (X) függvény növekszik, hiszen a hipermarket több árut ad el, mint a bódé.

Néhány szó az előrejelzéshez használt kiindulási adatok helyességéről

Tegyük fel, hogy van egy táblánk, amely n bolt adatait tartalmazza.

A matematikai statisztikák szerint az eredmények többé-kevésbé helyesek, ha legalább 5-6 objektum adatait megvizsgáljuk. Ezenkívül nem használhatók „rendellenes” eredmények. Különösen egy elit kis butik forgalma többszöröse lehet, mint a „masmarket” osztályba tartozó nagy üzletek forgalmának.

A módszer lényege

A táblázat adatai a derékszögű síkon M 1 (x 1, y 1), ... M n (x n, y n) pontokként jeleníthetők meg. Most a feladat megoldását egy y = f (x) közelítő függvény kiválasztására redukáljuk, amelynek grafikonja a lehető legközelebb megy át az M 1, M 2, .. M n pontokhoz.

Természetesen használhat nagyfokú polinomot, de ezt a lehetőséget nemcsak nehéz megvalósítani, hanem egyszerűen hibás, mivel nem tükrözi a fő trendet, amelyet észlelni kell. A legésszerűbb megoldás egy y = ax + b egyenes keresése, amely a legjobban közelíti a kísérleti adatokat, pontosabban az - a és b együtthatókat.

Pontossági pontszám

Bármilyen közelítéshez különösen fontos a pontosságának értékelése. Jelölje e i az x i pont funkcionális és kísérleti értékei közötti különbséget (eltérést), azaz e i = y i - f (x i).

Nyilvánvalóan a közelítés pontosságának értékeléséhez használhatja az eltérések összegét, azaz amikor egyenest választ X X Y-tól való függésének közelítő ábrázolására, előnyben kell részesíteni azt, amelyiknek a legkisebb értéke van. az összeg e i minden vizsgált pontban. Azonban nem minden olyan egyszerű, mivel a pozitív eltérések mellett gyakorlatilag negatívak is lesznek.

A problémát az eltérési modulok vagy azok négyzetei segítségével oldhatja meg. Ez utóbbi módszer a legelterjedtebb. Számos területen használják, beleértve a regressziós elemzést is (az Excelben két beépített függvény segítségével valósul meg), és régóta bizonyítottan hatékony.

Legkisebb négyzet alakú módszer

Az Excelben, mint tudod, van egy beépített automatikus összegzési funkció, amely lehetővé teszi a kiválasztott tartományban található összes érték értékének kiszámítását. Így semmi sem akadályoz meg bennünket abban, hogy kiszámoljuk a kifejezés értékét (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Matematikai jelöléssel ez így néz ki:

Mivel eredetileg úgy döntöttünk, hogy egy egyenest közelítünk, a következőt kaptuk:

Így az X és Y közötti konkrét kapcsolatot legjobban leíró egyenes megtalálása két változó függvényének minimumának kiszámítását jelenti:

Ehhez nulla parciális derivált kell egyenlővé tenni az új a és b változók tekintetében, és meg kell oldani egy primitív rendszert, amely két egyenletből áll, két ismeretlen alakú:

Egyszerű átalakítások után, beleértve a 2-vel való osztást és az összegek manipulálását, a következőt kapjuk:

Megoldva például Cramer módszerével egy stacionárius pontot kapunk bizonyos a * és b * együtthatókkal. Ez a minimum, vagyis annak előrejelzésére, hogy egy adott területen mekkora forgalmat bonyolít le az üzlet, alkalmas az y = a * x + b * egyenes, amely egy regressziós modell a szóban forgó példára. Természetesen ez nem teszi lehetővé a pontos eredmény megtalálását, de segít abban, hogy képet kapjon arról, hogy kifizetődő-e egy üzlet hitelre történő vásárlása egy adott területre.

A legkisebb négyzetek módszerének megvalósítása az Excelben

Az Excelben van egy függvény a legkisebb négyzetek értékének kiszámítására. Ennek a következő formája van: TREND (ismert Y értékek; ismert X értékek; új X értékek; állandó). Alkalmazzuk táblázatunkra az Excelben az OLS kiszámításának képletét.

Ehhez abba a cellába, amelyben az Excelben a legkisebb négyzetek módszerével végzett számítás eredményét meg kell jeleníteni, írja be az „=” jelet, és válassza ki a „TREND” funkciót. A megnyíló ablakban töltse ki a megfelelő mezőket, kiemelve:

  • az Y ismert értékeinek tartománya (ebben az esetben a forgalom adatai);
  • tartomány x 1 , …x n , azaz az üzlethelyiség mérete;
  • és x ismert és ismeretlen értékei, amelyekhez meg kell találnia a forgalom nagyságát (a munkalapon való elhelyezkedésükről lásd alább).

Ezenkívül a képletben van egy "Const" logikai változó. Ha 1-et ír be a megfelelő mezőbe, akkor ez azt jelenti, hogy számításokat kell végezni, feltételezve, hogy b \u003d 0.

Ha egynél több x értékre van szüksége az előrejelzésre, akkor a képlet beírása után ne nyomja meg az "Enter" gombot, hanem a "Shift" + "Control" + "Enter" ("Enter") kombinációt kell begépelnie. ) a billentyűzeten.

Néhány szolgáltatás

A regressziós elemzés még a bábuk számára is elérhető. Az ismeretlen változókból álló tömb értékének előrejelzésére szolgáló Excel képletet - "TREND" - azok is használhatják, akik még nem hallottak a legkisebb négyzetek módszeréről. Elég, ha ismerjük a munkájának néhány jellemzőjét. Különösen:

  • Ha az y változó ismert értékeinek tartományát egy sorban vagy oszlopban helyezi el, akkor a program minden ismert x értékkel rendelkező sort (oszlopot) külön változóként érzékel.
  • Ha az ismert x-szel rendelkező tartomány nincs megadva a TREND ablakban, akkor a függvény Excelben történő használata esetén a program egész számokból álló tömbnek tekinti, amelynek száma megfelel a megadott értékekkel rendelkező tartománynak. az y változóból.
  • A "megjósolt" értékek tömbjének kiadásához a trendkifejezést tömbképletként kell megadni.
  • Ha nem adunk meg új x értékeket, akkor a TREND függvény egyenlőnek tekinti azokat az ismertekkel. Ha nincsenek megadva, akkor az 1. tömböt veszi argumentumnak; 2; 3; 4;…, amely arányos a már megadott y paraméterek tartományával.
  • Az új x értékeket tartalmazó tartománynak ugyanannak vagy több sornak vagy oszlopnak kell lennie, mint a megadott y értékekkel rendelkező tartománynak. Más szóval, arányosnak kell lennie a független változókkal.
  • Egy ismert x értékkel rendelkező tömb több változót is tartalmazhat. Ha azonban csak egyről beszélünk, akkor szükséges, hogy az adott x és y értékkel rendelkező tartományok arányosak legyenek. Több változó esetén szükséges, hogy a megadott y értékekkel rendelkező tartomány egy oszlopba vagy egy sorban elférjen.

ELŐREJELZÉS funkció

Több funkció segítségével valósítható meg. Az egyik az úgynevezett "PREDICTION". Hasonló a TREND-hez, azaz a legkisebb négyzetek módszerével végzett számítások eredményét adja meg. Azonban csak egy X-re, amelyre Y értéke ismeretlen.

Most már ismeri azokat az Excel-képleteket, amelyek lehetővé teszik egy indikátor jövőbeli értékének előrejelzését egy lineáris trend szerint.

A legkisebb négyzetek matematikai eljárás egy olyan lineáris egyenlet megalkotására, amely a legjobban illeszkedik a rendezett párok halmazához úgy, hogy megkeresi a és b értékeket, az egyenes egyenlet együtthatóit. A legkisebb négyzetek módszerének célja az y és ŷ értékek közötti teljes négyzetes hiba minimalizálása. Ha minden pontra meghatározzuk az ŷ hibát, a legkisebb négyzetek módszere minimalizálja:

ahol n = a sor körüli rendezett párok száma. az adatok szempontjából leginkább releváns.

Ezt a koncepciót az ábra szemlélteti

Az ábrából ítélve az adatokhoz legjobban illeszkedő egyenes, a regressziós egyenes minimalizálja a grafikon négy pontjának össznégyzetes hibáját. A következő példában megmutatom, hogyan határozható meg ez a legkisebb négyzetek módszerével.

Képzeljen el egy fiatal párt, akik nemrégiben élnek együtt, és egy fürdőszobai mosdóasztalon osztoznak. A fiatalember kezdte észrevenni, hogy asztalának fele menthetetlenül zsugorodik, és teret veszít a hajhaboktól és a szójakomplexektől. Az elmúlt néhány hónapban a srác szorosan figyelemmel kísérte, hogy milyen ütemben növekszik az asztalon lévő tételek száma. Az alábbi táblázat azt mutatja, hogy a lány hány darabja van a fürdőszoba asztalán, amelyek az elmúlt hónapok során felhalmozódtak.

Mivel célunk annak kiderítése, hogy a tételek száma nő-e az idő múlásával, ezért a "Hónap" lesz a független változó, a "Tételek száma" pedig a függő változó.

A legkisebb négyzetek módszerével meghatározzuk az adatokhoz legjobban illeszkedő egyenletet az a, az y tengelyen lévő szakasz és a b, az egyenes meredekségének értékeinek kiszámításával:

a = y cf - bx vö

ahol x cf a független változó x középértéke, y cf az y, a független változó átlagértéke.

Az alábbi táblázat összefoglalja az ezen egyenletekhez szükséges számításokat.

A fürdőkád példánk hatásgörbéjét a következő egyenlet adja meg:

Mivel az egyenletünk pozitív meredeksége 0,976, a srácnak bizonyítéka van arra, hogy az asztalon lévő tárgyak száma idővel átlagosan havi 1 tétellel növekszik. A grafikon a hatásgörbét mutatja rendezett párokkal.

A következő fél év (16. hónap) várható tételszámát a következőképpen számítjuk ki:

ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 elem

Tehát itt az ideje, hogy hősünk tegyen valamit.

TREND függvény Excelben

Amint azt már sejtette, az Excelnek van egy függvénye az érték kiszámításához legkisebb négyzetek módszere. Ezt a funkciót TREND-nek hívják. A szintaxisa a következő:

TREND (ismert Y értékek; ismert X értékek; új X értékek; állandó)

Y ismert értékei - függő változók tömbje, esetünkben a táblázat elemeinek száma

X ismert értékei - független változók tömbje, esetünkben ez egy hónap

új X értékek – új X (hónap) értékek, amelyekre TREND funkció a függő változók várható értékét adja vissza (elemek száma)

const - nem kötelező. Logikai érték, amely megadja, hogy a b konstansnak 0-nak kell lennie.

Például az ábrán látható a TREND függvény, amellyel meghatározható a fürdőszoba asztalán a 16. hónapban várható darabszám.

KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2022 "kingad.ru" - az emberi szervek ultrahangvizsgálata