Analiza e të dhënave duke përdorur metodën e katrorëve më të vegjël. Sheshet më të vogla në Excel

Metoda me katrorin më të vogël

Në mësimin e fundit të temës, do të njihemi me aplikacionin më të famshëm FNP, i cili gjen aplikimin më të gjerë në fusha të ndryshme të shkencës dhe praktikës. Mund të jetë fizika, kimia, biologjia, ekonomia, sociologjia, psikologjia e kështu me radhë e kështu me radhë. Me vullnetin e fatit, shpesh më duhet të merrem me ekonominë, dhe për këtë arsye sot do të organizoj për ju një biletë për në një vend të mahnitshëm të quajtur Ekonometria=) … Si nuk e doni këtë?! Është shumë mirë atje - ju vetëm duhet të vendosni! …Por ajo që me siguri dëshironi patjetër është të mësoni se si t'i zgjidhni problemet katrorët më të vegjël. Dhe veçanërisht lexuesit e zellshëm do të mësojnë t'i zgjidhin ato jo vetëm me saktësi, por edhe SHUMË SHPEJTË ;-) Por së pari deklaratë e përgjithshme e problemit+ shembull i lidhur:

Le të studiohen treguesit në disa fusha lëndore që kanë një shprehje sasiore. Në të njëjtën kohë, ka çdo arsye për të besuar se treguesi varet nga treguesi. Ky supozim mund të jetë edhe një hipotezë shkencore dhe e bazuar në sensin elementar të përbashkët. Megjithatë, le ta lëmë mënjanë shkencën dhe të eksplorojmë zona më të shijshme - domethënë, dyqanet ushqimore. Shëno me:

– hapësira me pakicë e një dyqani ushqimor, m2,
- qarkullimi vjetor i një dyqani ushqimor, milion rubla.

Është mjaft e qartë se sa më e madhe të jetë sipërfaqja e dyqanit, aq më i madh është qarkullimi i tij në shumicën e rasteve.

Supozoni se pas kryerjes së vëzhgimeve / eksperimenteve / llogaritjeve / vallëzimit me një dajre, ne kemi në dispozicion të dhëna numerike:

Me dyqanet ushqimore, mendoj se gjithçka është e qartë: - kjo është zona e dyqanit të parë, - qarkullimi vjetor i tij, - zona e dyqanit të dytë, - xhiroja vjetore e tij, etj. Nga rruga, nuk është aspak e nevojshme të kesh akses në materialet e klasifikuara - një vlerësim mjaft i saktë i qarkullimit mund të merret duke përdorur statistika matematikore. Sidoqoftë, mos u hutoni, kursi i spiunazhit tregtar tashmë është paguar =)

Të dhënat tabelare gjithashtu mund të shkruhen në formën e pikave dhe të përshkruhen në mënyrën e zakonshme për ne. Sistemi kartezian .

Le t'i përgjigjemi një pyetjeje të rëndësishme: sa pikë nevojiten për një studim cilësor?

Sa më i madh, aq më mirë. Seti minimal i pranueshëm përbëhet nga 5-6 pikë. Përveç kësaj, me një sasi të vogël të dhënash, rezultatet "jonormale" nuk duhet të përfshihen në mostër. Kështu, për shembull, një dyqan i vogël elitar mund të ndihmojë më shumë se "kolegët e tyre", duke shtrembëruar modelin e përgjithshëm që duhet gjetur!



Nëse është mjaft e thjeshtë, duhet të zgjedhim një funksion, orarin i cili kalon sa më afër pikave . Një funksion i tillë quhet të përafërt (përafrim - përafrim) ose funksioni teorik . Në përgjithësi, këtu shfaqet menjëherë një "pretendues" i dukshëm - një polinom i shkallës së lartë, grafiku i të cilit kalon nëpër TË GJITHA pikat. Por ky opsion është i ndërlikuar dhe shpesh thjesht i pasaktë. (sepse grafiku do të "erë" gjatë gjithë kohës dhe do të pasqyrojë dobët tendencën kryesore).

Kështu, funksioni i dëshiruar duhet të jetë mjaft i thjeshtë dhe në të njëjtën kohë të pasqyrojë varësinë në mënyrë adekuate. Siç mund ta merrni me mend, quhet një nga metodat për gjetjen e funksioneve të tilla katrorët më të vegjël. Së pari, le të analizojmë thelbin e tij në një mënyrë të përgjithshme. Lëreni disa funksione të përafrojnë të dhënat eksperimentale:


Si të vlerësohet saktësia e këtij përafrimi? Le të llogarisim edhe diferencat (devijimet) midis vlerave eksperimentale dhe funksionale (ne studiojmë vizatimin). Mendimi i parë që vjen në mendje është të vlerësojmë se sa e madhe është shuma, por problemi është se diferencat mund të jenë negative. (Për shembull, ) dhe devijimet si rezultat i një përmbledhjeje të tillë do të anulojnë njëra-tjetrën. Prandaj, si një vlerësim i saktësisë së përafrimit, ai sugjeron veten të marrë shumën modulet devijimet:

ose në formë të palosur: (për ata që nuk e dinë: është ikona e shumës, dhe - variabli ndihmës - "counter", i cili merr vlera nga 1 në ) .

Duke përafruar pikat eksperimentale me funksione të ndryshme, do të marrim vlera të ndryshme, dhe është e qartë se ku është më pak kjo shumë - ai funksion është më i saktë.

Një metodë e tillë ekziston dhe quhet metoda e modulit më të vogël. Megjithatë, në praktikë është bërë shumë më e përhapur. metoda me katrorin më të vogël, në të cilën vlerat e mundshme negative eliminohen jo nga moduli, por duke kuadruar devijimet:



, pas së cilës përpjekjet drejtohen në përzgjedhjen e një funksioni të tillë që shuma e devijimeve në katror ishte sa më i vogël. Në fakt, kështu emri i metodës.

Dhe tani kthehemi në një pikë tjetër të rëndësishme: siç u përmend më lart, funksioni i zgjedhur duhet të jetë mjaft i thjeshtë - por ka edhe shumë funksione të tilla: lineare , hiperbolike , eksponenciale , logaritmike , kuadratike etj. Dhe, natyrisht, këtu do të doja menjëherë të "zvogëloja fushën e veprimtarisë". Çfarë klase funksionesh të zgjidhni për kërkime? Teknika primitive por efektive:

- Mënyra më e lehtë për të tërhequr pikë në vizatim dhe analizoni vendndodhjen e tyre. Nëse ato priren të jenë në një vijë të drejtë, atëherë duhet të kërkoni ekuacioni drejtvizor me vlera optimale dhe . Me fjalë të tjera, detyra është të gjesh koeficientë të tillë - në mënyrë që shuma e devijimeve në katror të jetë më e vogla.

Nëse pikat janë të vendosura, për shembull, përgjatë hiperbolë, atëherë është e qartë se funksioni linear do të japë një përafrim të dobët. Në këtë rast, ne jemi duke kërkuar për koeficientët më "të favorshëm" për ekuacionin e hiperbolës - ata që japin shumën minimale të katrorëve .

Tani vini re se në të dyja rastet po flasim funksionet e dy variablave, argumentet e të cilit janë opsionet e kërkimit të varësisë:

Dhe në thelb, ne duhet të zgjidhim një problem standard - të gjejmë minimumi i një funksioni prej dy ndryshoresh.

Kujtoni shembullin tonë: supozoni se pikat "dyqani" priren të vendosen në një vijë të drejtë dhe ka çdo arsye për të besuar praninë varësia lineare qarkullim nga zona e tregtimit. Le të gjejmë koeficientë të tillë "a" dhe "be" në mënyrë që shuma e devijimeve në katror ishte më i vogli. Gjithçka si zakonisht - së pari derivatet e pjesshme të rendit të parë. Sipas rregulli i linearitetit ju mund të dalloni pikërisht nën ikonën e shumës:

Nëse dëshironi të përdorni këtë informacion për një ese ose një punim afatshkurtër, do të jem shumë mirënjohës për lidhjen në listën e burimeve, nuk do të gjeni askund llogaritjet e tilla të detajuara:

Le të bëjmë një sistem standard:

Ne zvogëlojmë çdo ekuacion me një "dy" dhe, përveç kësaj, "ndajmë" shumat:

shënim : analizoni në mënyrë të pavarur pse "a" dhe "be" mund të hiqen nga ikona e shumës. Nga rruga, zyrtarisht kjo mund të bëhet me shumën

Le ta rishkruajmë sistemin në një formë "të aplikuar":

pas së cilës fillon të vizatohet algoritmi për zgjidhjen e problemit tonë:

A i dimë koordinatat e pikave? E dimë. Shumat mund te gjejme? Lehtësisht. Ne kompozojmë më të thjeshtën sistemi i dy ekuacioneve lineare me dy të panjohura("a" dhe "beh"). Ne e zgjidhim sistemin, për shembull, Metoda e Cramer-it, duke rezultuar në një pikë të palëvizshme . Duke kontrolluar kusht i mjaftueshëm për një ekstrem, mund të verifikojmë se në këtë pikë funksioni arrin saktësisht minimale. Verifikimi shoqërohet me përllogaritje shtesë dhe për këtë arsye do ta lëmë në prapaskenë. (nëse është e nevojshme, korniza që mungon mund të shihetKëtu ) . Ne nxjerrim përfundimin përfundimtar:

Funksioni menyra me e mire (të paktën krahasuar me çdo funksion tjetër linear) afron pikat eksperimentale . Përafërsisht, grafiku i tij kalon sa më afër këtyre pikave. Në traditë ekonometria quhet edhe funksioni i përafërt që rezulton ekuacioni i regresionit linear të çiftëzuar .

Problemi në shqyrtim ka një rëndësi të madhe praktike. Në situatën me shembullin tonë, ekuacioni ju lejon të parashikoni se çfarë lloj qarkullimi ("yig") do të jetë në dyqan me një ose një tjetër vlerë të zonës së shitjes (një ose një kuptim tjetër i "x"). Po, parashikimi që rezulton do të jetë vetëm një parashikim, por në shumë raste do të dalë mjaft i saktë.

Unë do të analizoj vetëm një problem me numrat "realë", pasi nuk ka vështirësi në të - të gjitha llogaritjet janë në nivelin e kurrikulës shkollore në klasat 7-8. Në 95 për qind të rasteve, do t'ju kërkohet të gjeni vetëm një funksion linear, por në fund të artikullit do të tregoj se nuk është më e vështirë të gjesh ekuacionet për hiperbolën optimale, eksponentin dhe disa funksione të tjera.

Në fakt, mbetet të shpërndani të mirat e premtuara - në mënyrë që të mësoni se si t'i zgjidhni shembuj të tillë jo vetëm me saktësi, por edhe shpejt. Ne studiojmë me kujdes standardin:

Detyrë

Si rezultat i studimit të marrëdhënies midis dy treguesve, u morën çiftet e mëposhtme të numrave:

Duke përdorur metodën e katrorëve më të vegjël, gjeni funksionin linear që përafron më mirë atë empirik (me eksperience) të dhëna. Bëni një vizatim mbi të cilin, në një sistem koordinativ drejtkëndor kartezian, vizatoni pika eksperimentale dhe një grafik të funksionit të përafërt . Gjeni shumën e devijimeve në katror ndërmjet vlerave empirike dhe teorike. Zbuloni nëse funksioni është më i mirë (për sa i përket metodës së katrorëve më të vegjël) pikat e përafërta eksperimentale.

Vini re se vlerat "x" janë vlera natyrore, dhe kjo ka një kuptim karakteristik kuptimplotë, për të cilin do të flas pak më vonë; por ato, natyrisht, mund të jenë të pjesshme. Për më tepër, në varësi të përmbajtjes së një detyre të veçantë, të dyja vlerat "X" dhe "G" mund të jenë plotësisht ose pjesërisht negative. Epo, na është dhënë një detyrë "pa fytyrë" dhe ne e fillojmë atë zgjidhje:

Ne gjejmë koeficientët e funksionit optimal si zgjidhje për sistemin:

Për qëllime të një shënimi më kompakt, ndryshorja "kundër" mund të hiqet, pasi tashmë është e qartë se përmbledhja kryhet nga 1 në .

Është më i përshtatshëm për të llogaritur shumat e kërkuara në një formë tabelare:


Llogaritjet mund të kryhen në një mikrollogaritës, por është shumë më mirë të përdorni Excel - më shpejt dhe pa gabime; shikoni një video të shkurtër:

Kështu, marrim sa vijon sistemi:

Këtu mund të shumëzoni ekuacionin e dytë me 3 dhe Zbrisni të 2-tin nga ekuacioni i 1-rë termi me term. Por ky është fat - në praktikë, sistemet shpesh nuk janë të talentuara dhe në raste të tilla kursen Metoda e Cramer-it:
, kështu që sistemi ka një zgjidhje unike.

Le të bëjmë një kontroll. Unë e kuptoj që nuk dua, por pse të anashkaloni gabimet ku nuk mund t'i humbisni absolutisht? Zëvendësoni zgjidhjen e gjetur në anën e majtë të secilit ekuacion të sistemit:

Përftohen pjesët e duhura të ekuacioneve përkatëse, që do të thotë se sistemi është zgjidhur saktë.

Kështu, funksioni i dëshiruar përafrues: – nga të gjitha funksionet lineare të dhënat eksperimentale përafrohen më së miri prej saj.

Ndryshe nga drejt varësia e xhiros së dyqanit nga zona e tij, varësia e gjetur është e kundërta (parimi "sa më shumë - aq më pak"), dhe ky fakt zbulohet menjëherë nga negativi koeficienti këndor. Funksioni na informon se me një rritje të një treguesi të caktuar me 1 njësi, vlera e treguesit të varur zvogëlohet mesatare me 0.65 njësi. Siç thonë ata, sa më i lartë të jetë çmimi i hikërrorit, aq më pak shitet.

Për të vizatuar funksionin e përafërt, gjejmë dy nga vlerat e tij:

dhe ekzekutoni vizatimin:

Linja e ndërtuar quhet linjë trendi (domethënë, një linjë trendi lineare, d.m.th. në rastin e përgjithshëm, një trend nuk është domosdoshmërisht një vijë e drejtë). Të gjithë e njohin shprehjen “të jesh në trend”, dhe mendoj se ky term nuk ka nevojë për komente shtesë.

Llogaritni shumën e devijimeve në katror midis vlerave empirike dhe teorike. Gjeometrikisht, kjo është shuma e katrorëve të gjatësive të segmenteve "të kuq". (dy prej të cilave janë aq të vogla sa nuk mund t'i shihni).

Le të përmbledhim llogaritjet në një tabelë:


Ato përsëri mund të kryhen me dorë, vetëm në rast se do të jap një shembull për pikën 1:

por është shumë më efikase të bësh mënyrën e njohur tashmë:

Le të përsërisim: cili është kuptimi i rezultatit? Nga të gjitha funksionet lineare funksionin eksponenti është më i vogli, pra është përafrimi më i mirë në familjen e tij. Dhe këtu, meqë ra fjala, pyetja përfundimtare e problemit nuk është e rastësishme: po sikur funksioni eksponencial i propozuar t'i përafrojë më mirë pikat eksperimentale?

Le të gjejmë shumën përkatëse të devijimeve në katror - për t'i dalluar ato, do t'i caktoj me shkronjën "epsilon". Teknika është saktësisht e njëjtë:

Dhe përsëri për çdo llogaritje zjarri për pikën e parë:

Në Excel, ne përdorim funksionin standard EXP (Sintaksa mund të gjendet në Excel Help).

konkluzioni: , pra funksioni eksponencial i përafron pikat eksperimentale më keq se drejtëza .

Por këtu duhet theksuar se "më keq" është nuk do të thotë akoma, çfarë nuk shkon. Tani kam ndërtuar një grafik të këtij funksioni eksponencial - dhe ai gjithashtu kalon afër pikave - aq sa pa një studim analitik është e vështirë të thuhet se cili funksion është më i saktë.

Kjo e plotëson zgjidhjen dhe kthehem te çështja e vlerave natyrore të argumentit. Në studime të ndryshme, si rregull, ekonomike apo sociologjike, muajt, vitet apo intervale të tjera kohore të barabarta numërohen me “X” natyrale. Konsideroni, për shembull, problemin e mëposhtëm:

Kemi të dhënat e mëposhtme për xhiron me pakicë të dyqanit për gjashtëmujorin e parë të vitit:

Duke përdorur shtrirjen analitike me vijë të drejtë, gjeni vëllimin e shitjeve për korrikun.

Po, nuk ka problem: ne numërojmë muajt 1, 2, 3, 4, 5, 6 dhe përdorim algoritmin e zakonshëm, si rezultat i të cilit marrim një ekuacion - e vetmja gjë kur bëhet fjalë për kohën është zakonisht shkronja "te". " (megjithëse nuk është kritike). Ekuacioni që rezulton tregon se në gjysmën e parë të vitit, xhiroja është rritur mesatarisht me 27.74 NJM. në muaj. Merrni një parashikim për korrikun (muaji #7): e.u.

Dhe detyra të ngjashme - errësira është e errët. Ata që dëshirojnë mund të përdorin një shërbim shtesë, përkatësisht timin Llogaritësi Excel (versioni demo), e cila zgjidh problemin pothuajse menjëherë! Versioni i punës i programit është i disponueshëm ne shkembim ose për pagesë simbolike.

Në fund të orës së mësimit, një informacion i shkurtër për gjetjen e varësive të disa llojeve të tjera. Në fakt, nuk ka asgjë të veçantë për të thënë, pasi qasja themelore dhe algoritmi i zgjidhjes mbeten të njëjta.

Le të supozojmë se vendndodhja e pikave eksperimentale i ngjan një hiperbole. Pastaj, për të gjetur koeficientët e hiperbolës më të mirë, duhet të gjeni minimumin e funksionit - ata që dëshirojnë mund të kryejnë llogaritjet e hollësishme dhe të vijnë në një sistem të ngjashëm:

Nga pikëpamja teknike formale, përftohet nga sistemi "linear". (le ta shënojmë me yll) duke zëvendësuar "x" me . Epo, shumat llogaritni, pas së cilës deri te koeficientët optimalë "a" dhe "be" në dorë.

Nëse ka çdo arsye për të besuar se pikat janë rregulluar përgjatë një kurbë logaritmike, më pas për të kërkuar vlerat optimale dhe për të gjetur minimumin e funksionit . Formalisht, në sistemin (*) duhet të zëvendësohet nga:

Kur llogaritni në Excel, përdorni funksionin LN. E pranoj se nuk do ta kem të vështirë të krijoj kalkulatorë për secilin prej rasteve në shqyrtim, por gjithsesi do të jetë më mirë nëse i “programoni” vetë llogaritjet. Video tutoriale për të ndihmuar.

Me varësinë eksponenciale, situata është pak më e ndërlikuar. Për ta reduktuar lëndën në rastin linear, marrim logaritmin e funksionit dhe përdorim vetitë e logaritmit:

Tani, duke krahasuar funksionin e marrë me funksionin linear, arrijmë në përfundimin se në sistemin (*) duhet të zëvendësohet me , dhe - me . Për lehtësi, ne shënojmë:

Ju lutemi vini re se sistemi zgjidhet në lidhje me dhe, dhe për këtë arsye, pasi të keni gjetur rrënjët, nuk duhet të harroni të gjeni vetë koeficientin.

Për të përafruar pikat eksperimentale parabola optimale , duhet gjetur minimumi i një funksioni prej tre variablash. Pas kryerjes së veprimeve standarde, marrim "punën" e mëposhtme sistemi:

Po, sigurisht, këtu ka më shumë shuma, por nuk ka aspak vështirësi kur përdorni aplikacionin tuaj të preferuar. Dhe së fundi, unë do t'ju tregoj se si të kontrolloni shpejt duke përdorur Excel dhe të ndërtoni linjën e dëshiruar të prirjes: krijoni një tabelë shpërndarjeje, zgjidhni ndonjë nga pikat me miun dhe kliko me të djathtën në opsionin e zgjedhjes "Shto linjë trendi". Më pas, zgjidhni llojin e grafikut dhe në skedën "Opsione" aktivizoni opsionin "Trego ekuacionin në tabelë". Ne rregull

Si gjithmonë, dua ta përfundoj artikullin me një frazë të bukur dhe pothuajse shkrova "Bëhu në trend!". Por me kalimin e kohës ai ndryshoi mendje. Dhe jo sepse është formula. Nuk e di si njeri, por nuk dua të ndjek fare trendin e promovuar amerikan dhe veçanërisht evropian =) Prandaj, uroj që secili prej jush të qëndrojë në linjën e tij!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metoda e katrorëve më të vegjël është një nga më të zakonshmet dhe më të zhvilluarat për shkak të saj thjeshtësia dhe efikasiteti i metodave për vlerësimin e parametrave të modeleve lineare ekonometrike. Në të njëjtën kohë, duhet të kihet kujdes gjatë përdorimit të tij, pasi modelet e ndërtuara duke e përdorur atë mund të mos plotësojnë një sërë kërkesash për cilësinë e parametrave të tyre dhe, si rezultat, jo "mirë" pasqyrojnë modelet e zhvillimit të procesit.

Le të shqyrtojmë më në detaje procedurën për vlerësimin e parametrave të një modeli ekonometrik linear duke përdorur metodën e katrorëve më të vegjël. Një model i tillë në formë të përgjithshme mund të përfaqësohet nga ekuacioni (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t .

Të dhënat fillestare kur vlerësohen parametrat a 0, a 1,..., a n është vektori i vlerave të ndryshores së varur y= (y 1 , y 2 , ... , y T)" dhe matricën e vlerave të variablave të pavarur

në të cilën kolona e parë, e përbërë nga një, korrespondon me koeficientin e modelit.

Metoda e katrorëve më të vegjël mori emrin e saj bazuar në parimin bazë që vlerësimet e parametrave të marra në bazë të saj duhet të plotësojnë: shuma e katrorëve të gabimit të modelit duhet të jetë minimale.

Shembuj të zgjidhjes së problemave me metodën e katrorëve më të vegjël

Shembulli 2.1. Ndërmarrja tregtare ka një rrjet të përbërë nga 12 dyqane, informacioni mbi aktivitetet e të cilave është paraqitur në tabelë. 2.1.

Menaxhmenti i kompanisë do të donte të dinte se si madhësia e xhiros vjetore varet nga hapësira e shitjes me pakicë të dyqanit.

Tabela 2.1

Numri i dyqanit Qarkullimi vjetor, milion rubla Zone tregtare mije m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Zgjidhja e katrorëve më të vegjël. Le të caktojmë - qarkullimin vjetor të dyqanit -të, milion rubla; - siperfaqja e shitjes se dyqanit mije m 2.

Fig.2.1. Scatterplot për shembullin 2.1

Të përcaktojë formën e marrëdhënies funksionale ndërmjet variablave dhe të ndërtojë një grafik shpërhapjeje (Fig. 2.1).

Bazuar në diagramin e shpërndarjes, mund të konkludojmë se qarkullimi vjetor është pozitivisht i varur nga zona e shitjes (d.m.th., y do të rritet me rritjen e ). Forma më e përshtatshme e lidhjes funksionale është lineare.

Informacioni për llogaritjet e mëtejshme është paraqitur në Tabelën. 2.2. Duke përdorur metodën e katrorëve më të vegjël, ne vlerësojmë parametrat e modelit linear ekonometrik me një faktor

Tabela 2.2

t y t x 1t y t 2 x1t2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Mesatare 68,29 0,89

Kështu,

Prandaj, me një rritje të zonës së tregtimit me 1 mijë m 2, duke qenë të barabarta gjërat e tjera, qarkullimi mesatar vjetor rritet me 67.8871 milion rubla.

Shembulli 2.2. Menaxhmenti i ndërmarrjes vuri re se qarkullimi vjetor varet jo vetëm nga zona e shitjes së dyqanit (shih shembullin 2.1), por edhe nga numri mesatar i vizitorëve. Informacioni përkatës është paraqitur në tabelë. 2.3.

Tabela 2.3

Zgjidhje. Shënoni - numrin mesatar të vizitorëve në dyqanin -të në ditë, mijëra njerëz.

Të përcaktojë formën e marrëdhënies funksionale ndërmjet variablave dhe të ndërtojë një grafik shpërhapjeje (Fig. 2.2).

Bazuar në diagramin e shpërndarjes, mund të konkludojmë se qarkullimi vjetor lidhet pozitivisht me numrin mesatar të vizitorëve në ditë (d.m.th., y do të rritet me rritjen e ). Forma e varësisë funksionale është lineare.

Oriz. 2.2. Scatterplot për shembull 2.2

Tabela 2.4

t x 2t x 2t 2 yt x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Mesatare 10,65

Në përgjithësi, është e nevojshme të përcaktohen parametrat e modelit ekonometrik me dy faktorë

y t \u003d a 0 + a 1 x 1t + a 2 x 2t + ε t

Informacioni i kërkuar për llogaritjet e mëtejshme është paraqitur në Tabelën. 2.4.

Le të vlerësojmë parametrat e një modeli ekonometrik linear me dy faktorë duke përdorur metodën e katrorëve më të vegjël.

Kështu,

Vlerësimi i koeficientit = 61.6583 tregon se, duke qenë të njëjtat gjëra të tjera, me një rritje të zonës së tregtimit me 1 mijë m 2, xhiroja vjetore do të rritet mesatarisht me 61.6583 milion rubla.

Vlerësimi i koeficientit = 2,2748 tregon se duke qenë të barabarta të tjerat, me një rritje të numrit mesatar të vizitorëve për 1 mijë persona. në ditë, qarkullimi vjetor do të rritet me një mesatare prej 2.2748 milion rubla.

Shembulli 2.3. Duke përdorur informacionin e paraqitur në tabelë. 2.2 dhe 2.4, vlerësoni parametrin e një modeli ekonometrik me një faktor

ku është vlera e përqendruar e qarkullimit vjetor të dyqanit -të, milion rubla; - vlera e përqendruar e numrit mesatar ditor të vizitorëve në dyqanin t-të, mijë persona. (shih shembujt 2.1-2.2).

Zgjidhje. Informacioni shtesë i kërkuar për llogaritjet është paraqitur në tabelë. 2.5.

Tabela 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Shuma 48,4344 431,0566

Duke përdorur formulën (2.35), marrim

Kështu,

http://www.cleverstudents.ru/articles/mnk.html

Shembull.

Të dhëna eksperimentale për vlerat e variablave X Dhe janë dhënë në tabelë.

Si rezultat i shtrirjes së tyre, funksioni

Duke përdorur metoda me katrorin më të vogël, përafroni këto të dhëna me një varësi lineare y=sëpatë+b(gjeni parametrat A Dhe b). Gjeni se cila nga dy rreshtat është më e mirë (në kuptimin e metodës së katrorëve më të vegjël) përafron të dhënat eksperimentale. Bëni një vizatim.

Zgjidhje.

Në shembullin tonë n=5. Plotësojmë tabelën për lehtësinë e llogaritjes së shumave që përfshihen në formulat e koeficientëve të kërkuar.

Vlerat në rreshtin e katërt të tabelës merren duke shumëzuar vlerat e rreshtit të dytë me vlerat e rreshtit të tretë për çdo numër i.

Vlerat në rreshtin e pestë të tabelës merren duke kuadruar vlerat e rreshtit të dytë për çdo numër i.

Vlerat e kolonës së fundit të tabelës janë shumat e vlerave nëpër rreshta.

Ne përdorim formulat e metodës së katrorëve më të vegjël për të gjetur koeficientët A Dhe b. Ne zëvendësojmë në to vlerat përkatëse nga kolona e fundit e tabelës:

Prandaj, y=0,165x+2,184është drejtëza e dëshiruar e përafërt.

Mbetet për të gjetur se cila nga rreshtat y=0,165x+2,184 ose përafron më mirë të dhënat origjinale, pra për të bërë një vlerësim duke përdorur metodën e katrorëve më të vegjël.

Dëshmi.

Kështu që kur të gjendet A Dhe b funksioni merr vlerën më të vogël, është e nevojshme që në këtë pikë matrica e formës kuadratike të diferencialit të rendit të dytë për funksionin. ishte pozitive definitive. Le ta tregojmë.

Diferenciali i rendit të dytë ka formën:

Kjo eshte

Prandaj, matrica e formës kuadratike ka formën

dhe vlerat e elementeve nuk varen nga A Dhe b.

Le të tregojmë se matrica është pozitive e përcaktuar. Kjo kërkon që këndi i të miturve të jetë pozitiv.

Minor këndor i rendit të parë . Pabarazia është e rreptë, që nga pikat

  • tutorial

Prezantimi

Unë jam një programues kompjuteri. Kam bërë hapin më të madh në karrierën time kur mësova të them: "Unë nuk e kuptoj asgjë!" Tani nuk më vjen turp t'i them korifeut të shkencës se po më mban një leksion, se nuk e kuptoj se për çfarë më flet ai, iluminari. Dhe është shumë e vështirë. Po, është e vështirë dhe e turpshme të pranosh që nuk e di. Kush i pëlqen të pranojë se ai nuk i di bazat e diçkaje - atje. Për shkak të profesionit tim, më duhet të ndjek një numër të madh prezantimesh dhe leksionesh, ku, rrëfej, në shumicën dërrmuese të rasteve më vjen gjumi, sepse nuk kuptoj asgjë. Dhe nuk e kuptoj sepse problemi i madh i situatës aktuale në shkencë qëndron te matematika. Ai supozon se të gjithë studentët janë të njohur me absolutisht të gjitha fushat e matematikës (gjë që është absurde). Të pranosh që nuk e di se çfarë është derivati ​​(që kjo është pak më vonë) është turp.

Por kam mësuar të them se nuk e di se çfarë është shumëzimi. Po, nuk e di se çfarë është një subalgjebër mbi një algjebër Lie. Po, nuk e di pse duhen ekuacionet kuadratike në jetë. Meqë ra fjala, nëse jeni të sigurt që e dini, atëherë kemi diçka për të folur! Matematika është një seri trukesh. Matematikanët përpiqen të ngatërrojnë dhe frikësojnë publikun; ku nuk ka konfuzion, nuk ka reputacion, nuk ka autoritet. Po, është prestigjioze të flasësh në gjuhën më abstrakte të mundshme, që në vetvete është absurditet i plotë.

A e dini se çfarë është një derivat? Me shumë mundësi do të më tregoni për kufirin e marrëdhënies së diferencës. Në vitin e parë të matematikës në Universitetin Shtetëror të Shën Petersburgut, Viktor Petrovich Khavin mua të përcaktuara derivati ​​si koeficienti i termit të parë të serisë Taylor të funksionit në pikë (ishte një gjimnastikë e veçantë për të përcaktuar serinë Taylor pa derivate). Kam qeshur me këtë përkufizim për një kohë të gjatë, derisa më në fund kuptova se për çfarë bëhej fjalë. Derivati ​​nuk është gjë tjetër veçse thjesht një masë se sa funksioni që po diferencojmë është i ngjashëm me funksionin y=x, y=x^2, y=x^3.

Tani kam nderin të ligjëroj studentë të cilët frikësuar matematikë. Nëse keni frikë nga matematika - ne jemi në rrugë. Sapo provoni të lexoni ndonjë tekst dhe ju duket se është tepër i ndërlikuar, atëherë dijeni se është shkruar keq. Unë argumentoj se nuk ka asnjë fushë të vetme të matematikës për të cilën nuk mund të flitet "në gishta" pa humbur saktësinë.

Sfida për të ardhmen e afërt: Unë i udhëzova studentët e mi të kuptojnë se çfarë është një kontrollues linear-kuadratik. Mos kini turp, humbisni tre minuta nga jeta juaj, ndiqni lidhjen. Nëse nuk kuptoni asgjë, atëherë ne jemi në rrugë. Unë (një matematikan-programues profesionist) gjithashtu nuk kuptova asgjë. Dhe ju siguroj, kjo mund të zgjidhet "në gishta". Për momentin nuk e di se çfarë është, por ju siguroj se do të jemi në gjendje ta kuptojmë.

Pra, leksioni i parë që do t'u jap studentëve të mi pasi të vijnë me vrap drejt meje të tmerruar me fjalët se kontrolluesi linear-kuadratik është një defekt i tmerrshëm që nuk do ta zotëroni kurrë në jetën tuaj është metodat e katrorëve më të vegjël. A mund të zgjidhni ekuacionet lineare? Nëse jeni duke e lexuar këtë tekst, atëherë ka shumë të ngjarë që jo.

Pra, duke pasur parasysh dy pika (x0, y0), (x1, y1), për shembull, (1,1) dhe (3,2), detyra është të gjejmë ekuacionin e një drejtëze që kalon nëpër këto dy pika:

ilustrim

Kjo vijë e drejtë duhet të ketë një ekuacion si më poshtë:

Këtu alfa dhe beta janë të panjohura për ne, por dy pika të kësaj linje janë të njohura:

Ju mund ta shkruani këtë ekuacion në formën e matricës:

Këtu duhet të bëjmë një digresion lirik: çfarë është një matricë? Një matricë nuk është gjë tjetër veçse një grup dy-dimensionale. Kjo është një mënyrë për të ruajtur të dhënat, nuk duhet t'i bashkëngjiten më vlera. Varet nga ne se si ta interpretojmë saktësisht një matricë të caktuar. Periodikisht, unë do ta interpretoj atë si një hartë lineare, periodikisht si një formë kuadratike dhe ndonjëherë thjesht si një grup vektorësh. E gjithë kjo do të sqarohet në kontekst.

Le të zëvendësojmë matricat specifike me paraqitjen e tyre simbolike:

Pastaj (alfa, beta) mund të gjendet lehtësisht:

Më konkretisht për të dhënat tona të mëparshme:

Që çon në ekuacionin vijues të një drejtëze që kalon nëpër pikat (1,1) dhe (3,2):

Mirë, gjithçka është e qartë këtu. Dhe le të gjejmë ekuacionin e një drejtëze që kalon tre pikat: (x0,y0), (x1,y1) dhe (x2,y2):

Oh-oh-oh, por ne kemi tre ekuacione për dy të panjohura! Matematikani standard do të thotë se nuk ka zgjidhje. Çfarë do të thotë programuesi? Dhe ai së pari do të rishkruajë sistemin e mëparshëm të ekuacioneve në formën e mëposhtme:

Në rastin tonë, vektorët i, j, b janë tre-dimensionale, prandaj, (në rastin e përgjithshëm) nuk ka zgjidhje për këtë sistem. Çdo vektor (alfa\*i + beta\*j) shtrihet në rrafshin e shtrirë nga vektorët (i, j). Nëse b nuk i përket këtij rrafshi, atëherë nuk ka zgjidhje (barazia në ekuacion nuk mund të arrihet). Çfarë duhet bërë? Le të kërkojmë një kompromis. Le të shënojmë me e(alfa, beta) si saktësisht nuk arritëm barazi:

Dhe ne do të përpiqemi të minimizojmë këtë gabim:

Pse një shesh?

Ne po kërkojmë jo vetëm minimumin e normës, por minimumin e katrorit të normës. Pse? Pika minimale në vetvete përkon, dhe katrori jep një funksion të qetë (një funksion kuadratik i argumenteve (alfa, beta)), ndërsa vetëm gjatësia jep një funksion në formën e një koni, jo të diferencueshëm në pikën minimale. Brr. Sheshi është më i përshtatshëm.

Natyrisht, gabimi minimizohet kur vektori e ortogonal me rrafshin e shtrirë nga vektorët i Dhe j.

Ilustrim

Me fjalë të tjera: ne po kërkojmë një vijë të tillë që shuma e gjatësive në katror të distancave nga të gjitha pikat në këtë vijë të jetë minimale:

PËRDITËSIM: këtu kam një bllokim, distanca në vijë duhet të matet vertikalisht, jo projeksioni drejtshkrimor. Ky komentues ka te drejte.

Ilustrim

Me fjalë krejtësisht të ndryshme (me kujdes, të zyrtarizuar dobët, por duhet të jetë e qartë në gishta): marrim të gjitha linjat e mundshme midis të gjitha palëve të pikave dhe kërkojmë vijën mesatare midis të gjithave:

Ilustrim

Një shpjegim tjetër në gishta: ne bashkojmë një pranverë midis të gjitha pikave të të dhënave (këtu kemi tre) dhe vijës që kërkojmë, dhe vija e gjendjes së ekuilibrit është pikërisht ajo që kërkojmë.

Minimumi i formës kuadratike

Pra, duke pasur parasysh vektorin b dhe plani i shtrirë nga kolonat-vektorët e matricës A(në këtë rast (x0,x1,x2) dhe (1,1,1)), ne jemi duke kërkuar për një vektor e me një katror minimal të gjatësisë. Natyrisht, minimumi është i arritshëm vetëm për vektorin e, ortogonal me planin e shtrirë nga kolonat-vektorët e matricës A:

Me fjalë të tjera, ne jemi duke kërkuar për një vektor x=(alfa, beta) të tillë që:

Ju kujtoj se ky vektor x=(alfa, beta) është minimumi i funksionit kuadratik ||e(alfa, beta)||^2:

Këtu është e dobishme të mbani mend se matrica mund të interpretohet si dhe forma kuadratike, për shembull, matrica e identitetit ((1,0),(0,1)) mund të interpretohet si funksion i x^2 + y ^2:

formë kuadratike

E gjithë kjo gjimnastikë njihet si regresion linear.

Ekuacioni Laplace me kusht kufitar Dirichlet

Tani problemi më i thjeshtë real: ekziston një sipërfaqe e caktuar trekëndore, është e nevojshme ta lëmoni atë. Për shembull, le të ngarkojmë modelin tim të fytyrës:

Angazhimi origjinal është i disponueshëm. Për të minimizuar varësitë e jashtme, mora kodin e interpretuesit tim të softuerit, tashmë në Habré. Për të zgjidhur sistemin linear, unë përdor OpenNL, është një zgjidhës i shkëlqyeshëm, por është shumë i vështirë për t'u instaluar: duhet të kopjoni dy skedarë (.h + .c) në dosjen tuaj të projektit. I gjithë zbutja bëhet me kodin e mëposhtëm:

Për (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&fytyrë = fytyra[i]; për (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

Koordinatat X, Y dhe Z janë të ndashme, i lëmoj veçmas. Kjo do të thotë, unë zgjidh tre sisteme ekuacionesh lineare, secili me të njëjtin numër variablash si numri i kulmeve në modelin tim. N rreshtat e parë të matricës A kanë vetëm një 1 për rresht, dhe n rreshtat e parë të vektorit b kanë koordinata origjinale të modelit. Kjo do të thotë, unë lidhem ndërmjet pozicionit të kulmit të ri dhe pozicionit të kulmit të vjetër - të rejat nuk duhet të jenë shumë larg nga të vjetrat.

Të gjitha rreshtat e mëpasshëm të matricës A (faces.size()*3 = numri i skajeve të të gjithë trekëndëshave në rrjet) kanë një paraqitje prej 1 dhe një paraqitje prej -1, ndërsa vektori b ka zero komponentë përballë. Kjo do të thotë që unë vendos një sustë në çdo skaj të rrjetës sonë trekëndore: të gjitha skajet përpiqen të marrin të njëjtin kulm si pikat e tyre të fillimit dhe të përfundimit.

Edhe një herë: të gjitha kulmet janë variabla dhe nuk mund të devijojnë larg pozicionit të tyre origjinal, por në të njëjtën kohë përpiqen të bëhen të ngjashëm me njëri-tjetrin.

Këtu është rezultati:

Gjithçka do të ishte mirë, modeli është vërtet i lëmuar, por u largua nga skaji i tij origjinal. Le të ndryshojmë pak kodin:

Për (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

Në matricën tonë A, për kulmet që janë në buzë, nuk shtoj një rresht nga kategoria v_i = verts[i][d], por 1000*v_i = 1000*verts[i][d]. Çfarë ndryshon? Dhe kjo ndryshon formën tonë kuadratike të gabimit. Tani një devijim i vetëm nga lart në skaj do të kushtojë jo një njësi, si më parë, por 1000 * 1000 njësi. Kjo do të thotë, ne varëm një sustë më të fortë në kulmet ekstreme, zgjidhja preferon t'i shtrijë të tjerët më fort. Këtu është rezultati:

Le të dyfishojmë forcën e sustave midis kulmeve:
nlKoeficienti(fytyra[ j ], 2); nlKoeficienti(fytyra[(j+1)%3], -2);

Është logjike që sipërfaqja është bërë më e lëmuar:

Dhe tani edhe njëqind herë më e fortë:

Çfarë është kjo? Imagjinoni sikur kemi zhytur një unazë teli në ujë me sapun. Si rezultat, filmi i sapunit që rezulton do të përpiqet të ketë lakimin më të vogël sa të jetë e mundur, duke prekur të njëjtin kufi - unazën tonë teli. Kjo është pikërisht ajo që kemi marrë duke rregulluar kufirin dhe duke kërkuar një sipërfaqe të lëmuar brenda. Urime, sapo kemi zgjidhur ekuacionin Laplace me kushtet kufitare të Dirichlet-it. Tingëllon bukur? Por në fakt, duhet zgjidhur vetëm një sistem ekuacionesh lineare.

Ekuacioni Poisson

Le të kemi një tjetër emër të lezetshëm.

Le të themi se kam një imazh si ky:

Të gjithë janë të mirë, por nuk më pëlqen karrigia.

E preva foton në gjysmë:



Dhe unë do të zgjedh një karrige me duart e mia:

Pastaj do të tërhiq gjithçka që është e bardhë në maskë në anën e majtë të figurës dhe në të njëjtën kohë do të them në të gjithë figurën se ndryshimi midis dy pikselëve fqinjë duhet të jetë i barabartë me diferencën midis dy pikselëve fqinjë të figurës. imazhi i duhur:

Për (int i=0; i

Këtu është rezultati:

Kodi dhe fotografitë janë në dispozicion

Metoda e katrorëve më të vegjël (OLS, eng. Katrorë të zakonshëm më të vegjël, OLS)- një metodë matematikore e përdorur për zgjidhjen e problemeve të ndryshme, e bazuar në minimizimin e shumës së devijimeve në katror të disa funksioneve nga variablat e dëshiruar. Mund të përdoret për të "zgjidhur" sisteme ekuacionesh të mbipërcaktuara (kur numri i ekuacioneve tejkalon numrin e të panjohurave), për të gjetur një zgjidhje në rastin e sistemeve të zakonshme (jo të mbipërcaktuara) jolineare të ekuacioneve, për të përafruar vlerat e pikës. të një funksioni të caktuar. OLS është një nga metodat bazë të analizës së regresionit për vlerësimin e parametrave të panjohur të modeleve të regresionit nga të dhënat e mostrës.

YouTube enciklopedik

    1 / 5

    ✪ Metoda e katrorëve më të vegjël. Subjekti

    ✪ Mitin I.V. - Përpunimi i rezultateve të fizike. eksperiment - Metoda e katrorëve më të vegjël (Leksioni 4)

    ✪ Sheshet më të vogla, mësimi 1/2. Funksioni linear

    ✪ Ekonometria. Leksioni 5. Metoda e katrorëve më të vegjël

    ✪ Metoda e katrorëve më të vegjël. Përgjigjet

    Titra

Histori

Deri në fillim të shekullit XIX. shkencëtarët nuk kishin rregulla të caktuara për zgjidhjen e një sistemi ekuacionesh në të cilin numri i të panjohurave është më i vogël se numri i ekuacioneve; Deri në atë kohë përdoreshin metoda të veçanta, varësisht nga lloji i ekuacioneve dhe nga zgjuarsia e kalkulatorëve, dhe për këtë arsye kalkulatorë të ndryshëm, duke u nisur nga të njëjtat të dhëna vëzhguese, dolën në përfundime të ndryshme. Gauss (1795) vlerësohet me aplikimin e parë të metodës, dhe Lezhandre (1805) në mënyrë të pavarur e zbuloi dhe e publikoi atë me emrin e tij modern (fr. Method des moindres quarres) . Laplace e lidhi metodën me teorinë e probabiliteteve, dhe matematikani amerikan Adrain (1808) shqyrtoi aplikimet e saj probabilistike. Metoda është e përhapur dhe e përmirësuar nga kërkimet e mëtejshme nga Encke, Bessel, Hansen dhe të tjerë.

Thelbi i metodës së katrorëve më të vegjël

Le x (\displaystyle x)- komplet n (\displaystyle n) variablat e panjohur (parametrat), f i (x) (\displaystyle f_(i)(x)), , m > n (\displaystyle m>n)- grup funksionesh nga ky grup variablash. Problemi është të zgjedhësh vlera të tilla x (\displaystyle x) në mënyrë që vlerat e këtyre funksioneve të jenë sa më afër disa vlerave y i (\displaystyle y_(i)). Në thelb, ne po flasim për "zgjidhjen" e sistemit të mbipërcaktuar të ekuacioneve f i (x) = y i (\displaystyle f_(i)(x)=y_(i)), i = 1 , … , m (\style display i=1,\ldpiks ,m) në kuptimin e treguar, afërsia maksimale e pjesëve të majta dhe të djathta të sistemit. Thelbi i LSM është të zgjedhë si "masë të afërsisë" shumën e devijimeve në katror të pjesëve të majta dhe të djathta. | f i (x) − y i | (\displaystyle |f_(i)(x)-y_(i)|). Kështu, thelbi i LSM mund të shprehet si më poshtë:

∑ i e i 2 = ∑ i (y i − f i (x)) 2 → min x (\displaystyle \sum _(i)e_(i)^(2)=\shuma _(i)(y_(i)-f_( i)(x))^(2)\shigjeta djathtas \min _(x)).

Nëse sistemi i ekuacioneve ka një zgjidhje, atëherë minimumi i shumës së katrorëve do të jetë i barabartë me zero dhe zgjidhjet e sakta të sistemit të ekuacioneve mund të gjenden në mënyrë analitike ose, për shembull, me metoda të ndryshme të optimizimit numerik. Nëse sistemi është i mbipërcaktuar, domethënë, nëse flasim lirshëm, numri i ekuacioneve të pavarura është më i madh se numri i ndryshoreve të panjohura, atëherë sistemi nuk ka një zgjidhje të saktë dhe metoda e katrorëve më të vegjël na lejon të gjejmë një vektor "optimal". x (\displaystyle x) në kuptimin e afërsisë maksimale të vektorëve y (\displaystyle y) Dhe f (x) (\displaystyle f(x)) ose afërsia maksimale e vektorit të devijimit e (\displaystyle e) në zero (afërsia kuptohet në kuptimin e distancës Euklidiane).

Shembull - sistemi i ekuacioneve lineare

Në veçanti, metoda e katrorëve më të vegjël mund të përdoret për të "zgjidhur" sistemin e ekuacioneve lineare

A x = b (\displaystyle Ax=b),

Ku A (\displaystyle A) matricë me madhësi drejtkëndore m × n , m > n (\shfaqja m\herë n,m>n)(d.m.th. numri i rreshtave të matricës A është më i madh se numri i variablave të kërkuar).

Një sistem i tillë ekuacionesh në përgjithësi nuk ka zgjidhje. Prandaj, ky sistem mund të "zgjidhet" vetëm në kuptimin e zgjedhjes së një vektori të tillë x (\displaystyle x) për të minimizuar "distancën" ndërmjet vektorëve A x (\displaystyle Axe) Dhe b (\displaystyle b). Për ta bërë këtë, mund të aplikoni kriterin për minimizimin e shumës së diferencave në katror të pjesëve të majta dhe të djathta të ekuacioneve të sistemit, d.m.th. (A x − b) T (A x − b) → min (\style ekrani (Ax-b)^(T)(Ax-b)\shigjeta djathtas \min ). Është e lehtë të tregohet se zgjidhja e këtij problemi të minimizimit çon në zgjidhjen e sistemit të mëposhtëm të ekuacioneve

A T A x = A T b ⇒ x = (A T A) − 1 A T b (\displaystyle A^(T)Ax=A^(T)b\Djathtas shigjeta x=(A^(T)A)^(-1)A^ (T)b).

OLS në analizën e regresionit (përafrimi i të dhënave)

Le të ketë n (\displaystyle n) vlerat e disa ndryshoreve y (\displaystyle y)(kjo mund të jetë rezultat i vëzhgimeve, eksperimenteve, etj.) dhe variablave përkatës x (\displaystyle x). Sfida është krijimi i marrëdhënieve ndërmjet y (\displaystyle y) Dhe x (\displaystyle x) i përafërt nga ndonjë funksion i njohur deri në disa parametra të panjohur b (\displaystyle b), domethënë, gjeni në të vërtetë vlerat më të mira të parametrave b (\displaystyle b), duke përafruar maksimalisht vlerat f (x , b) (\displaystyle f(x,b)) ndaj vlerave aktuale y (\displaystyle y). Në fakt, kjo reduktohet në rastin e "zgjidhjes" së një sistemi të mbipërcaktuar ekuacionesh në lidhje me b (\displaystyle b):

F (x t , b) = y t , t = 1 , ... , n (\shfaqja e stilit f(x_(t),b)=y_(t),t=1,\ldpika ,n).

Në analizën e regresionit, dhe në veçanti në ekonometri, përdoren modele probabiliste të marrëdhënies ndërmjet variablave.

Y t = f (x t, b) + ε t (\stil ekrani y_(t)=f(x_(t),b)+\varepsilon _(t)),

Ku ε t (\displaystyle \varepsilon _(t))- kështu quhet gabime të rastësishme modele.

Prandaj, devijimet e vlerave të vëzhguara y (\displaystyle y) nga modeli f (x , b) (\displaystyle f(x,b)) supozuar tashmë në vetë modelin. Thelbi i LSM (i zakonshëm, klasik) është gjetja e parametrave të tillë b (\displaystyle b), në të cilën shuma e devijimeve në katror (gabimet, për modelet e regresionit ato shpesh quhen mbetje regresioni) e t (\displaystyle e_(t)) do të jetë minimale:

b ^ O L S = arg ⁡ min b R S S (b) (\shfaqja e stilit (\kapelë (b))_(OLS)=\arg \min _(b)RSS(b)),

Ku R S S (\displaystyle RSS)- Anglisht. Shuma e mbetur e katrorëve përcaktohet si:

R S S (b) = e T e = ∑ t = 1 n e t 2 = ∑ t = 1 n (y t − f (x t , b)) 2 (\displaystyle RSS(b)=e^(T)e=\sum _ (t=1)^(n)e_(t)^(2)=\shuma _(t=1)^(n)(y_(t)-f(x_(t),b))^(2) ).

Në rastin e përgjithshëm, ky problem mund të zgjidhet me metoda numerike të optimizimit (minimizimit). Në këtë rast, flitet për katrorët më të vegjël jolinearë(NLS ose NLLS - eng. katrorët më të vegjël jo-linearë). Në shumë raste, mund të merret një zgjidhje analitike. Për të zgjidhur problemin e minimizimit, është e nevojshme të gjenden pikat stacionare të funksionit R S S (b) (\displaystyle RSS(b)), duke e diferencuar në lidhje me parametrat e panjohur b (\displaystyle b), duke barazuar derivatet me zero dhe duke zgjidhur sistemin rezultues të ekuacioneve:

∑ t = 1 n (y t − f (x t , b)) ∂ f (x t , b) ∂ b = 0 (\displaystyle \sum _(t=1)^(n)(y_(t)-f(x_ (t),b))(\frac (\i pjesshëm f(x_(t),b))(\i pjesshëm b))=0).

LSM në rastin e regresionit linear

Le të jetë lineare varësia e regresionit:

y t = ∑ j = 1 k b j x t j + ε = x t T b + ε t (\displaystyle y_(t)=\sum _(j=1)^(k)b_(j)x_(tj)+\varepsilon =x_( t)^(T)b+\varepsilon _(t)).

Le yështë vektori i kolonës së vëzhgimeve të ndryshores që shpjegohet, dhe X (\displaystyle X)- Kjo (n × k) (\style ekrani ((n\herë k)))- matrica e vëzhgimeve të faktorëve (rreshtat e matricës - vektorët e vlerave të faktorëve në një vëzhgim të caktuar, sipas kolonave - vektori i vlerave të një faktori të caktuar në të gjitha vëzhgimet). Paraqitja matricore e modelit linear ka formën:

y = Xb + ε (\displaystyle y=Xb+\varepsilon ).

Atëherë vektori i vlerësimeve të variablit të shpjeguar dhe vektori i mbetjeve të regresionit do të jetë i barabartë me

y ^ = X b , e = y − y ^ = y − X b (\displaystyle (\hat (y))=Xb,\quad e=y-(\hat (y))=y-Xb).

në përputhje me rrethanat, shuma e katrorëve të mbetjeve të regresionit do të jetë e barabartë me

R S S = e T e = (y − X b) T (y − X b) (\displaystyle RSS=e^(T)e=(y-Xb)^(T)(y-Xb)).

Diferencimi i këtij funksioni në lidhje me vektorin e parametrave b (\displaystyle b) dhe duke barazuar derivatet me zero, marrim një sistem ekuacionesh (në formë matrice):

(X T X) b = X T y (\style ekrani (X^(T)X)b=X^(T)y).

Në formën e matricës së deshifruar, ky sistem ekuacionesh duket si ky:

(∑ x t 1 2 ∑ x t 1 x t 2 ∑ x t 1 x t 3 … ∑ x t 1 x t k ∑ x t 2 x t 1 ∑ x t 2 2 ∑ x t 2 x t 3 … ∑ x t 2 x t k ∑ x 3 x ∑ t x t 3 2 … ∑ x t 3 x t k ⋮ ⋮ ⋮ ⋱ ⋮ ∑ x t k x t 1 ∑ x t k x t 2 ∑ x t k x t 3 … ∑ x t k 2) (b 1 b 2 b 3) (b 1 b 2 b 3) (⋮ b 3) ∑ x t 3 y t ⋮ ∑ x t k y t) , (\displaystyle (\fille(pmatrix)\sum x_(t1)^(2)&\sum x_(t1)x_(t2)&\sum x_(t1)x_(t3)&\ldots &\shuma x_(t1)x_(tk)\\\ shuma x_(t2)x_(t1)&\ shuma x_(t2)^(2)&\ shuma x_(t2)x_(t3)&\ldots &\ shuma x_(t2)x_(tk)\\\ shuma x_(t3)x_(t1)&\ shuma x_(t3) x_(t2)&\ shuma x_(t3)^(2)&\ldots &\ shuma x_ (t3)x_(tk)\\\vdots &\vdots &\vdots &\ddots &\vdots \\\ shuma x_(tk)x_(t1)&\ shuma x_(tk)x_(t2)&\ shuma x_ (tk)x_(t3)&\ldots &\sum x_(tk)^(2)\\\end(pmatrix))(\fille(pmatrix)b_(1)\\b_(2)\\b_(3 )\\\ vdots \\b_(k)\\\ fund (pmatrix))=(\fille(pmatrix)\sum x_(t1)y_(t)\\\ shuma x_(t2)y_(t)\\ \shuma x_(t3)y_(t)\\\vpika \\\ shuma x_(tk)y_(t)\\\fund (pmatrix)),) ku të gjitha shumat merren mbi të gjitha vlerat e pranueshme t (\displaystyle t).

Nëse një konstante përfshihet në model (si zakonisht), atëherë x t 1 = 1 (\displaystyle x_(t1)=1) per te gjithe t (\displaystyle t), pra, në këndin e sipërm të majtë të matricës së sistemit të ekuacioneve është numri i vëzhgimeve n (\displaystyle n), dhe në elementët e mbetur të rreshtit të parë dhe kolonës së parë - vetëm shuma e vlerave të variablave: ∑ x t j (\displaystyle \shuma x_(tj)) dhe elementi i parë i anës së djathtë të sistemit - ∑ y t (\displaystyle \shuma y_(t)).

Zgjidhja e këtij sistemi ekuacionesh jep formulën e përgjithshme për vlerësimet e katrorëve më të vegjël për modelin linear:

b ^ O L S = (X T X) − 1 X T y = (1 n X T X) − 1 1 n X T y = V x − 1 C x y (\kapelë (b))_(OLS)=(X^(T )X)^(-1)X^(T)y=\majtas((\frac (1)(n))X^(T)X\djathtas)^(-1)(\frac (1)(n )) X^(T)y=V_(x)^(-1)C_(xy)).

Për qëllime analitike, paraqitja e fundit e kësaj formule rezulton e dobishme (në sistemin e ekuacioneve kur ndahet me n, në vend të shumave shfaqen mesataret aritmetike). Nëse të dhënat në modelin e regresionit të përqendruar, atëherë në këtë paraqitje matrica e parë ka kuptimin e matricës së mostrës së kovariancës së faktorëve, dhe e dyta është vektori i kovariancave të faktorëve me variabël të varur. Nëse, përveç kësaj, të dhënat janë gjithashtu normalizuar në SKO (d.m.th., në fund të fundit të standardizuara), atëherë matrica e parë ka kuptimin e matricës së korrelacionit të mostrës së faktorëve, vektori i dytë - vektori i korrelacioneve të mostrës së faktorëve me variablin e varur.

Një veti e rëndësishme e vlerësimeve LLS për modelet me një konstante- vija e regresionit të ndërtuar kalon nëpër qendrën e gravitetit të të dhënave të mostrës, domethënë përmbushet barazia:

y ¯ = b 1 ^ + ∑ j = 2 k b ^ j x ¯ j (\displaystyle (\bar (y))=(\hat (b_(1)))+\sum _(j=2)^(k) (\kapelë (b))_(j)(\bar (x))_(j)).

Në veçanti, në rastin ekstrem kur regresori i vetëm është një konstante, gjejmë se vlerësimi OLS i një parametri të vetëm (vetë konstanta) është i barabartë me vlerën mesatare të ndryshores që shpjegohet. Kjo do të thotë, mesatarja aritmetike, e njohur për vetitë e saj të mira nga ligjet e numrave të mëdhenj, është gjithashtu një vlerësim i katrorëve më të vegjël - ai plotëson kriterin për shumën minimale të devijimeve në katror prej tij.

Rastet më të thjeshta të veçanta

Në rastin e regresionit linear në çift y t = a + b x t + ε t (\style ekrani y_(t)=a+bx_(t)+\varepsilon _(t)), kur vlerësohet varësia lineare e një ndryshoreje nga një tjetër, formulat e llogaritjes thjeshtohen (mund të bëni pa algjebër matricë). Sistemi i ekuacioneve ka formën:

(1 x ¯ x ¯ x 2 ¯) (a b) = (y ¯ x y ¯) (\displaystyle (\begin(pmatrix)1&(\bar (x))\\(\bar (x))&(\bar (x^(2))\\\end(pmatrix))(\fille(pmatrix)a\\b\\\end(pmatrix))=(\fille(pmatrix)(\bar (y))\\ (\overline(xy))\\\fund (pmatrix))).

Nga këtu është e lehtë të gjesh vlerësime për koeficientët:

(b ^ = Cov⁡ (x, y) Var ⁡ (x) = x y ¯ − x ¯ y ¯ x 2 ¯ − x ¯ 2, a ^ = y ¯ − b x ¯ . (\displaystyle (\fillimi(rastet) (\hat (b))=(\frac (\mathop (\textrm (Cov)) (x,y))(\mathop (\textrm (Var)) (x)))=(\frac ((\overline (xy))-(\bar (x))(\bar (y)))(\overline (x^(2)))-(\overline (x))^(2)),\\( \hat (a))=(\bar (y))-b(\bar (x)).\fund (raste)))

Pavarësisht se në rastin e përgjithshëm preferohen modelet me konstante, në disa raste dihet nga konsideratat teorike se konstantja a (\displaystyle a) duhet të jetë e barabartë me zero. Për shembull, në fizikë, marrëdhënia midis tensionit dhe rrymës ka formën U = I ⋅ R (\displaystyle U=I\cdot R); duke matur tensionin dhe rrymën, është e nevojshme të vlerësohet rezistenca. Në këtë rast, ne po flasim për një model y = b x (\displaystyle y=bx). Në këtë rast, në vend të një sistemi ekuacionesh, kemi një ekuacion të vetëm

(∑ x t 2) b = ∑ x t y t (\displaystyle \majtas(\shuma x_(t)^(2)\djathtas)b=\shuma x_(t)y_(t)).

Prandaj, formula për vlerësimin e një koeficienti të vetëm ka formën

B ^ = ∑ t = 1 n x t y t ∑ t = 1 n x t 2 = x y ¯ x 2 ¯ (\displaystyle (\hat (b))=(\frac (\sum _(t=1)^(n)x_(t )y_(t))(\shuma _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))).

Rasti i një modeli polinom

Nëse të dhënat përshtaten nga një funksion regresioni polinomial i një ndryshoreje f (x) = b 0 + ∑ i = 1 k b i x i (\displaystyle f(x)=b_(0)+\sum \ limitet _(i=1)^(k)b_(i)x^(i)), pastaj, perceptimi i shkallëve x i (\displaystyle x^(i)) si faktorë të pavarur për secilin i (\displaystyle i)është e mundur të vlerësohen parametrat e modelit bazuar në formulën e përgjithshme për vlerësimin e parametrave të modelit linear. Për ta bërë këtë, mjafton të merret parasysh në formulën e përgjithshme se me një interpretim të tillë x t i x t j = x t i x t j = x t i + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j)) Dhe x t j y t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). Prandaj, ekuacionet e matricës në këtë rast do të marrin formën:

(n ∑ n x t … ∑ n x t k ∑ n x t ∑ n x i 2 … ∑ m x i k + 1 ⋮ ⋮ ⋱ ⋮ ∑ n x t k ∑ n x t k + 1 … ∑ n x t k + 1 … ∑ n x t k + 1 … ∑ n x t k n y t ∑ n x t y t ⋮ ∑ n x t k y t ] . (\displaystyle (\begin(pmatrix)n&\sum \ limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\sum \ limits _( n)x_(t)&\sum \ limitet _(n)x_(i)^(2)&\ldots &\sum \ limitet _(m)x_(i)^(k+1)\\\vpika & \vdots &\ddots &\vdots \\\ shuma \ limitet _(n)x_(t)^(k)&\sum \ limitet _(n)x_(t)^(k+1)&\ldots &\ shuma \limits _(n)x_(t)^(2k)\end(pmatrix))(\fille(bmatrix)b_(0)\\b_(1)\\\vdots \\b_(k)\end( bmatrix))=(\begin(bmatrix)\sum \limits _(n)y_(t)\\\sum \limits _(n)x_(t)y_(t)\\\vdots \\\sum \limits _(n)x_(t)^(k)y_(t)\fund(bmatrix)).)

Vetitë statistikore të vlerësimeve të OLS

Para së gjithash, vërejmë se për modelet lineare, vlerësimet e katrorëve më të vegjël janë vlerësime lineare, siç vijon nga formula e mësipërme. Për paanshmërinë e vlerësimeve të katrorëve më të vegjël, është e nevojshme dhe e mjaftueshme të përmbushet kushti më i rëndësishëm i analizës së regresionit: pritshmëria matematikore e një gabimi të rastësishëm të kushtëzuar nga faktorët duhet të jetë e barabartë me zero. Ky kusht plotësohet, veçanërisht nëse

  1. pritshmëria matematikore e gabimeve të rastësishme është zero, dhe
  2. faktorët dhe gabimet e rastësishme janë vlera të pavarura-të rastësishme.

Kushti i dytë - gjendja e faktorëve ekzogjenë - është thelbësor. Nëse kjo pronë nuk është e kënaqur, atëherë mund të supozojmë se pothuajse çdo vlerësim do të jetë jashtëzakonisht i pakënaqshëm: ato as nuk do të jenë të qëndrueshme (d.m.th., edhe një sasi shumë e madhe e të dhënave nuk lejon marrjen e vlerësimeve cilësore në këtë rast). Në rastin klasik, bëhet një supozim më i fortë për determinizmin e faktorëve, në ndryshim nga një gabim i rastësishëm, që automatikisht do të thotë se kushti ekzogjen është i plotësuar. Në rastin e përgjithshëm, për konsistencën e vlerësimeve, mjafton të plotësohet kushti i ekzogjenitetit së bashku me konvergjencën e matricës V x (\displaystyle V_(x)) në një matricë jo të degjeneruar ndërsa madhësia e kampionit rritet deri në pafundësi.

Në mënyrë që, përveç konsistencës dhe paanshmërisë, vlerësimet e LSM (të zakonshme) të jenë gjithashtu efektive (më të mirat në klasën e vlerësimeve lineare të paanshme), është e nevojshme të plotësohen vetitë shtesë të një gabimi të rastësishëm:

Këto supozime mund të formulohen për matricën e kovariancës të vektorit të gabimeve të rastit V (ε) = σ 2 I (\displaystyle V(\varepsilon)=\sigma ^(2)I).

Një model linear që plotëson këto kushte quhet klasike. Vlerësuesit e katrorëve më të vegjël për regresionin linear klasik janë vlerësues të paanshëm, të qëndrueshëm dhe më efikas në klasën e të gjithë vlerësuesve linearë të paanshëm (shkurtesa blu (Vlerësuesi më i mirë linear i paanshëm) është vlerësimi më i mirë linear i paanshëm; në literaturën vendase, më shpesh citohet teorema e Gauss - Markov). Siç është e lehtë të tregohet, matrica e kovariancës së vektorit të vlerësimit të koeficientit do të jetë e barabartë me:

V (b ^ O L S) = σ 2 (X T X) − 1 (\displaystyle V((\hat (b))_(OLS))=\sigma ^(2)(X^(T)X)^(-1 )).

Efikasiteti do të thotë që kjo matricë e kovariancës është "minimale" (çdo kombinim linear i koeficientëve, dhe në veçanti vetë koeficientët, kanë një variancë minimale), domethënë, në klasën e vlerësimeve lineare të paanshme, vlerësimet OLS janë më të mirat. Elementet diagonale të kësaj matrice - variancat e vlerësimeve të koeficientëve - janë parametra të rëndësishëm të cilësisë së vlerësimeve të marra. Megjithatë, nuk është e mundur të llogaritet matrica e kovariancës sepse varianca e gabimit të rastësishëm është e panjohur. Mund të vërtetohet se vlerësimi i paanshëm dhe konsistent (për modelin linear klasik) i variancës së gabimeve të rastit është vlera:

S 2 = R S S / (n − k) (\stil ekrani s^(2)=RSS/(n-k)).

Duke e zëvendësuar këtë vlerë në formulën për matricën e kovariancës, marrim një vlerësim të matricës së kovariancës. Vlerësimet që rezultojnë janë gjithashtu të paanshme dhe të qëndrueshme. Është gjithashtu e rëndësishme që vlerësimi i variancës së gabimit (dhe rrjedhimisht variancat e koeficientëve) dhe vlerësimet e parametrave të modelit të jenë variabla të rastësishme të pavarura, gjë që bën të mundur marrjen e statistikave të testit për testimin e hipotezave në lidhje me koeficientët e modelit.

Duhet të theksohet se nëse supozimet klasike nuk plotësohen, vlerësimet e parametrave të katrorëve më të vegjël nuk janë më efikasët dhe ku W (\displaystyle W)është një matricë simetrike pozitive e caktuar e peshës. Katroret më të vegjël të zakonshëm janë një rast i veçantë i kësaj qasjeje, kur matrica e peshës është proporcionale me matricën e identitetit. Siç dihet, për matricat (ose operatorët) simetrike ka një dekompozim W = P T P (\shfaqje stil W=P^(T)P). Prandaj, ky funksion mund të përfaqësohet si më poshtë e T P T P e = (P e) T P e = e ∗ T e ∗ (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)), domethënë, ky funksional mund të përfaqësohet si shuma e katrorëve të disa "mbetjeve" të transformuara. Kështu, ne mund të dallojmë një klasë të metodave të katrorëve më të vegjël - metodat LS (Katroret më të vegjël).

Është vërtetuar (teorema e Aitken) se për një model të përgjithësuar të regresionit linear (në të cilin nuk vendosen kufizime në matricën e kovariancës së gabimeve të rastit), më efektive (në klasën e vlerësimeve lineare të paanshme) janë vlerësimet e të ashtuquajturave. OLS e përgjithësuar (OMNK, GLS - katrorët më të vegjël të përgjithësuar)- Metoda LS me një matricë peshe të barabartë me matricën e kovariancës së kundërt të gabimeve të rastit: W = V ε - 1 (\displaystyle W=V_(\varepsilon )^(-1)).

Mund të tregohet se formula për GLS-vlerësimet e parametrave të modelit linear ka formën

B ^ G L S = (X T V − 1 X) − 1 X T V − 1 y (\displaystyle (\hat (b))_(GLS)=(X^(T)V^(-1)X)^(-1) X^(T)V^(-1)y).

Matrica e kovariancës së këtyre vlerësimeve, përkatësisht, do të jetë e barabartë me

V (b ^ G L S) = (X T V − 1 X) − 1 (\displaystyle V((\hat (b))_(GLS))=(X^(T)V^(-1)X)^(- 1)).

Në fakt, thelbi i OLS qëndron në një transformim të caktuar (linear) (P) të të dhënave origjinale dhe aplikimin e katrorëve më të vegjël të zakonshëm në të dhënat e transformuara. Qëllimi i këtij transformimi është që për të dhënat e transformuara, gabimet e rastësishme tashmë plotësojnë supozimet klasike.

Sheshet më të vogla të peshuara

Në rastin e një matrice të peshës diagonale (dhe rrjedhimisht matricës së kovariancës së gabimeve të rastit), kemi të ashtuquajturat katrorët më të vegjël të ponderuar (WLS - Katroret më të vogla të ponderuara). Në këtë rast, shuma e ponderuar e katrorëve të mbetjeve të modelit minimizohet, domethënë, çdo vëzhgim merr një "peshë" që është në përpjesëtim të zhdrejtë me variancën e gabimit të rastësishëm në këtë vëzhgim: e T W e = ∑ t = 1 n e t 2 σ t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ sigma _(t)^(2)))). Në fakt, të dhënat transformohen duke peshuar vëzhgimet (duke pjesëtuar me një sasi proporcionale me devijimin standard të supozuar të gabimeve të rastit), dhe katrorët më të vegjël normalë aplikohen në të dhënat e ponderuara.

ISBN 978-5-7749-0473-0.

  • Ekonometria. Libër mësuesi / Ed. Eliseeva I. I. - botimi i 2-të. - M. : Financa dhe statistika, 2006. - 576 f. - ISBN 5-279-02786-3.
  • Alexandrova N.V. Historia e termave, koncepteve, emërtimeve matematikore: një fjalor-libër referimi. - Botimi 3 - M. : LKI, 2008. - 248 f. - ISBN 978-5-382-00839-4. I.V. Mitin, Rusakov V.S. Analiza dhe përpunimi i të dhënave eksperimentale - Botimi i 5-të - 24f.
  • Funksionin e përafrojmë me një polinom të shkallës së 2-të. Për ta bërë këtë, ne llogarisim koeficientët e sistemit normal të ekuacioneve:

    , ,

    Le të hartojmë një sistem normal të katrorëve më të vegjël, i cili ka formën:

    Zgjidhja e sistemit është e lehtë për t'u gjetur:, , .

    Kështu, polinomi i shkallës së 2-të gjendet: .

    Sfondi teorik

    Kthehu në faqe<Введение в вычислительную математику. Примеры>

    Shembulli 2. Gjetja e shkallës optimale të një polinomi.

    Kthehu në faqe<Введение в вычислительную математику. Примеры>

    Shembulli 3. Nxjerrja e një sistemi normal ekuacionesh për gjetjen e parametrave të një varësie empirike.

    Le të nxjerrim një sistem ekuacionesh për përcaktimin e koeficientëve dhe funksioneve , i cili kryen përafrimin rrënjë-mesatar-katror të funksionit të dhënë në lidhje me pikat. Hartoni një funksion dhe shkruani kushtin e nevojshëm ekstrem për të:

    Atëherë sistemi normal do të marrë formën:

    Ne kemi marrë një sistem linear ekuacionesh për parametra të panjohur dhe, i cili zgjidhet lehtësisht.

    Sfondi teorik

    Kthehu në faqe<Введение в вычислительную математику. Примеры>

    Shembull.

    Të dhëna eksperimentale për vlerat e variablave X Dhe janë dhënë në tabelë.

    Si rezultat i shtrirjes së tyre, funksioni

    Duke përdorur metoda me katrorin më të vogël, përafroni këto të dhëna me një varësi lineare y=sëpatë+b(gjeni parametrat A Dhe b). Gjeni se cila nga dy rreshtat është më e mirë (në kuptimin e metodës së katrorëve më të vegjël) përafron të dhënat eksperimentale. Bëni një vizatim.

    Thelbi i metodës së katrorëve më të vegjël (LSM).

    Problemi është gjetja e koeficientëve linearë të varësisë për të cilat funksioni i dy ndryshoreve A Dhe bmerr vlerën më të vogël. Kjo është, duke pasur parasysh të dhënat A Dhe b shuma e devijimeve në katror të të dhënave eksperimentale nga drejtëza e gjetur do të jetë më e vogla. Kjo është e gjithë pika e metodës së katrorëve më të vegjël.

    Kështu, zgjidhja e shembullit reduktohet në gjetjen e ekstremit të një funksioni të dy ndryshoreve.

    Nxjerrja e formulave për gjetjen e koeficientëve.

    Përpilohet dhe zgjidhet një sistem me dy ekuacione me dy të panjohura. Gjetja e derivateve të pjesshme të funksioneve sipas variablave A Dhe b, ne i barazojmë këto derivate me zero.

    Ne zgjidhim sistemin rezultues të ekuacioneve me çdo metodë (për shembull metoda e zëvendësimit ose metodën e Cramer-it) dhe merrni formulat për gjetjen e koeficientëve duke përdorur metodën e katrorëve më të vegjël (LSM).

    Me të dhëna A Dhe b funksionin merr vlerën më të vogël. Dëshmia e këtij fakti është dhënë më poshtë në tekstin në fund të faqes.

    Kjo është e gjithë metoda e katrorëve më të vegjël. Formula për gjetjen e parametrit a përmban shumat , , , dhe parametrin nështë sasia e të dhënave eksperimentale. Vlerat e këtyre shumave rekomandohet të llogariten veçmas.

    Koeficient b gjetur pas llogaritjes a.

    Është koha për të kujtuar shembullin origjinal.

    Zgjidhje.

    Në shembullin tonë n=5. Plotësojmë tabelën për lehtësinë e llogaritjes së shumave që përfshihen në formulat e koeficientëve të kërkuar.

    Vlerat në rreshtin e katërt të tabelës merren duke shumëzuar vlerat e rreshtit të dytë me vlerat e rreshtit të tretë për çdo numër i.

    Vlerat në rreshtin e pestë të tabelës merren duke kuadruar vlerat e rreshtit të dytë për çdo numër i.

    Vlerat e kolonës së fundit të tabelës janë shumat e vlerave nëpër rreshta.

    Ne përdorim formulat e metodës së katrorëve më të vegjël për të gjetur koeficientët A Dhe b. Ne zëvendësojmë në to vlerat përkatëse nga kolona e fundit e tabelës:

    Prandaj, y=0,165x+2,184është drejtëza e dëshiruar e përafërt.

    Mbetet për të gjetur se cila nga rreshtat y=0,165x+2,184 ose përafron më mirë të dhënat origjinale, pra për të bërë një vlerësim duke përdorur metodën e katrorëve më të vegjël.

    Vlerësimi i gabimit të metodës së katrorëve më të vegjël.

    Për ta bërë këtë, duhet të llogaritni shumat e devijimeve në katror të të dhënave origjinale nga këto rreshta Dhe , një vlerë më e vogël i korrespondon një rreshti që përafron më mirë të dhënat origjinale për sa i përket metodës së katrorëve më të vegjël.

    Që atëherë, linja y=0,165x+2,184 përafron më mirë të dhënat origjinale.

    Ilustrim grafik i metodës së katrorëve më të vegjël (LSM).

    Gjithçka duket e mrekullueshme në tabela. Vija e kuqe është vija e gjetur y=0,165x+2,184, vija blu është , pikat rozë janë të dhënat origjinale.

    Për çfarë është, për çfarë janë të gjitha këto përafrime?

    Unë personalisht përdor për të zgjidhur problemet e zbutjes së të dhënave, problemet e interpolimit dhe ekstrapolimit (në shembullin origjinal, mund t'ju kërkohet të gjeni vlerën e vlerës së vëzhguar yx=3 ose kur x=6 sipas metodës MNC). Por ne do të flasim më shumë për këtë më vonë në një seksion tjetër të faqes.

    Në krye të faqes

    Dëshmi.

    Kështu që kur të gjendet A Dhe b funksioni merr vlerën më të vogël, është e nevojshme që në këtë pikë matrica e formës kuadratike të diferencialit të rendit të dytë për funksionin. ishte pozitive definitive. Le ta tregojmë.

    Diferenciali i rendit të dytë ka formën:

    Kjo eshte

    Prandaj, matrica e formës kuadratike ka formën

    dhe vlerat e elementeve nuk varen nga A Dhe b.

    Le të tregojmë se matrica është pozitive e përcaktuar. Kjo kërkon që këndi i të miturve të jetë pozitiv.

    Minor këndor i rendit të parë . Pabarazia është e rreptë, pasi pikat nuk përkojnë. Kjo do të nënkuptohet në atë që vijon.

    Minor këndor i rendit të dytë

    Le ta vërtetojmë këtë metoda e induksionit matematik.

    konkluzioni: vlerat e gjetura A Dhe b korrespondojnë me vlerën më të vogël të funksionit , pra, janë parametrat e dëshiruar për metodën e katrorëve më të vegjël.

    E kuptoni ndonjëherë?
    Porosit një zgjidhje

    Në krye të faqes

    Zhvillimi i një parashikimi duke përdorur metodën e katrorëve më të vegjël. Shembull i zgjidhjes së problemit

    Ekstrapolimi - kjo është një metodë e kërkimit shkencor, e cila bazohet në shpërndarjen e tendencave, modeleve, marrëdhënieve të së kaluarës dhe të tashmes me zhvillimin e ardhshëm të objektit të parashikimit. Metodat e ekstrapolimit përfshijnë metoda e mesatares lëvizëse, metoda e zbutjes eksponenciale, metoda e katrorëve më të vegjël.

    Thelbi Metoda e katrorëve më të vegjël konsiston në minimizimin e shumës së devijimeve katrore ndërmjet vlerave të vëzhguara dhe të llogaritura. Vlerat e llogaritura gjenden sipas ekuacionit të zgjedhur - ekuacionit të regresionit. Sa më e vogël të jetë distanca midis vlerave aktuale dhe atyre të llogaritura, aq më i saktë është parashikimi bazuar në ekuacionin e regresionit.

    Analiza teorike e thelbit të fenomenit në studim, ndryshimi i të cilit shfaqet nga një seri kohore, shërben si bazë për zgjedhjen e një kurbë. Konsideratat rreth natyrës së rritjes së niveleve të serisë ndonjëherë merren parasysh. Pra, nëse rritja e prodhimit pritet në një progresion aritmetik, atëherë zbutja kryhet në vijë të drejtë. Nëse rezulton se rritja është eksponenciale, atëherë zbutja duhet të bëhet sipas funksionit eksponencial.

    Formula e punës e metodës së katrorëve më të vegjël : Y t+1 = a*X + b, ku t + 1 është periudha e parashikimit; Уt+1 – tregues i parashikuar; a dhe b janë koeficientë; X është një simbol i kohës.

    Llogaritja e koeficientëve a dhe b kryhet sipas formulave të mëposhtme:

    ku, Uf - vlerat aktuale të serisë së dinamikës; n është numri i niveleve në seritë kohore;

    Zbutja e serive kohore me metodën e katrorëve më të vegjël shërben për të pasqyruar modelet e zhvillimit të fenomenit në studim. Në shprehjen analitike të një tendence, koha konsiderohet si një variabël i pavarur dhe nivelet e serisë veprojnë në funksion të kësaj ndryshoreje të pavarur.

    Zhvillimi i një dukurie nuk varet nga sa vite kanë kaluar nga pika e fillimit, por nga faktorët që ndikuan në zhvillimin e tij, në çfarë drejtimi dhe me çfarë intensiteti. Nga kjo shihet qartë se zhvillimi i një dukurie në kohë shfaqet si rezultat i veprimit të këtyre faktorëve.

    Vendosja e saktë e llojit të kurbës, llojit të varësisë analitike nga koha është një nga detyrat më të vështira të analizës parashikuese. .

    Zgjedhja e llojit të funksionit që përshkruan trendin, parametrat e të cilit përcaktohen me metodën e katrorëve më të vegjël, në shumicën e rasteve bëhet në mënyrë empirike, duke ndërtuar një numër funksionesh dhe duke i krahasuar ato me njëri-tjetrin me vlerën e rrënjës. Gabimi mesatar katror i llogaritur me formulën:

    ku Uf - vlerat aktuale të serisë së dinamikës; Ur - vlerat e llogaritura (të zbutura) të serive kohore; n është numri i niveleve në seritë kohore; p është numri i parametrave të përcaktuar në formulat që përshkruajnë trendin (tendenca e zhvillimit).

    Disavantazhet e metodës së katrorëve më të vegjël :

    • kur përpiqeni të përshkruani fenomenin ekonomik në studim duke përdorur një ekuacion matematikor, parashikimi do të jetë i saktë për një periudhë të shkurtër kohe dhe ekuacioni i regresionit duhet të rillogaritet kur informacioni i ri bëhet i disponueshëm;
    • kompleksiteti i zgjedhjes së ekuacionit të regresionit, i cili është i zgjidhshëm duke përdorur programe standarde kompjuterike.

    Një shembull i përdorimit të metodës së katrorëve më të vegjël për të zhvilluar një parashikim

    Detyrë . Ka të dhëna që karakterizojnë nivelin e papunësisë në rajon, %

    • Ndërtoni një parashikim të shkallës së papunësisë në rajon për muajt nëntor, dhjetor, janar, duke përdorur metodat: mesatare lëvizëse, zbutje eksponenciale, katrorët më të vegjël.
    • Llogaritni gabimet në parashikimet që rezultojnë duke përdorur secilën metodë.
    • Krahasoni rezultatet e marra, nxirrni përfundime.

    Zgjidhja e katrorëve më të vegjël

    Për zgjidhjen, ne do të përpilojmë një tabelë në të cilën do të bëjmë llogaritjet e nevojshme:

    ε = 28,63/10 = 2,86% saktësia e parashikimit lartë.

    konkluzioni : Krahasimi i rezultateve të marra në llogaritjet Metoda e mesatares lëvizëse , zbutje eksponenciale dhe metodën e katrorëve më të vegjël, mund të themi se gabimi mesatar relativ në llogaritjet me metodën e zbutjes eksponenciale bie brenda 20-50%. Kjo do të thotë se saktësia e parashikimit në këtë rast është vetëm e kënaqshme.

    Në rastin e parë dhe të tretë, saktësia e parashikimit është e lartë, pasi gabimi mesatar relativ është më pak se 10%. Por metoda e mesatares lëvizëse bëri të mundur marrjen e rezultateve më të besueshme (parashikimi për nëntor - 1.52%, parashikimi për dhjetor - 1.53%, parashikimi për janar - 1.49%), pasi gabimi mesatar relativ kur përdorni këtë metodë është më i vogli - 1 ,13%.

    Metoda me katrorin më të vogël

    Artikuj të tjerë të lidhur:

    Lista e burimeve të përdorura

    1. Rekomandime shkencore dhe metodologjike për çështjet e diagnostikimit të rreziqeve sociale dhe parashikimit të sfidave, kërcënimeve dhe pasojave sociale. Universiteti Shtetëror Social Rus. Moska. 2010;
    2. Vladimirova L.P. Parashikimi dhe planifikimi në kushtet e tregut: Proc. kompensim. M .: Shtëpia Botuese "Dashkov and Co", 2001;
    3. Novikova N.V., Pozdeeva O.G. Parashikimi i Ekonomisë Kombëtare: Udhëzues Edukativo-Metodologjik. Yekaterinburg: Shtëpia Botuese Ural. shteti ekonomisë universiteti, 2007;
    4. Slutskin L.N. Kurs MBA në parashikimin e biznesit. Moskë: Librat e Biznesit Alpina, 2006.

    Programi MNE

    Futni të dhëna

    Të dhënat dhe përafrimi y = a + b x

    i- numri i pikës eksperimentale;
    x i- vlera e parametrit fiks në pikë i;
    y i- vlera e parametrit të matur në pikë i;
    ω i- matja e peshës në pikë i;
    y i, llogarit.- diferenca ndërmjet vlerës së matur dhe vlerës së llogaritur nga regresioni y në pikën i;
    S x i (x i)- vlerësimi i gabimit x i gjatë matjes y në pikën i.

    Të dhënat dhe përafrimi y = kx

    i x i y i ω i y i, llogarit. Δy i S x i (x i)

    Klikoni në grafik

    Manuali i përdorimit për programin në internet MNC.

    Në fushën e të dhënave, vendosni në secilën rresht të veçantë vlerat e 'x' dhe 'y' në një pikë eksperimentale. Vlerat duhet të ndahen me hapësirë ​​të bardhë (hapësirë ​​ose skedë).

    Vlera e tretë mund të jetë pesha e pikës së `w`. Nëse pesha e pikës nuk është e specifikuar, atëherë ajo është e barabartë me një. Në shumicën dërrmuese të rasteve, peshat e pikave eksperimentale janë të panjohura ose të pallogaritura; të gjitha të dhënat eksperimentale konsiderohen ekuivalente. Ndonjëherë peshat në gamën e studiuar të vlerave nuk janë definitivisht ekuivalente dhe madje mund të llogariten teorikisht. Për shembull, në spektrofotometri, peshat mund të llogariten duke përdorur formula të thjeshta, megjithëse në thelb të gjithë e neglizhojnë këtë për të ulur kostot e punës.

    Të dhënat mund të ngjiten përmes kujtesës së fragmenteve nga një fletëllogaritëse e paketës së zyrës, si p.sh. Excel nga Microsoft Office ose Calc nga Open Office. Për ta bërë këtë, në spreadsheet, zgjidhni gamën e të dhënave për të kopjuar, kopjoni në kujtesën e fragmenteve dhe ngjitni të dhënat në fushën e të dhënave në këtë faqe.

    Për të llogaritur me metodën e katrorëve më të vegjël, kërkohen të paktën dy pika për të përcaktuar dy koeficientët "b" - tangjenten e këndit të pjerrësisë së drejtëzës dhe "a" - vlera e prerë nga vija e drejtë në "y". boshti `.

    Për të vlerësuar gabimin e koeficientëve të llogaritur të regresionit, është e nevojshme të vendosni numrin e pikave eksperimentale në më shumë se dy.

    Metoda e katrorëve më të vegjël (LSM).

    Sa më i madh të jetë numri i pikëve eksperimentale, aq më i saktë është vlerësimi statistikor i koeficientëve (për shkak të uljes së koeficientit të Studentit) dhe aq më i afërt është vlerësimi me vlerësimin e kampionit të përgjithshëm.

    Marrja e vlerave në çdo pikë eksperimentale shpesh shoqërohet me kosto të konsiderueshme të punës, prandaj, shpesh kryhet një numër kompromisi i eksperimenteve, i cili jep një vlerësim të tretshëm dhe nuk çon në kosto të tepërta të punës. Si rregull, numri i pikave eksperimentale për një varësi lineare të katrorëve më të vegjël me dy koeficientë zgjidhet në rajonin 5-7 pikë.

    Një teori e shkurtër e katrorëve më të vegjël për varësinë lineare

    Supozoni se kemi një grup të dhënash eksperimentale në formën e çifteve të vlerave [`y_i`, `x_i`], ku `i` është numri i një matjeje eksperimentale nga 1 në `n`; `y_i` - vlera e vlerës së matur në pikën `i`; `x_i` - vlera e parametrit që vendosëm në pikën `i`.

    Një shembull është funksionimi i ligjit të Ohm-it. Duke ndryshuar tensionin (diferencën e mundshme) midis seksioneve të qarkut elektrik, ne matim sasinë e rrymës që kalon nëpër këtë seksion. Fizika na jep varësinë e gjetur eksperimentalisht:

    `I=U/R`,
    ku `I` - forca aktuale; `R` - rezistencë; `U` - tension.

    Në këtë rast, `y_i` është vlera aktuale e matur, dhe `x_i` është vlera e tensionit.

    Si shembull tjetër, merrni parasysh thithjen e dritës nga një tretësirë ​​e një lënde në tretësirë. Kimia na jep formulën:

    `A = εl C`,
    ku `A` është dendësia optike e tretësirës; `ε` - transmetimi i tretësirës; `l` - gjatësia e rrugës kur drita kalon nëpër një kuvetë me një zgjidhje; 'C' është përqendrimi i substancës së tretur.

    Në këtë rast, `y_i` është densiteti optik i matur `A`, dhe `x_i` është përqendrimi i substancës që kemi vendosur.

    Do të shqyrtojmë rastin kur gabimi relativ në vendosjen e `x_i` është shumë më i vogël se gabimi relativ në matjen e `y_i`. Ne gjithashtu do të supozojmë se të gjitha vlerat e matura të `y_i` janë të rastësishme dhe të shpërndara normalisht, d.m.th. respektoni ligjin e shpërndarjes normale.

    Në rastin e një varësie lineare të `y` nga `x`, mund të shkruajmë një varësi teorike:
    `y = a + bx`.

    Nga pikëpamja gjeometrike, koeficienti "b" tregon tangjenten e këndit të prirjes së drejtëzës në boshtin "x", dhe koeficienti "a" - vlerën e "y" në pikën e kryqëzimit të vijë me boshtin `y` (me `x = 0`).

    Gjetja e parametrave të vijës së regresionit.

    Në një eksperiment, vlerat e matura të `y_i` nuk mund të qëndrojnë saktësisht në vijën teorike për shkak të gabimeve të matjes, të cilat janë gjithmonë të natyrshme në jetën reale. Prandaj, një ekuacion linear duhet të përfaqësohet nga një sistem ekuacionesh:
    `y_i = a + b x_i + ε_i` (1),
    ku `ε_i` është gabimi i panjohur i matjes i `y` në eksperimentin e `i`.

    Varësia (1) quhet gjithashtu regresioni, d.m.th. varësia e dy sasive nga njëra-tjetra me rëndësi statistikore.

    Detyra e rivendosjes së varësisë është gjetja e koeficientëve `a` dhe `b` nga pikat eksperimentale [`y_i`, `x_i`].

    Për të gjetur koeficientët zakonisht përdoret "a" dhe "b". metoda me katrorin më të vogël(MNK). Është një rast i veçantë i parimit të gjasave maksimale.

    Le ta rishkruajmë (1) si `ε_i = y_i - a - b x_i`.

    Atëherë shuma e gabimeve në katror do të jetë
    `Φ = shuma_(i=1)^(n) ε_i^2 = shuma_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

    Parimi i metodës së katrorëve më të vegjël është të minimizohet shuma (2) në lidhje me parametrat "a" dhe "b"..

    Minimumi arrihet kur derivatet e pjesshëm të shumës (2) në lidhje me koeficientët "a" dhe "b" janë të barabarta me zero:
    `frac(i pjesshëm Φ)(i pjesshëm a) = frac(shuma e pjesshme_(i=1)^(n) (y_i - a - b x_i)^2)(i pjesshëm a) = 0`
    `frac(i pjesshëm Φ)(i pjesshëm b) = frac(shuma e pjesshme_(i=1)^(n) (y_i - a - b x_i)^2)(i pjesshëm b) = 0`

    Duke zgjeruar derivatet, marrim një sistem prej dy ekuacionesh me dy të panjohura:
    `shuma_(i=1)^(n) (2a + 2bx_i - 2y_i) = shuma_(i=1)^(n) (a + bx_i - y_i) = 0`
    `sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = shuma_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

    Ne hapim kllapat dhe transferojmë shumat e pavarura nga koeficientët e dëshiruar në gjysmën tjetër, marrim një sistem ekuacionesh lineare:
    `shuma_(i=1)^(n) y_i = a n + b shuma_(i=1)^(n) bx_i`
    `sum_(i=1)^(n) x_iy_i = një shumë_(i=1)^(n) x_i + b shuma_(i=1)^(n) x_i^2`

    Duke zgjidhur sistemin që rezulton, gjejmë formula për koeficientët "a" dhe "b":

    `a = frac(sum_(i=1)^(n) y_i shuma_(i=1)^(n) x_i^2 - shuma_(i=1)^(n) x_i shuma_(i=1)^(n ) x_iy_i) (n shuma_(i=1)^(n) x_i^2 - (shuma_(i=1)^(n) x_i)^2)` (3.1)

    `b = frac(n shuma_(i=1)^(n) x_iy_i - shuma_(i=1)^(n) x_i shuma_(i=1)^(n) y_i) (n shuma_(i=1)^ (n) x_i^2 - (shuma_(i=1)^(n) x_i)^2)` (3.2)

    Këto formula kanë zgjidhje kur `n > 1` (vija mund të vizatohet duke përdorur të paktën 2 pika) dhe kur përcaktorja `D = n shuma_(i=1)^(n) x_i^2 — (shuma_(i= 1 )^(n) x_i)^2 != 0`, d.m.th. kur pikat `x_i` në eksperiment janë të ndryshme (d.m.th. kur vija nuk është vertikale).

    Vlerësimi i gabimeve në koeficientët e vijës së regresionit

    Për një vlerësim më të saktë të gabimit në llogaritjen e koeficientëve "a" dhe "b", është i dëshirueshëm një numër i madh pikash eksperimentale. Kur `n = 2`, është e pamundur të vlerësohet gabimi i koeficientëve, sepse vija e përafërt do të kalojë në mënyrë unike nëpër dy pika.

    Përcaktohet gabimi i ndryshores së rastësishme `V` ligji i akumulimit të gabimeve
    `S_V^2 = shuma_(i=1)^p (frac(i pjesshëm f)(i pjesshëm z_i))^2 S_(z_i)^2`,
    ku `p` është numri i parametrave `z_i` me gabim `S_(z_i)` që ndikojnë në gabimin `S_V`;
    `f` është një funksion varësie e `V` në `z_i`.

    Le të shkruajmë ligjin e akumulimit të gabimeve për gabimin e koeficientëve "a" dhe "b".
    `S_a^2 = shuma_(i=1)^(n)(frac(i pjesshëm a)(i pjesshëm y_i))^2 S_(y_i)^2 + shuma_(i=1)^(n)(frac(i pjesshëm a )(x_i i pjesshëm))^2 S_(x_i)^2 = S_y^2 shuma_(i=1)^(n)(frac(i pjesshëm a)(i pjesshëm y_i))^2 `,
    `S_b^2 = shuma_(i=1)^(n)(frac(i pjesshëm b)(i pjesshëm y_i))^2 S_(y_i)^2 + shuma_(i=1)^(n)(frac(i pjesshëm b )(x_i i pjesshëm))^2 S_(x_i)^2 = S_y^2 shuma_(i=1)^(n)(frac(i pjesshëm b)(i pjesshëm y_i))^2 `,
    sepse `S_(x_i)^2 = 0` (më parë kemi bërë një rezervë se gabimi i `x` është i papërfillshëm).

    `S_y^2 = S_(y_i)^2` - gabimi (varianca, devijimi standard në katror) në dimensionin `y`, duke supozuar se gabimi është uniform për të gjitha vlerat `y`.

    Duke zëvendësuar formulat për llogaritjen e "a" dhe "b" në shprehjet që rezultojnë, marrim

    `S_a^2 = S_y^2 frac(shuma_(i=1)^(n) (shuma_(i=1)^(n) x_i^2 - x_i shuma_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n shuma_(i=1)^(n) x_i^2 - (shuma_(i=1)^(n) x_i)^2) shuma_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(shuma_(i=1)^(n) x_i^2) (D)` (4.1)

    `S_b^2 = S_y^2 frac(shuma_(i=1)^(n) (n x_i - shuma_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n shuma_(i=1)^(n) x_i^2 - (shuma_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) ` (4.2)

    Në shumicën e eksperimenteve reale, vlera e 'Sy' nuk matet. Për ta bërë këtë, është e nevojshme të kryhen disa matje (eksperimente) paralele në një ose disa pika të planit, gjë që rrit kohën (dhe ndoshta koston) e eksperimentit. Prandaj, zakonisht supozohet se devijimi i `y` nga vija e regresionit mund të konsiderohet i rastësishëm. Vlerësimi i variancës `y` në këtë rast llogaritet me formulën.

    `S_y^2 = S_(y, pushim)^2 = frac(shuma_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

    Pjesëtuesi `n-2` shfaqet sepse kemi reduktuar numrin e shkallëve të lirisë për shkak të llogaritjes së dy koeficientëve për të njëjtin mostër të të dhënave eksperimentale.

    Ky vlerësim quhet gjithashtu varianca e mbetur në lidhje me vijën e regresionit `S_(y, pushim)^2`.

    Vlerësimi i rëndësisë së koeficientëve kryhet sipas kriterit të Studentit

    `t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

    Nëse kriteret e llogaritura `t_a`, `t_b` janë më të vogla se kriteret e tabelës `t(P, n-2)`, atëherë konsiderohet se koeficienti përkatës nuk është dukshëm i ndryshëm nga zero me një probabilitet të caktuar `P`.

    Për të vlerësuar cilësinë e përshkrimit të një marrëdhënieje lineare, mund të krahasoni `S_(y, pushim)^2` dhe `S_(bar y)` në lidhje me mesataren duke përdorur kriterin Fisher.

    `S_(bar y) = frac(shuma_(i=1)^n (y_i - bar y)^2) (n-1) = frac(shuma_(i=1)^n (y_i - (shuma_(i= 1)^n y_i) /n)^2) (n-1)` - vlerësim mostër e variancës së `y` në lidhje me mesataren.

    Për të vlerësuar efektivitetin e ekuacionit të regresionit për përshkrimin e varësisë, llogaritet koeficienti Fisher
    `F = S_(shirit y) / S_(y, pushim)^2`,
    i cili krahasohet me koeficientin tabelor Fisher `F(p, n-1, n-2)`.

    Nëse `F > F(P, n-1, n-2)`, ndryshimi midis përshkrimit të varësisë `y = f(x)` duke përdorur ekuacionin e regresionit dhe përshkrimit duke përdorur mesataren konsiderohet statistikisht i rëndësishëm me probabilitet `P`. Ato. regresioni përshkruan më mirë varësinë sesa përhapjen e `y` rreth mesatares.

    Klikoni në grafik
    për të shtuar vlera në tabelë

    Metoda me katrorin më të vogël. Metoda e katrorëve më të vegjël nënkupton përcaktimin e parametrave të panjohur a, b, c, varësinë funksionale të pranuar

    Metoda e katrorëve më të vegjël nënkupton përcaktimin e parametrave të panjohur a, b, c,… varësia funksionale e pranuar

    y = f(x,a,b,c,…),

    e cila do të siguronte një minimum të katrorit mesatar (variancës) të gabimit

    , (24)

    ku x i , y i - grup çiftesh numrash të përftuar nga eksperimenti.

    Meqenëse kushti për ekstremin e një funksioni të disa ndryshoreve është kushti që derivatet e tij të pjesshëm të jenë të barabartë me zero, atëherë parametrat a, b, c,… përcaktohen nga sistemi i ekuacioneve:

    ; ; ; … (25)

    Duhet mbajtur mend se metoda e katrorëve më të vegjël përdoret për të zgjedhur parametrat pas formës së funksionit y = f(x) të përcaktuara.

    Nëse nga konsideratat teorike është e pamundur të nxirren ndonjë përfundim se cila duhet të jetë formula empirike, atëherë duhet të udhëhiqet nga paraqitjet vizuale, kryesisht një paraqitje grafike e të dhënave të vëzhguara.

    Në praktikë, më së shpeshti kufizohet në llojet e mëposhtme të funksioneve:

    1) lineare ;

    2) kuadratik a .

    Thelbi i metodës së katrorëve më të vegjël është në gjetjen e parametrave të një modeli trendi që përshkruan më së miri prirjen e zhvillimit të ndonjë dukurie të rastësishme në kohë ose hapësirë ​​(një trend është një linjë që karakterizon prirjen e këtij zhvillimi). Detyra e metodës së katrorëve më të vegjël (OLS) është të gjejë jo vetëm një model trendi, por të gjejë modelin më të mirë ose optimal. Ky model do të jetë optimal nëse shuma e devijimeve në katror midis vlerave aktuale të vëzhguara dhe vlerave përkatëse të prirjes së llogaritur është minimale (më e vogla):

    ku është devijimi standard ndërmjet vlerës aktuale të vëzhguar

    dhe vlerën përkatëse të llogaritur të trendit,

    Vlera aktuale (e vëzhguar) e fenomenit në studim,

    Vlera e vlerësuar e modelit të trendit,

    Numri i vëzhgimeve të fenomenit në studim.

    MNC përdoret rrallë më vete. Si rregull, më shpesh përdoret vetëm si një teknikë e nevojshme në studimet e korrelacionit. Duhet mbajtur mend se baza e informacionit të LSM mund të jetë vetëm një seri statistikore e besueshme, dhe numri i vëzhgimeve nuk duhet të jetë më i vogël se 4, përndryshe, procedurat e zbutjes së LSM mund të humbasin sensin e tyre të përbashkët.

    Paketa e veglave OLS reduktohet në procedurat e mëposhtme:

    Procedura e parë. Rezulton nëse ka ndonjë tendencë për ndryshimin e atributit rezultant kur ndryshon faktori-argumenti i zgjedhur, ose me fjalë të tjera, nëse ka një lidhje midis " "Dhe" X ».

    Procedura e dytë. Përcaktohet se cila linjë (trajektore) është më e aftë për të përshkruar ose karakterizuar këtë prirje.

    Procedura e tretë.

    Shembull. Supozoni se kemi informacion mbi rendimentin mesatar të lulediellit për fermën në studim (Tabela 9.1).

    Tabela 9.1

    Numri i vëzhgimit

    Produktiviteti, c/ha

    Duke qenë se niveli i teknologjisë në prodhimin e lulediellit në vendin tonë nuk ka ndryshuar shumë gjatë 10 viteve të fundit, do të thotë se, me shumë mundësi, luhatjet e rendimentit në periudhën e analizuar vareshin shumë nga luhatjet e kushteve të motit dhe klimës. A është e vërtetë?

    Procedura e parë MNC. Po testohet hipoteza për ekzistencën e një tendence në ndryshimin e rendimentit të lulediellit në varësi të ndryshimeve të motit dhe kushteve klimatike gjatë 10 viteve të analizuara.

    Në këtë shembull, për " y » këshillohet të merret rendimenti i lulediellit, dhe për « x » është numri i vitit të vëzhguar në periudhën e analizuar. Testimi i hipotezës për ekzistencën e ndonjë marrëdhënieje midis " x "Dhe" y » mund të bëhet në dy mënyra: me dorë dhe me ndihmën e programeve kompjuterike. Sigurisht, me disponueshmërinë e teknologjisë kompjuterike, ky problem zgjidhet vetvetiu. Por, për të kuptuar më mirë paketën e veglave OLS, këshillohet që të testohet hipoteza për ekzistencën e një marrëdhënieje midis " x "Dhe" y » me dorë, kur keni në dorë vetëm një stilolaps dhe një makinë llogaritëse të zakonshme. Në raste të tilla, hipoteza e ekzistencës së një tendence kontrollohet më së miri vizualisht nga vendndodhja e imazhit grafik të serive kohore të analizuara - fusha e korrelacionit:

    Fusha e korrelacionit në shembullin tonë ndodhet rreth një linje që rritet ngadalë. Kjo në vetvete tregon ekzistencën e një tendence të caktuar në ndryshimin e rendimentit të lulediellit. Është e pamundur të flitet për praninë e ndonjë tendence vetëm kur fusha e korrelacionit duket si një rreth, një rreth, një re rreptësisht vertikale ose rreptësisht horizontale, ose përbëhet nga pika të shpërndara rastësisht. Në të gjitha rastet e tjera, është e nevojshme të konfirmohet hipoteza e ekzistencës së një marrëdhënieje midis " x "Dhe" y dhe të vazhdojë kërkimin.

    Procedura e dytë MNC. Përcaktohet se cila linjë (trajektore) është më e aftë për të përshkruar ose karakterizuar tendencën e ndryshimeve të rendimentit të lulediellit për periudhën e analizuar.

    Me disponueshmërinë e teknologjisë kompjuterike, zgjedhja e tendencës optimale ndodh automatikisht. Me përpunimin "manual", zgjedhja e funksionit optimal kryhet, si rregull, në një mënyrë vizuale - nga vendndodhja e fushës së korrelacionit. Kjo do të thotë, sipas llojit të grafikut, zgjidhet ekuacioni i linjës, i cili i përshtatet më së miri prirjes empirike (me trajektoren aktuale).

    Siç e dini, në natyrë ekziston një shumëllojshmëri e madhe e varësive funksionale, kështu që është jashtëzakonisht e vështirë të analizosh vizualisht edhe një pjesë të vogël të tyre. Për fat të mirë, në praktikën reale ekonomike, shumica e marrëdhënieve mund të përshkruhen me saktësi ose nga një parabolë, ose një hiperbolë, ose një vijë e drejtë. Në këtë drejtim, me opsionin "manual" për zgjedhjen e funksionit më të mirë, mund të kufizoheni vetëm në këto tre modele.

    Hiperbola:

    Parabola e rendit të dytë: :

    Është e lehtë të shihet se në shembullin tonë, tendenca në ndryshimet e rendimentit të lulediellit gjatë 10 viteve të analizuara karakterizohet më së miri nga një vijë e drejtë, kështu që ekuacioni i regresionit do të jetë një ekuacion i drejtë.

    Procedura e tretë. Llogariten parametrat e ekuacionit të regresionit që karakterizon këtë linjë, ose me fjalë të tjera, përcaktohet një formulë analitike që përshkruan modelin më të mirë të trendit.

    Gjetja e vlerave të parametrave të ekuacionit të regresionit, në rastin tonë, parametrat dhe , është thelbi i LSM. Ky proces reduktohet në zgjidhjen e një sistemi ekuacionesh normale.

    (9.2)

    Ky sistem ekuacionesh zgjidhet mjaft lehtë me metodën e Gausit. Kujtojmë se si rezultat i zgjidhjes, në shembullin tonë, janë gjetur vlerat e parametrave dhe. Kështu, ekuacioni i gjetur i regresionit do të ketë formën e mëposhtme:

    KATEGORITË

    ARTIKUJ POPULLOR

    2023 "kingad.ru" - ekzaminimi me ultratinguj i organeve të njeriut