Jepet një matricë e koeficientëve të korrelacionit të çiftit. Ndërtimi i një matrice të koeficientëve të korrelacionit të çiftit

Z 1 (t)

Z 2 (t)

t

y(t)

Z 1 (t)

Z 2 (t)

t

y(t)

Detyra kryesore me të cilën përballet përzgjedhja e faktorëve të përfshirë në modelin e korrelacionit është futja në analizë e të gjithë faktorëve kryesorë që ndikojnë në nivelin e fenomenit që studiohet. Sidoqoftë, futja e një numri të madh faktorësh në model është jopraktike; është më e saktë të zgjidhni vetëm një numër relativisht të vogël faktorësh kryesorë që supozohet se janë në korrelacion me treguesin funksional të zgjedhur.

Kjo mund të bëhet duke përdorur të ashtuquajturën përzgjedhje me dy faza. Në përputhje me të, të gjithë faktorët e përzgjedhur paraprakisht janë përfshirë në model. Më pas, midis tyre, në bazë të një vlerësimi të veçantë sasior dhe analizave cilësore shtesë, identifikohen faktorë ndikues të parëndësishëm, të cilët hidhen gradualisht derisa të mbeten ata për të cilët mund të argumentohet se materiali statistikor i disponueshëm është në përputhje me hipotezën e përbashkët të tyre. ndikim domethënës në variablin e varur me formën e zgjedhur të lidhjes.

Përzgjedhja me dy faza mori shprehjen e saj më të plotë në teknikën e të ashtuquajturës analizë regresioni me shumë hapa, në të cilën eliminimi i faktorëve të parëndësishëm ndodh në bazë të treguesve të rëndësisë së tyre, veçanërisht në bazë të vlerës së t f - vlera e llogaritur e testit të Studentit.

Le të llogarisim t f duke përdorur koeficientët e korrelacionit të çiftit të gjetur dhe t'i krahasojmë ato me t kritik për një nivel rëndësie 5% (të dyanshme) dhe 18 gradë lirie (ν = n-2).

ku r është vlera e koeficientit të korrelacionit të çiftit;

n – numri i vëzhgimeve (n=20)

Kur krahasojmë t f për çdo koeficient me t kr = 2,101 konstatojmë se koeficientët e gjetur konsiderohen të rëndësishëm, sepse t f > t kr.

t f për r yx 1 = 2, 5599 ;

t f për r yx 2 = 7,064206 ;

t f për r yx 3 = 2,40218 ;

t f për r x1 x 2 = 4,338906 ;

t f për r x1 x 3 = 15,35065;

t f për r x2 x 3 = 4,749981

Gjatë përzgjedhjes së faktorëve që do të përfshihen në analizë, atyre u vendosen kërkesa specifike. Para së gjithash, treguesit që shprehin këta faktorë duhet të jenë të matshëm në mënyrë sasiore.

Faktorët e përfshirë në model nuk duhet të jenë në një marrëdhënie funksionale ose të ngushtë me njëri-tjetrin. Prania e marrëdhënieve të tilla karakterizohet nga shumëkolineariteti.

Multikolineariteti tregon se disa faktorë karakterizojnë të njëjtin aspekt të fenomenit që studiohet. Prandaj, përfshirja e tyre e njëkohshme në model është e papërshtatshme, pasi ato kopjojnë njëra-tjetrën në një masë të caktuar. Nëse nuk ka supozime të veçanta nga folësit në favor të njërit prej këtyre faktorëve, përparësi duhet t'i jepet atij që karakterizohet nga një koeficient i madh korrelacioni në çift (ose i pjesshëm).

Besohet se vlera maksimale e koeficientit të korrelacionit midis dy faktorëve është 0.8.

Shumëkolineariteti zakonisht çon në degjenerimin e matricës së variablave dhe, rrjedhimisht, në faktin që përcaktori kryesor ul vlerën e tij dhe në kufi bëhet afër zeros. Vlerësimet e koeficientëve të ekuacionit të regresionit varen shumë nga saktësia e gjetjes së të dhënave burimore dhe ndryshojnë ndjeshëm vlerat e tyre kur ndryshon numri i vëzhgimeve.

Matrica e koeficientëve të korrelacionit të çiftit

Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945

Nyjet e matricës përmbajnë koeficientë të çiftëzuar korrelacioni që karakterizojnë marrëdhënien e ngushtë midis karakteristikave të faktorit. Duke analizuar këta koeficientë, vërejmë se sa më e madhe vlera absolute e tyre, aq më i madh është ndikimi i karakteristikave të faktorit përkatës në atë rezultante. Analiza e matricës që rezulton kryhet në dy faza:

1. Nëse në kolonën e parë të matricës ka koeficientë korrelacioni për të cilët /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Duke analizuar koeficientët e korrelacionit të çiftëzuar të karakteristikave të faktorëve me njëri-tjetrin, (r XiXj), duke karakterizuar afërsinë e marrëdhënies së tyre, është e nevojshme të vlerësohet pavarësia e tyre nga njëri-tjetri, pasi ky është një kusht i domosdoshëm për analizën e mëtejshme të regresionit. Duke pasur parasysh faktin se nuk ka karakteristika absolutisht të pavarura në ekonomi, është e nevojshme të theksohen, nëse është e mundur, ato më të pavarura. Karakteristikat e faktorëve që janë të lidhura ngushtë me njëri-tjetrin quhen shumëkolineare. Përfshirja e karakteristikave shumëkolineare në model e bën të pamundur interpretimin ekonomik të modelit të regresionit, pasi një ndryshim në një faktor sjell një ndryshim në faktorët që lidhen me të, gjë që mund të çojë në një "prishje" të modelit në tërësi.

Kriteri për shumëkolateralitetin e faktorëve është si më poshtë:

/r XiXj / > 0,8

Në matricën rezultuese të koeficientëve të korrelacionit të çiftëzuar, ky kriter plotësohet nga dy tregues të vendosur në kryqëzimin e rreshtave Dhe . Nga çdo palë e këtyre veçorive, një duhet të lihet në model; ai duhet të ketë një ndikim më të madh në tiparin që rezulton. Si rezultat, faktorët dhe janë të përjashtuar nga modeli, d.m.th. norma e rritjes së kostos së mallrave të shitura dhe norma e rritjes së vëllimit të shitjeve të saj.

Pra, ne futim faktorët X1 dhe X2 në modelin e regresionit.

Më pas, kryhet analiza e regresionit (shërbimi, analiza e të dhënave, regresioni). Përsëri, një tabelë e të dhënave fillestare është përpiluar me faktorët X1 dhe X2. Regresioni në përgjithësi përdoret për të analizuar ndikimin në një variabël të varur të veçantë të vlerave të variablave (faktorëve) të pavarur dhe lejon që korrelacioni midis karakteristikave të përfaqësohet në formën e një varësie funksionale të quajtur ekuacion regresioni ose korrelacion-regresion. model.

Si rezultat i analizës së regresionit, marrim rezultatet e llogaritjes së regresionit shumëvariak. Le të analizojmë rezultatet e marra.

Të gjithë koeficientët e regresionit janë të rëndësishëm sipas testit t Studentit. Koeficienti i korrelacionit të shumëfishtë R ishte 0.925; katrori i kësaj vlere (koeficienti i përcaktimit) do të thotë se mesatarisht 85.5% e ndryshimit në karakteristikën efektive shpjegohet nga ndryshimi në karakteristikat e faktorëve të përfshirë në model. Koeficienti i determinizmit karakterizon marrëdhënien e ngushtë midis grupit të karakteristikave të faktorëve dhe treguesit efektiv. Sa më afër të jetë vlera R-katrore me 1, aq më e fortë është marrëdhënia. Në rastin tonë, një tregues i barabartë me 0.855 tregon përzgjedhjen e saktë të faktorëve dhe praninë e një marrëdhënieje midis faktorëve dhe treguesit efektiv.

Modeli në shqyrtim është adekuat, pasi vlera e llogaritur e Fisher's F-test e tejkalon ndjeshëm vlerën e tij të tabelës (F obs =52.401; F tab =1.53).

Rezultati i përgjithshëm i analizës së korrelacionit dhe regresionit është një ekuacion i regresionit të shumëfishtë, i cili ka formën:

Ekuacioni i regresionit që rezulton plotëson qëllimin e analizës së korrelacionit-regresionit dhe është një model linear i varësisë së fitimit të bilancit të ndërmarrjes nga dy faktorë: koeficienti i rritjes së produktivitetit të punës dhe koeficienti i pronësisë industriale.

Bazuar në modelin e përftuar, mund të konkludojmë se me një rritje të nivelit të produktivitetit të punës me 1% krahasuar me nivelin e periudhës së mëparshme, shuma e fitimit të bilancit do të rritet me 0,95 pikë përqindje; rritja me 1% e koeficientit të pronësisë industriale do të sjellë një rritje të treguesit efektiv me 27.9 pikë përqindjeje. Rrjedhimisht, ndikimin dominues në rritjen e fitimit në bilanc e ushtron rritja e vlerës së pasurisë për qëllime prodhimi (rinovimi dhe rritja e aseteve fikse të ndërmarrjes).

Duke përdorur një model regresioni të shumëfishtë, kryhet një parashikim multifaktorial i karakteristikës efektive. Le të dihet se X1 = 3.0, dhe X3 = 0.7. Le të zëvendësojmë vlerat e karakteristikave të faktorit në model, marrim Kontroll = 0.95*3.0 + 27.9*0.7 – 19.4 = 2.98. Kështu, me rritjen e produktivitetit të punës dhe modernizimin e aktiveve fikse në ndërmarrje, fitimi i bilancit në tremujorin e parë të vitit 2005 krahasuar me periudhën paraardhëse (tremujori IV 2004) do të rritet me 2,98%.

Të dhënat ekonomike përfaqësojnë karakteristikat sasiore të çdo objekti apo procesi ekonomik. Ato formohen nën ndikimin e shumë faktorëve, jo të gjithë janë të aksesueshëm për kontrollin e jashtëm. Faktorët e pakontrollueshëm mund të marrin vlera të rastësishme nga disa grupe vlerash dhe në këtë mënyrë të bëjnë që të dhënat që ata përcaktojnë të jenë të rastësishme. Një nga detyrat kryesore në kërkimin ekonomik është analiza e varësive ndërmjet variablave.

Kur merren parasysh varësitë midis karakteristikave, është e nevojshme të dallohen, para së gjithash, dy lloje lidhjesh:

  • funksionale - karakterizohen nga korrespondencë e plotë midis ndryshimit në karakteristikën e faktorit dhe ndryshimit në vlerën që rezulton: Çdo vlerë e një karakteristike të faktorit korrespondon me vlera shumë specifike të karakteristikës që rezulton. Ky lloj marrëdhënieje shprehet si një marrëdhënie formulaike. Varësia funksionale mund të lidhë një karakteristikë efektive me një ose më shumë karakteristika të faktorëve. Kështu, shuma e pagave për pagat e bazuara në kohë varet nga numri i orëve të punës;
  • korrelative- nuk ka korrespondencë të plotë midis ndryshimit të dy shenjave; ndikimi i faktorëve individualë manifestohet vetëm mesatarisht, me vëzhgimin masiv të të dhënave aktuale. Ndikimi i njëkohshëm në tiparin e studiuar i një numri të madh faktorësh të ndryshëm çon në faktin se një dhe e njëjta vlerë e një karakteristike faktori korrespondon me një shpërndarje të tërë të vlerave të karakteristikës që rezulton, pasi në çdo rast specifik karakteristika të tjera të faktorëve mund të ndryshojnë forcën dhe drejtimin e ndikimit të tyre.

Duhet të kihet parasysh se nëse ekziston një marrëdhënie funksionale midis karakteristikave, është e mundur, duke ditur vlerën e karakteristikës së faktorit, të përcaktohet me saktësi vlera e shenjës rezultante. Vetëm në prani të një varësie korrelacioni tendenca e ndryshimit në karakteristikën rezultante kur ndryshon vlera e karakteristikës së faktorit.

Kur studiohen marrëdhëniet midis shenjave, ato klasifikohen sipas drejtimit, formës, numrit të faktorëve:

  • drejt lidhjet ndahen në drejt Dhe e kundërta. Me një lidhje të drejtpërdrejtë, drejtimi i ndryshimit në karakteristikën që rezulton përkon me drejtimin e ndryshimit në karakteristikën e faktorit. Me reagime, drejtimi i ndryshimit në karakteristikën që rezulton është i kundërt me drejtimin e ndryshimit në karakteristikën e faktorit. Për shembull, sa më të larta të jenë kualifikimet e punëtorit, aq më i lartë është niveli i produktivitetit të punës së tij (marrëdhënie direkte). Sa më i lartë të jetë produktiviteti i punës, aq më i ulët është kostoja për njësi prodhimi (feedback);
  • sipas formës(lloji i funksionit) lidhjet ndahen në lineare(vijë e drejtë) dhe jolineare(lakore). Një marrëdhënie lineare përfaqësohet nga një vijë e drejtë, një marrëdhënie jolineare nga një kurbë (parabola, hiperbola, etj.). Në një marrëdhënie lineare, me një rritje të vlerës së një karakteristike të faktorit, ka një rritje (ulje) uniforme të vlerës së karakteristikës që rezulton;
  • nga numri i faktorëve që veprojnë në karakteristikën efektive, lidhjet ndahen në me një faktor(të çiftëzuara) dhe multifaktorial.

Studimi i varësisë së variacionit të tipareve nga kushtet mjedisore është përmbajtja e teorisë së korrelacionit.

Gjatë kryerjes së analizës së korrelacionit, i gjithë grupi i të dhënave konsiderohet si një grup variablash (faktorësh), secila prej të cilave përmban P vëzhgimet.

Kur studiohet marrëdhënia midis dy faktorëve, ato zakonisht përcaktohen X=(x f x 2,...,x n) Dhe Y= (y ( , y 2 ,..., y dhe).

Kovarianca - kjo është statistikore masë e ndërveprimit dy variabla. Për shembull, një vlerë pozitive për kovariancën e kthimeve të dy letrave me vlerë tregon se kthimet e këtyre letrave me vlerë priren të lëvizin në një drejtim.

Kovarianca midis dy variablave X Dhe Y llogaritet si më poshtë:

ku janë vlerat aktuale të variablave

X Dhe G;

Nëse variablat e rastësishëm Chi Y e pavarur, kovarianca teorike është zero.

Kovarianca varet nga njësitë në të cilat maten variablat Hee Y, është një sasi jo e standardizuar. Prandaj, për të matur forca e lidhjes një statistikë tjetër e quajtur koeficient korrelacioni përdoret midis dy variablave.

Për dy variabla X Dhe Koeficienti i korrelacionit të çiftit Y

përkufizohet si më poshtë:

Ku SSy- vlerësimet e variancave të sasive Hee Y. Këto vlerësime karakterizojnë shkalla e shpërndarjes vlerat x (, x 2, ..., x n (y 1, y 2, y n) rreth mesatares suaj x(y përkatësisht), ose ndryshueshmëria(ndryshueshmëria) e këtyre variablave mbi një grup vëzhgimesh.

Dispersion(vlerësimi i variancës) përcaktohet nga formula

Në përgjithësi, për të marrë një vlerësim të paanshëm të variancës, shuma e katrorëve duhet të pjesëtohet me numrin e shkallëve të lirisë së vlerësimit (etj), Ku P - Madhësia e mostrës, R - numri i lidhjeve të mbivendosura në mostër. Meqenëse kampioni tashmë është përdorur një herë për të përcaktuar mesataren X, atëherë numri i lidhjeve të mbivendosura në këtë rast është i barabartë me një (p = 1), dhe numri i shkallëve të lirisë së vlerësimit (d.m.th., numri i elementeve të mostrës së pavarur) është i barabartë me (P - 1).

Është më e natyrshme të matet shkalla e shpërndarjes së vlerave të ndryshueshme në të njëjtat njësi në të cilat matet vetë ndryshorja. Ky problem zgjidhet nga një tregues i quajtur devijimi standard (devijimi standard) ose gabim standard e ndryshueshme X(ndryshueshme Y) dhe përcaktohet nga relacioni

Termat në numëruesin e formulës (3.2.1) shprehin bashkëveprimin e dy ndryshoreve dhe përcaktojnë shenjën e korrelacionit (pozitiv ose negativ). Nëse, për shembull, ekziston një lidhje e fortë pozitive midis variablave (një rritje në një variabël ndërsa tjetra rritet), çdo term do të jetë një numër pozitiv. Po kështu, nëse ka një lidhje të fortë negative midis variablave, të gjithë termat në numërues do të jenë numra negativë, duke rezultuar në një vlerë korrelacioni negativ.

Emëruesi i shprehjes për koeficientin e korrelacionit në çift [shih formula (3.2.2)] thjesht normalizon numëruesin në atë mënyrë që koeficienti i korrelacionit të rezultojë të jetë një numër lehtësisht i interpretueshëm pa dimension, dhe merr vlera nga -1 në +1.

Numëruesi i shprehjes për koeficientin e korrelacionit, i cili është i vështirë për t'u interpretuar për shkak të njësive të pazakonta të matjes, është kovarianca HiU. Përkundër faktit se ndonjëherë përdoret si një karakteristikë e pavarur (për shembull, në teorinë e financave për të përshkruar ndryshimin e përbashkët në çmimet e aksioneve në dy bursa), është më i përshtatshëm të përdoret koeficienti i korrelacionit. Korrelacioni dhe kovarianca përfaqësojnë në thelb të njëjtin informacion, por korrelacioni përfaqëson këtë informacion në një formë më të dobishme.

Për të vlerësuar në mënyrë cilësore koeficientin e korrelacionit, përdoren shkallë të ndryshme, më së shpeshti shkalla Chaddock. Në varësi të vlerës së koeficientit të korrelacionit, marrëdhënia mund të ketë një nga vlerësimet e mëposhtme:

  • 0,1-0,3 - i dobët;
  • 0,3-0,5 - e dukshme;
  • 0,5-0,7 - e moderuar;
  • 0,7-0,9 - e lartë;
  • 0,9-1,0 - shumë e lartë.

Vlerësimi i shkallës së afërsisë së një lidhjeje duke përdorur koeficientin e korrelacionit kryhet, si rregull, në bazë të informacionit pak a shumë të kufizuar në lidhje me fenomenin që studiohet. Në këtë drejtim, ekziston nevoja për të vlerësuar rëndësinë e koeficientit të korrelacionit linear, i cili bën të mundur shtrirjen e konkluzioneve të bazuara në rezultatet e mostrës në popullatën e përgjithshme.

Vlerësimi i rëndësisë së koeficientit të korrelacionit për madhësi të vogla të mostrës kryhet duke përdorur testin 7 të Studentit. Në këtë rast, vlera aktuale (e vëzhguar) e këtij kriteri përcaktohet nga formula

Vlera / obs e llogaritur duke përdorur këtë formulë krahasohet me vlerën kritike të kriterit 7, i cili është marrë nga tabela e vlerave të testit / Studentit (shih Shtojcën 2) duke marrë parasysh nivelin e dhënë të rëndësisë oc dhe numrin të shkallëve të lirisë (P - 2).

Nëse 7 obs > 7 skeda, atëherë vlera rezultuese e koeficientit të korrelacionit konsiderohet e rëndësishme (d.m.th., hipoteza zero që thotë se koeficienti i korrelacionit është i barabartë me zero refuzohet). Dhe kështu arrihet në përfundimin se ekziston një lidhje e ngushtë statistikore midis variablave në studim.

Nëse vlera g y x afër zeros, lidhja ndërmjet variablave është e dobët. Nëse korrelacioni ndërmjet variablave të rastësishëm:

  • pozitive, atëherë me rritjen e një ndryshoreje të rastësishme, tjetra priret të rritet mesatarisht;
  • negative, atëherë me rritjen e një ndryshoreje të rastësishme, tjetra tenton të ulet mesatarisht. Një mjet i përshtatshëm grafik për analizimin e të dhënave të çiftuara është komplot shpërndaj, i cili përfaqëson çdo vëzhgim në një hapësirë ​​me dy dimensione që korrespondojnë me dy faktorë. Quhet gjithashtu një skemë shpërndarjeje, e cila përshkruan një grup vlerash të dy karakteristikave fushë korrelacioni.Çdo pikë në këtë diagram ka koordinatat x (. dhe y g Ndërsa forca e marrëdhënies lineare rritet, pikat në grafik do të qëndrojnë më afër vijës së drejtë dhe madhësisë G do të jetë më afër unitetit.

Koeficientët e korrelacionit në çift përdoren për të matur fuqinë e marrëdhënieve lineare midis çifteve të ndryshme të veçorive nga një grup prej tyre. Për shumë veçori merr matrica e koeficientëve të korrelacionit të çiftit.

Lëreni që i gjithë grupi i të dhënave të përbëhet nga një ndryshore Y = =(y fq y 2, ..., y p) Dhe T variabla (faktorë) X, secila prej të cilave përmban P vëzhgimet. Vlerat e ndryshueshme Y Dhe X, të përfshira në popullatën e vëzhguar janë regjistruar në një tabelë (Tabela 3.2.1).

Tabela 3.2.1

E ndryshueshme

Numri

vëzhgimet

X TZ

X tp

Bazuar në të dhënat që përmban kjo tabelë, llogarisni matrica e koeficientëve të korrelacionit të çiftit R,është simetrik në lidhje me diagonalen kryesore:


Analiza e matricës së koeficientëve të korrelacionit të çifteve përdoret kur ndërtohen modele të shumëfishta regresioni.

Një matricë korrelacioni nuk mund të përshkruajë plotësisht varësitë midis sasive. Në këtë drejtim, analiza e korrelacionit multivariate merr në konsideratë dy detyra:

  • 1. Përcaktimi i lidhjes së ngushtë të një ndryshoreje të rastësishme me tërësinë e variablave të tjerë të përfshirë në analizë.
  • 2. Përcaktimi i afërsisë së lidhjes ndërmjet dy sasive duke fiksuar ose përjashtuar ndikimin e sasive të tjera.

Këto probleme zgjidhen duke përdorur përkatësisht koeficientët e korrelacionit të shumëfishtë dhe të pjesshëm.

Zgjidhja e problemit të parë (përcaktimi i marrëdhënies së ngushtë të një ndryshoreje të rastësishme me tërësinë e variablave të tjerë të përfshirë në analizë) kryhet duke përdorur mostër koeficienti i korrelacionit të shumëfishtë sipas formulës

Ku R- R[cm. formula (3.2.6)]; Rjj- plotësues algjebrik i një elementi të së njëjtës matricë R.

Koeficienti i korrelacionit të shumëfishtë në katror SCHj 2 j _j J+l m zakonisht quhet mostër koeficienti i shumëfishtë i përcaktimit; tregon se çfarë proporcioni të variacionit (shpërndarjes së rastësishme) të vlerës që studiohet Xj shpjegon variacionin e variablave të rastit të mbetur X (, X 2 ,..., X t.

Koeficientët e korrelacionit dhe përcaktimit të shumëfishtë janë sasi pozitive, duke marrë vlera në rangun nga 0 në 1. Kur përafrohet koeficienti R 2 me unitetin, mund të konkludojmë se marrëdhënia midis ndryshoreve të rastësishme është e ngushtë, por jo për drejtimin e saj. Koeficienti i korrelacionit të shumëfishtë mund të rritet vetëm nëse në model përfshihen variabla shtesë dhe nuk do të rritet nëse përjashtohet ndonjë nga karakteristikat ekzistuese.

Kontrollimi i rëndësisë së koeficientit të përcaktimit kryhet duke krahasuar vlerën e llogaritur të kriterit të Fisher's /'

me tabela F rabl. Vlera tabelare e kriterit (shih Shtojcën 1) përcaktohet nga niveli i dhënë i rëndësisë a dhe shkallët e lirisë v l = mnv 2 = n-m-l. Koeficient R 2është dukshëm i ndryshëm nga zero nëse pabarazia qëndron

Nëse variablat e rastësishëm në shqyrtim lidhen me njëra-tjetrën atëherë vlera e koeficientit të korrelacionit të çiftit ndikohet pjesërisht nga ndikimi i madhësive të tjera. Në këtë drejtim, ekziston nevoja për të studiuar korrelacionin e pjesshëm midis sasive duke përjashtuar ndikimin e variablave të tjerë të rastësishëm (një ose më shumë).

Shembull i koeficientit të korrelacionit të pjesshëm përcaktuar nga formula

Ku R Jk, Rjj, R kk - shtesat algjebrike në elementet përkatëse të matricës R[cm. formula (3.2.6)].

Koeficienti i korrelacionit të pjesshëm, si dhe koeficienti i korrelacionit të çiftit, varion nga -1 në +1.

Shprehja (3.2.9) subjekt i t = 3 do të duket si

Quhet koeficienti r 12(3). koeficienti i korrelacionit midis x ( Dhe x 2 për x y fikse Ai është simetrik në lidhje me indekset parësore 1, 2. Indeksi i tij dytësor 3 i referohet një ndryshoreje fikse.

Shembulli 3.2.1. Llogaritja e koeficientëve të çiftit,

korrelacion i shumëfishtë dhe i pjesshëm.

Në tabelë 3.2.2 jep informacion mbi vëllimet e shitjeve dhe kostot e reklamave të një kompanie, si dhe indeksin e shpenzimeve të konsumatorit për një numër vitesh aktuale.

  • 1. Ndërtoni një diagramë shpërndarjeje (fushë korrelacioni) për variablat “vëllimi i shitjeve” dhe “indeksi i shpenzimeve të konsumatorit”.
  • 2. Përcaktoni shkallën e ndikimit të indeksit të shpenzimeve konsumatore në vëllimin e shitjeve (llogaritni koeficientin e korrelacionit të çiftit).
  • 3. Vlerësoni rëndësinë e koeficientit të korrelacionit të çiftit të llogaritur.
  • 4. Ndërtoni një matricë të koeficientëve të korrelacionit në çift për tre variabla.
  • 5. Gjeni një vlerësim të koeficientit të korrelacionit të shumëfishtë.
  • 6. Gjeni vlerësimet e koeficientëve të korrelacionit të pjesshëm.

1. Në shembullin tonë, diagrami i shpërndarjes ka formën e treguar në Fig. 3.2.1. Zgjatimi i resë së pikave në diagramin e shpërndarjes përgjatë vijës së pjerrët na lejon të supozojmë se ekziston një tendencë objektive për një marrëdhënie të drejtpërdrejtë lineare midis vlerave të variablave. X 2 Y(vëllimi i shitjeve).

Oriz. 3.2.1.

2. Llogaritjet e ndërmjetme gjatë llogaritjes së koeficientit të korrelacionit ndërmjet variablave X 2(Indeksi i Shpenzimeve të Konsumatorit) dhe Y(vëllimi i shitjeve) janë dhënë në tabelë. 3.2.3.

Vlerat mesatare variablat e rastësishëm X 2 Dhe Y, cilët janë treguesit më të thjeshtë që karakterizojnë sekuencat jCj, x 2,..., x 16 dhe y v y 2,..., y 16, llogaritni duke përdorur formulat e mëposhtme:


Vëllimi i shitjeve Y, mijë rubla.

Indeksi

konsumojnë

telesky

shpenzimet

Vëllimi i shitjeve Y, mijë rubla.

Indeksi

konsumojnë

telesky

shpenzimet

Tabela 3.2.3

l:, - X

(DHE - U)(x, - x)

(x, - x) 2

(y, - - y) 2

Dispersion karakterizon shkallën e përhapjes së vlerave x v x 2,x:

Le të shqyrtojmë tani zgjidhjen e shembullit 3.2.1 në Excel.

Për të llogaritur korrelacionin duke përdorur Excel, mund të përdorni funksionin =correl(), duke specifikuar adresat e dy kolonave të numrave, siç tregohet në Fig. 3.2.2. Përgjigja vendoset në D8 dhe është e barabartë me 0,816.

Oriz. 3.2.2.

(Shënim: Argumentet e funksionit korrelët duhet të jenë numra ose emra, vargje ose referenca që përmbajnë numra. Nëse argumenti, i cili është një grup ose referencë, përmban tekst, vlera boolean ose qeliza boshe, atëherë vlerat e tilla injorohen; megjithatë, numërohen qelizat që përmbajnë vlera zero.

Nëse array! dhe array2 kanë numër të ndryshëm pikash të dhënash, pastaj funksioni correl kthen vlerën e gabimit #n/a.

Nëse grupi1 ose grupi2 është bosh ose nëse o (devijimi standard) i vlerave të tyre është zero, atëherë funksioni correl kthen vlerën e gabimit #div/0!.)

Vlera kritike e statistikës t Studentit mund të merret edhe duke përdorur funksionin Shpërndarja e 1 paketës Excel. Si argumente funksioni, duhet të specifikoni numrin e shkallëve të lirisë të barabartë me P- 2 (në shembullin tonë 16 - 2= 14) dhe niveli i rëndësisë a (në shembullin tonë a = 0.1) (Fig. 3.2.3). Nëse vlera aktuale/-statistikat e marra moduli është më i madh kritike, atëherë me probabilitetin (1 - a) koeficienti i korrelacionit është dukshëm i ndryshëm nga zero.


Oriz. 3.2.3. Vlera kritike e statistikës / është 1.7613

Excel përfshin një grup mjetesh të analizës së të dhënave (të ashtuquajturat paketa analizuese) të dizajnuara për të zgjidhur probleme të ndryshme statistikore. Për të llogaritur matricën e koeficientëve të korrelacionit të çiftit R duhet të përdorni veglën Correlation (Fig. 3.2.4) dhe të vendosni parametrat e analizës në dialog box-in përkatës. Përgjigja do të vendoset në një fletë të re pune (Fig. 3.2.5).

1 Në Excel 2010, emri i funksionit studrasprobr u ndryshua në stu-

DENT.OBR.2X.

Oriz. 3.2.4.


Oriz. 3.2.5.

  • Themelues të teorisë së korrelacionit konsiderohen statisticienët anglezë F. Galton (1822-1911) dhe K. Pearson (1857-1936). Termi "korrelacion" është huazuar nga shkenca natyrore dhe do të thotë "korrelacion, korrespondencë". Ideja e korrelacionit si ndërvarësi midis variablave të rastësishëm qëndron në themel të teorisë matematiko-statistikore të korrelacionit.

Të dhënat për vitin 2011 janë dhënë për territoret e Qarkut Federal Jugor të Federatës Ruse

Territoret e Qarkut Federal

Produkti bruto rajonal, miliardë rubla, Y

Investimet në asete fikse, miliardë rubla, X1

1. Rep. Adygea

2. Rep. Dagestan

3. Rep. Ingushetia

4. Republika Kabardino-Balkariane

5. Rep. Kalmykia

6. Republika Karachay-Cerkess

7. Rep. Osetia e Veriut Alania

8. Rajoni i Krasnodarit)

9. Rajoni i Stavropolit

10. Rajoni Astrakhan.

11. Rajoni i Volgogradit.

12. Rajoni i Rostovit.

  • 1. Njehsoni matricën e koeficientëve të korrelacionit të çiftit; vlerësoni rëndësinë statistikore të koeficientëve të korrelacionit.
  • 2. Ndërtoni një fushë korrelacioni midis karakteristikës efektive dhe faktorit që lidhet më ngushtë me të.
  • 3. Llogaritni parametrat e regresionit të çiftit linear për secilin faktor X.
  • 4. Vlerësoni cilësinë e secilit model nëpërmjet koeficientit të përcaktimit, gabimit mesatar të përafrimit dhe testit Fisher's F. Zgjidhni modelin më të mirë.

do të jetë 80% e vlerës së tij maksimale. Paraqitni grafikisht: vlerat aktuale dhe modelore, pikat e parashikimit.

  • 6. Duke përdorur regresionin e shumëfishtë hap pas hapi (metoda e përjashtimit ose metoda e përfshirjes), ndërtoni një model të formimit të çmimit të apartamenteve për shkak të faktorëve të rëndësishëm. Jepni një interpretim ekonomik të koeficientëve të modelit të regresionit.
  • 7. Vlerësoni cilësinë e modelit të ndërtuar. A është përmirësuar cilësia e modelit në krahasim me modelin me një faktor? Vlerësoni ndikimin e faktorëve të rëndësishëm në rezultat duke përdorur koeficientët e elasticitetit, në - dhe -? koeficientët

Kur zgjidhim këtë problem, ne do të kryejmë llogaritjet dhe do të ndërtojmë grafikë dhe diagrame duke përdorur cilësimet e Excel Data Analysis.

1. Llogaritni matricën e koeficientëve të korrelacionit në çift dhe vlerësoni rëndësinë statistikore të koeficientëve të korrelacionit

Në kutinë e dialogut Korrelacioni, në fushën e intervalit të hyrjes, futni gamën e qelizave që përmbajnë të dhënat burimore. Meqenëse kemi zgjedhur edhe titujt e kolonave, ne kontrollojmë kutinë e zgjedhjes Labels në rreshtin e parë.

Ne morëm rezultatet e mëposhtme:

Tabela 1.1 Matrica e koeficientëve të korrelacionit të çiftit

Analiza e matricës së koeficientëve të korrelacionit në çift tregon se ndryshorja e varur Y, pra produkti bruto rajonal, ka një lidhje më të ngushtë me X1 (investimi në kapitalin fiks). Koeficienti i korrelacionit është 0.936. Kjo do të thotë se 93.6% e variablit të varur Y (produkti bruto rajonal) varet nga treguesi X1 (investimi në kapitalin fiks).

Do të përcaktojmë rëndësinë statistikore të koeficientëve të korrelacionit duke përdorur T-testin Student. Krahasojmë vlerën e tabelës me vlerat e llogaritura.

Le të llogarisim vlerën e tabelës duke përdorur funksionin STUDISCOVER.

tabela t = 0,129 me një nivel besimi 0,9 dhe shkallë lirie (n-2).

Faktori X1 është statistikisht i rëndësishëm.

2. Le të ndërtojmë një fushë korrelacioni midis atributit efektiv (produkti bruto rajonal) dhe faktorit më të lidhur me të (investimi në kapitalin fiks)

Për ta bërë këtë, ne do të përdorim mjetin Excel scatter gratis.

Si rezultat, marrim një fushë korrelacioni për çmimin e produktit bruto rajonal, miliardë rubla. dhe investime në asete fikse, miliardë rubla. (Figura 1.1.).

Figura 1.1

3. Llogaritni parametrat e regresionit të çiftit linear për secilin faktor X

Për të llogaritur parametrat e regresionit linear në çift, ne do të përdorim mjetin e Regresionit të përfshirë në cilësimin e Analizës së të Dhënave.

Në kutinë e dialogut Regresioni, në fushën e intervalit të hyrjes Y, vendosni adresën e gamës së qelizave që përfaqëson variabla e varur. Në fushë

Intervali i hyrjes X futim adresën e diapazonit që përmban vlerat e variablave të pavarur. Le të llogarisim parametrat e regresionit të çiftëzuar për faktorin X.

Për X1 kemi marrë të dhënat e mëposhtme të paraqitura në Tabelën 1.2:

Tabela 1.2

Ekuacioni i regresionit për varësinë e çmimit të produktit bruto rajonal nga investimi në kapitalin fiks ka formën:

4. Le të vlerësojmë cilësinë e secilit model nëpërmjet koeficientit të përcaktimit, gabimit mesatar të përafrimit dhe testit F Fisher. Le të përcaktojmë se cili model është më i miri.

Ne kemi marrë koeficientin e përcaktimit, gabimin mesatar të përafrimit, si rezultat i llogaritjeve të kryera në paragrafin 3. Të dhënat e marra janë paraqitur në tabelat e mëposhtme:

Të dhënat X1:

Tabela 1.3a

Tabela 1.4b

A) Koeficienti i përcaktimit përcakton se çfarë proporcioni i variacionit të tiparit Y merret parasysh në model dhe është për shkak të ndikimit të faktorit X në të. Sa më e madhe të jetë vlera e koeficientit të përcaktimit, aq më e ngushtë është lidhja midis tipare në modelin e ndërtuar matematikor.

Excel i referohet R-katrorit.

Bazuar në këtë kriter, modeli më adekuat është ekuacioni i regresionit të varësisë së çmimit të produktit bruto rajonal nga investimi në kapitalin fiks (X1).

B) Ne llogarisim gabimin mesatar të përafrimit duke përdorur formulën:

ku numëruesi është shuma e katrorëve të devijimit të vlerave të llogaritura nga ato aktuale. Në tabela ndodhet në kolonën SS, rreshti Remaining.

Ne llogarisim çmimin mesatar të një apartamenti në Excel duke përdorur funksionin AVERAGE. = 24,18182 miliardë rubla.

Gjatë kryerjes së llogaritjeve ekonomike, një model konsiderohet mjaft i saktë nëse gabimi mesatar i përafrimit është më i vogël se 5%, modeli konsiderohet i pranueshëm nëse gabimi mesatar i përafrimit është më i vogël se 15%.

Sipas këtij kriteri, më adekuat është modeli matematik për ekuacionin e regresionit të varësisë së çmimit të produktit bruto rajonal nga investimi në kapitalin fiks (X1).

C) F-testi përdoret për të testuar rëndësinë e modelit të regresionit. Për ta bërë këtë, bëhet edhe një krahasim i vlerave kritike (tabelore) të testit Fisher F.

Vlerat e llogaritura janë dhënë në tabelat 1.4b (të treguara me shkronjën F).

Ne do të llogarisim vlerën tabelare të testit F Fisher në Excel duke përdorur funksionin FDIST. Le të marrim probabilitetin e barabartë me 0.05. Marrë: = 4,75

Vlerat e llogaritura të testit Fisher F për secilin faktor janë të krahasueshme me vlerën e tabelës:

71.02 > = 4.75 modeli është adekuat sipas këtij kriteri.

Pasi i kemi analizuar të dhënat sipas të tre kritereve, mund të konkludojmë se modeli më i mirë matematikor është ndërtuar për faktorin bruto të produktit rajonal, i cili përshkruhet nga ekuacioni linear.

5. Për modelin e zgjedhur të varësisë së çmimit të produktit bruto rajonal

Ne do të parashikojmë vlerën mesatare të treguesit në një nivel të rëndësisë nëse vlera e parashikuar e faktorit është 80% e vlerës maksimale të tij. Le ta paraqesim grafikisht: vlerat aktuale dhe modelore, pikat e parashikimit.

Le të llogarisim vlerën e parashikuar të X; sipas kushtit, ajo do të jetë 80% e vlerës maksimale.

Le të llogarisim X max në Excel duke përdorur funksionin MAX.

0,8 *52,8 = 42,24

Për të marrë vlerësime parashikuese të ndryshores së varur, ne zëvendësojmë vlerën e fituar të ndryshores së pavarur në ekuacionin linear:

5.07 + 2.14 * 42.24 = 304.55 miliardë rubla.

Le të përcaktojmë intervalin e besimit të parashikimit, i cili do të ketë kufijtë e mëposhtëm:

Për të llogaritur intervalin e besimit për vlerën e parashikuar, ne llogarisim devijimin nga vija e regresionit.

Për një model regresioni të çiftuar, vlera e devijimit llogaritet:

ato. vlera standarde e gabimit nga tabela 1.5a.

(Meqenëse numri i shkallëve të lirisë është i barabartë me një, emëruesi do të jetë i barabartë me n-2). Parashikimi i regresionit të çiftit të korrelacionit

Për të llogaritur koeficientin, do të përdorim funksionin Excel STUDISCOVER, do të marrim probabilitetin e barabartë me 0.1 dhe numrin e shkallëve të lirisë 38.

Ne llogarisim vlerën duke përdorur Excel dhe marrim 12294.


Le të përcaktojmë kufijtë e sipërm dhe të poshtëm të intervalit.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Kështu, vlera e parashikuar = 304.55 mijë dollarë do të jetë ndërmjet kufirit të poshtëm të barabartë me 277.078 mijë dollarë. dhe një kufi i sipërm i barabartë me 332.022 miliardë. Fërkim.

Vlerat aktuale dhe të modelit, pikat e parashikimit janë paraqitur grafikisht në Figurën 1.2.


Figura 1.2

6. Duke përdorur regresionin e shumëfishtë hap pas hapi (metoda e eliminimit), do të ndërtojmë një model për formimin e çmimit të produktit bruto rajonal për shkak të faktorëve të rëndësishëm.

Për të ndërtuar regresion të shumëfishtë, ne do të përdorim funksionin e Regresionit të Excel, duke përfshirë të gjithë faktorët. Si rezultat, marrim tabelat e rezultateve, nga të cilat na duhet testi i Studentit t-test.

Tabela 1.8a

Tabela 1.8b

Tabela 1.8c.

Ne marrim një model si:

Sepse< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Le të zgjedhim vlerën më të vogël absolute të testit t Studentit, është e barabartë me 8,427, ta krahasojmë me vlerën e tabelës, të cilën e llogarisim në Excel, marrim nivelin e rëndësisë të barabartë me 0,10, numrin e shkallëve të lirisë n-m-1= 12-4=8: =1,8595

Meqenëse 8.427>1.8595 modeli duhet të konsiderohet adekuat.

7. Për të vlerësuar faktorin domethënës të modelit matematikor që rezulton, ne llogarisim koeficientët e elasticitetit, dhe - koeficientët

Koeficienti i elasticitetit tregon se me çfarë përqindje do të ndryshojë atributi efektiv kur atributi i faktorit ndryshon me 1%:

E X4 = 2,137 * (10,69/24,182) = 0,94%

Kjo do të thotë, me një rritje të investimeve në kapitalin fiks prej 1%, kostoja mesatarisht rritet me 0.94%.

Koeficienti tregon se me cilën pjesë të devijimit standard ndryshon vlera mesatare e ndryshores së varur me një ndryshim në variablin e pavarur me një devijim standard.

2,137* (14.736/33,632) = 0,936.

Të dhënat e devijimit standard merren nga tabelat e marra duke përdorur veglën e statistikave përshkruese.

Tabela 1.11 Statistikat përshkruese (Y)

Tabela 1.12 Statistikat përshkruese (X4)

Koeficienti përcakton pjesën e ndikimit të faktorit në ndikimin total të të gjithë faktorëve:

Për të llogaritur koeficientët e korrelacionit të çifteve, ne llogarisim matricën e koeficientëve të korrelacionit të çifteve në Excel duke përdorur mjetin Korrelacion në cilësimet e Analizës së të Dhënave.

Tabela 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Konkluzioni: Nga llogaritjet e marra mund të konkludojmë se atributi efektiv Y (produkti bruto rajonal) ka një varësi të madhe nga faktori X1 (investimet në kapitalin fiks) (me 100%).

Bibliografi

  • 1. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ekonometria. Kursi fillestar. Tutorial. botimi i 2-të. - M.: Delo, 1998. - f. 69-74.
  • 2. Punëtori për ekonometrinë: Libër mësuesi / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko et al 2002. - f. 49 - 105.
  • 3. Dougherty K. Hyrje në ekonometri: Përkth. nga anglishtja - M.: INFRA-M, 1999. - XIV, f. 262 - 285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Matematika e aplikuar dhe bazat e ekonometrisë. -1998., fq 115-147.
  • 5. Kremer N.Sh., Putko B.A. Ekonometria. -2007. nga 175-251.
y x (1) x (2) x (3) x (4) x (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

Analiza e matricës së koeficientëve të korrelacionit të çiftëzuar tregon se treguesi efektiv është më i lidhur me treguesin. x(4) - sasia e plehut të konsumuar për 1 hektar ().

Në të njëjtën kohë, lidhja midis atributeve-argumenteve është mjaft e ngushtë. Kështu, ekziston një marrëdhënie praktikisht funksionale midis numrit të traktorëve me rrota ( x(1)) dhe numri i mjeteve të lëvrimit sipërfaqësor .

Prania e multikolinearitetit tregohet edhe nga koeficientët e korrelacionit dhe . Duke marrë parasysh marrëdhënien e ngushtë ndërmjet treguesve x (1) , x(2) dhe x(3), vetëm njëri prej tyre mund të përfshihet në modelin e regresionit të rendimentit.

Për të demonstruar ndikimin negativ të shumëkolinearitetit, merrni parasysh një model regresioni të rendimentit, duke përfshirë të gjithë treguesit e hyrjes:

F obs = 121.

Vlerat e vlerësimeve të korrigjuara të devijimeve standarde të vlerësimeve të koeficientëve të ekuacionit tregohen në kllapa .

Parametrat e mëposhtëm të mjaftueshmërisë janë paraqitur nën ekuacionin e regresionit: koeficienti i shumëfishtë i përcaktimit; Vlerësimi i korrigjuar i variancës së mbetur, gabimi mesatar relativ i përafrimit dhe vlera e llogaritur e kriterit F obs = 121.

Ekuacioni i regresionit është i rëndësishëm sepse F obs = 121 > F kp = 2,85 gjetur nga tabela F-shpërndarjet në a=0.05; n 1 =6 dhe n 2 =14.

Nga kjo rezulton se Q10, d.m.th. dhe të paktën një nga koeficientët e ekuacionit q j (j= 0, 1, 2, ..., 5) nuk është zero.

Për të testuar hipotezën për rëndësinë e koeficientëve individualë të regresionit H0: q j =0, ku j=1,2,3,4,5, krahasoni vlerën kritike t kp = 2.14, e gjetur nga tabela t-shpërndarjet në nivelin e rëndësisë a=2 P=0.05 dhe numri i shkallëve të lirisë n=14, me vlerën e llogaritur . Nga ekuacioni rezulton se koeficienti i regresionit është statistikisht i rëndësishëm vetëm kur x(4) që nga ½ t 4 ½=2,90 > t kp =2,14.



Shenjat negative të koeficientëve të regresionit nuk i nënshtrohen interpretimit ekonomik kur x(1) dhe x(5) . Nga vlerat negative të koeficientëve rezulton se rritja e ngopjes së bujqësisë me traktorë me rrota ( x(1)) dhe produktet e shëndetit të bimëve ( x(5)) ka një efekt negativ në rendiment. Prandaj, ekuacioni i regresionit që rezulton është i papranueshëm.

Për të marrë një ekuacion regresioni me koeficientë të rëndësishëm, ne përdorim një algoritëm të analizës së regresionit hap pas hapi. Fillimisht, ne përdorim një algoritëm hap pas hapi me eliminimin e variablave.

Le të përjashtojmë variablin nga modeli x(1) , që korrespondon me vlerën minimale absolute prej ½ t 1 ½=0.01. Për variablat e mbetur, ne përsëri ndërtojmë ekuacionin e regresionit:

Ekuacioni që rezulton është i rëndësishëm sepse F e vrojtuar = 155 > F kp = 2,90, e gjetur në nivelin e rëndësisë a = 0,05 dhe numrat e shkallëve të lirisë n 1 = 5 dhe n 2 = 15 sipas tabelës F-shpërndarja, d.m.th. vektor q¹0. Megjithatë, vetëm koeficienti i regresionit në x(4) . Vlerat e parashikuara ½ t j ½ për koeficientët e tjerë është më pak t kr = 2.131, e gjetur nga tabela t-shpërndarjet në a=2 P=0.05 dhe n=15.

Duke përjashtuar variablin nga modeli x(3) , që korrespondon me vlerën minimale t 3 = 0,35 dhe marrim ekuacionin e regresionit:

(2.9)

Në ekuacionin që rezulton, koeficienti në x(5) . Duke përjashtuar x(5) marrim ekuacionin e regresionit:

(2.10)

Ne morëm një ekuacion të rëndësishëm regresioni me koeficientë domethënës dhe të interpretueshëm.

Megjithatë, ekuacioni që rezulton nuk është modeli i vetëm "i mirë" dhe jo "më i mirë" i rendimentit në shembullin tonë.

Le ta tregojmë atë në kushtin e shumëkolinearitetit, një algoritëm hap pas hapi me përfshirjen e variablave është më efikas. Hapi i parë në modelin e rendimentit y variabël i përfshirë x(4) , e cila ka koeficientin më të lartë të korrelacionit me y, shpjegohet me variablin - r(y,x(4))=0,58. Në hapin e dytë, duke përfshirë ekuacionin së bashku me x(4) variabla x(1) ose x(3), do të marrim modele që, për arsye ekonomike dhe karakteristika statistikore, tejkalojnë (2.10):

(2.11)

(2.12)

Përfshirja e ndonjë prej tre variablave të mbetur në ekuacion përkeqëson vetitë e tij. Shih, për shembull, ekuacionin (2.9).

Pra, kemi tre modele të rendimentit “të mirë”, nga të cilët duhet të zgjedhim një për arsye ekonomike dhe statistikore.

Sipas kritereve statistikore, modeli (2.11) është më adekuat. Ai korrespondon me vlerat minimale të variancës së mbetur = 2.26 dhe gabimit mesatar relativ të përafrimit dhe vlerave më të mëdha dhe Fob = 273.

Modeli (2.12) ka tregues pak më të keq të mjaftueshmërisë, i ndjekur nga modeli (2.10).

Tani do të zgjedhim modelet më të mira (2.11) dhe (2.12). Këto modele ndryshojnë nga njëri-tjetri për sa i përket variablave x(1) dhe x(3) . Megjithatë, në modelet e rendimentit ndryshorja x(1) (numri i traktorëve me rrota për 100 ha) është më i preferueshëm se i ndryshueshëm x(3) (numri i mjeteve të lëvrimit sipërfaqësor për 100 ha), i cili është në një farë mase dytësore (ose rrjedh nga x (1)).

Në këtë drejtim, për arsye ekonomike, përparësi duhet t'i jepet modelit (2.12). Kështu, pas zbatimit të algoritmit të analizës së regresionit hap pas hapi me përfshirjen e variablave dhe duke marrë parasysh faktin se vetëm një nga tre variablat e lidhur duhet të hyjë në ekuacion ( x (1) , x(2) ose x(3)) zgjidhni ekuacionin përfundimtar të regresionit:

Ekuacioni është i rëndësishëm në a=0.05, sepse F obs = 266 > F kp = 3.20, e gjetur nga tabela F-shpërndarjet në a= P=0,05; n 1 =3 dhe n 2 =17. Të gjithë koeficientët e regresionit në ekuacionin ½ janë gjithashtu domethënës t j½> t kp(a=2 P=0,05; n=17)=2.11. Koeficienti i regresionit q 1 duhet të konsiderohet i rëndësishëm (q 1 ¹0) për arsye ekonomike, ndërsa t 1 = 2.09 vetëm pak më pak t kp = 2,11.

Nga ekuacioni i regresionit rezulton se një rritje me një në numrin e traktorëve për 100 hektarë tokë arë (me një vlerë fikse x(4)) çon në një rritje të rendimentit të grurit me një mesatare prej 0,345 c/ha.

Një llogaritje e përafërt e koeficientëve të elasticitetit e 1 »0.068 dhe e 2 »0.161 tregon se me rritjen e treguesve x(1) dhe x(4) me 1%, rendimenti i grurit rritet mesatarisht përkatësisht me 0,068% dhe 0,161%.

Koeficienti i shumëfishtë i përcaktimit tregon se vetëm 46.9% e variacionit të rendimentit shpjegohet nga treguesit e përfshirë në model ( x(1) dhe x(4)), domethënë ngopja e prodhimit bimor me traktorë dhe plehra. Pjesa tjetër e variacionit është për shkak të veprimit të faktorëve të pa llogaritur ( x (2) , x (3) , x(5), kushtet e motit, etj.). Gabimi mesatar relativ i përafrimit karakterizon përshtatshmërinë e modelit, si dhe vlerën e variancës së mbetur. Kur interpretohet ekuacioni i regresionit, vlerat e gabimeve relative të përafrimit janë me interes . Le të kujtojmë se - vlera e modelit të treguesit efektiv karakterizon vlerën mesatare të rendimentit për tërësinë e rajoneve në shqyrtim, me kusht që vlerat e variablave shpjegues x(1) dhe x(4) janë fiksuar në të njëjtin nivel, domethënë x (1) = x i(1) dhe x (4) = x i(4) . Më pas, sipas vlerave të d i Ju mund të krahasoni rajonet sipas rendimentit. Zonat me të cilat korrespondojnë vlerat d i>0, kanë rendiment mbi mesataren dhe d i<0 - ниже среднего.

Në shembullin tonë, për sa i përket rendimentit, prodhimi bimor është më efektiv në zonën që korrespondon me d 7 =28%, ku rendimenti është 28% më i lartë se mesatarja rajonale, dhe më pak efektiv është në zonën me d 20 =-27,3%.


Detyrat dhe ushtrimet

2.1. Nga popullata e përgjithshme ( y, x (1) , ..., x(p)), ku y ka një ligj të shpërndarjes normale me pritshmëri matematikore të kushtëzuar dhe variancë s 2, një kampion i rastësishëm i n, lere te shkoje ( y i, x i (1) , ..., x i(p)) - rezultat i vëzhgimi i th ( i=1, 2, ..., n). Përcaktoni: a) pritshmërinë matematikore të vlerësimit të katrorëve më të vegjël të vektorit q; b) matricën e kovariancës së vlerësimit të katrorëve më të vegjël të vektorit q; c) pritshmëria matematikore e vlerësimit.

2.2. Sipas kushteve të problemës 2.1, gjeni pritshmërinë matematikore të shumës së devijimeve në katror për shkak të regresionit, d.m.th. EQ R, Ku

.

2.3. Sipas kushteve të problemit 2.1, përcaktoni pritshmërinë matematikore të shumës së devijimeve në katror të shkaktuara nga ndryshimi i mbetur në raport me vijat e regresionit, d.m.th. EQ ost, ku

2.4. Vërtetoni se kur plotësohet hipoteza H 0: statistika q=0

ka një shpërndarje F me shkallë lirie n 1 =p+1 dhe n 2 =n-p-1.

2.5. Vërtetoni se kur plotësohet hipoteza H 0: q j =0, statistika ka një shpërndarje t me numrin e shkallëve të lirisë n=n-p-1.

2.6. Bazuar në të dhënat (Tabela 2.3) mbi varësinë e tkurrjes së bukës foragjere ( y) në kohëzgjatjen e ruajtjes ( x) gjeni një vlerësim pikësor të pritshmërisë së kushtëzuar nën supozimin se ekuacioni i përgjithshëm i regresionit është linear.

Tabela 2.3.

Kërkohet: a) të gjeni vlerësimet e variancës së mbetur s 2 me supozimin se ekuacioni i përgjithshëm i regresionit ka formën ; b) kontrolloni në a=0.05 rëndësinë e ekuacionit të regresionit, d.m.th. hipoteza H 0: q=0; c) me besueshmëri g=0,9, të përcaktojë vlerësimet e intervalit të parametrave q 0, q 1; d) me besueshmëri g=0,95, përcaktoni vlerësimin e intervalit të pritshmërisë matematikore të kushtëzuar në X 0 =6; e) përcaktoni në g=0.95 intervalin e besueshmërisë së parashikimit në pikë X=12.

2.7. Bazuar në të dhënat për dinamikën e ritmit të rritjes së çmimeve të aksioneve për 5 muaj, të dhëna në tabelë. 2.4.

Tabela 2.4.

muaj ( x)
y (%)

dhe me supozimin se ekuacioni i përgjithshëm i regresionit ka formën , kërkohet: a) të përcaktohen vlerësimet si të parametrave të ekuacionit të regresionit ashtu edhe të variancës së mbetur s 2 ; b) kontrolloni në a=0.01 rëndësinë e koeficientit të regresionit, d.m.th. hipotezat H 0: q 1 =0;

c) me besueshmëri g=0,95, gjeni vlerësimet e intervalit të parametrave q 0 dhe q 1; d) me besueshmëri g=0.9, vendosni një vlerësim interval të pritshmërisë matematikore të kushtëzuar në x 0 =4; e) përcaktoni në g=0.9 intervalin e besueshmërisë së parashikimit në pikë x=5.

2.8. Rezultatet e studimit të dinamikës së shtimit në peshë të kafshëve të reja janë dhënë në tabelën 2.5.

Tabela 2.5.

Duke supozuar se ekuacioni i përgjithshëm i regresionit është linear, kërkohet: a) të përcaktohen vlerësimet si të parametrave të ekuacionit të regresionit ashtu edhe të variancës së mbetur s 2 ; b) kontrolloni në a=0.05 rëndësinë e ekuacionit të regresionit, d.m.th. hipotezat H 0: q=0;

c) me besueshmëri g=0,8, gjeni vlerësimet e intervalit të parametrave q 0 dhe q 1; d) me besueshmëri g=0,98, përcaktojnë dhe krahasojnë vlerësimet e intervalit të pritshmërisë matematikore të kushtëzuar në x 0 =3 dhe x 1 =6;

e) përcaktoni në g=0.98 intervalin e besueshmërisë së parashikimit në pikë x=8.

2.9. Kostoja ( y) një kopje të librit në varësi të tirazhit ( x) (mijë kopje) karakterizohet nga të dhënat e mbledhura nga shtëpia botuese (Tabela 2.6). Përcaktoni vlerësimet e katrorëve më të vegjël dhe parametrat e një ekuacioni të regresionit hiperbolik, me besueshmëri g=0,9, ndërtoni intervale besimi për parametrat q 0 dhe q 1, si dhe pritshmërinë e kushtëzuar në x=10.

Tabela 2.6.

Përcaktoni vlerësimet dhe parametrat e ekuacionit të regresionit të formularit, provoni hipotezën H 0 në a = 0,05: q 1 = 0 dhe ndërtoni intervale besimi me besueshmëri g = 0,9 për parametrat q 0 dhe q 1 dhe pritshmërinë matematikore të kushtëzuar në x=20.

2.11. Në tabelë 2.8 paraqiti të dhëna për ritmet e rritjes (%) të treguesve makroekonomikë të mëposhtëm n=10 vende të zhvilluara të botës për vitin 1992: GNP - x(1) , prodhimi industrial - x(2), indeksi i çmimeve - x (3) .

Tabela 2.8.

shtetet x dhe parametrat e ekuacionit të regresionit, vlerësimi i variancës së mbetur; b) kontrolloni në a=0.05 rëndësinë e koeficientit të regresionit, d.m.th. H0: q1 =0; c) me besueshmëri g=0.9, gjeni vlerësimet e intervalit q 0 dhe q 1; d) gjeni në g=0.95 intervalin e besimit për në pikë X 0 =x i, Ku i=5; e) krahasoni karakteristikat statistikore të ekuacioneve të regresionit: 1, 2 dhe 3.

2.12. Zgjidheni problemin 2.11 duke marrë ( ) indeksi x(1) , dhe për shpjegimin ( X) variabël x (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Statistikat e aplikuara dhe bazat e ekonometrisë: Libër mësuesi. M., UNITET, 1998 (botimi i dytë 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Statistikat e zbatuara në problema dhe ushtrime: Teksti mësimor. M. BASHKIMI - DANA, 2001;

3. Ayvazyan S.A., Enyukov I.S., Meshalkin L.D. Statistikat e aplikuara. Hulumtimi i varësisë. M., Financa dhe statistika, 1985, 487 f.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov I.S., Meshalkin L.D. Statistikat e aplikuara. Klasifikimi dhe zvogëlimi i dimensioneve. M., Financa dhe Statistikat, 1989, 607 f.;

5. Johnston J. Metodat ekonometrike, M.: Statistics, 1980, 446 pp.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Metodat statistikore me shumë variacione. M., Financa dhe Statistikat, 2000;

7. Mkhitaryan V.S., Troshin L.I. Studimi i varësive duke përdorur metodat e korrelacionit dhe regresionit. M., MESI, 1995, 120 fq.;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Metodat statistikore multivariate në ekonomi. M., MESI, 1995, 149 f.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Statistikat matematikore për biznesmenët dhe menaxherët. M., MESI, 2000, 140 fq.;

10. Lukashin Yu.I. Metodat e parashikimit të regresionit dhe adaptive: Teksti mësimor, M., MESI, 1997.

11. Lukashin Yu.I. Metodat adaptive të parashikimit afatshkurtër. - M., Statistika, 1979.


APLIKACIONET


Shtojca 1. Opsione për detyra për kërkime të pavarura kompjuterike.

KATEGORITË

ARTIKUJ POPULLOR

2023 "kingad.ru" - ekzaminimi me ultratinguj i organeve të njeriut