Este dată o matrice de coeficienți de corelație de pereche. Construirea unei matrice de coeficienți de corelație de perechi

Z 1 (t)

Z 2 (t)

t

YT)

Z 1 (t)

Z 2 (t)

t

YT)

Sarcina principală cu care se confruntă selecția factorilor incluși în modelul de corelație este de a introduce în analiză toți principalii factori care influențează nivelul fenomenului studiat. Cu toate acestea, introducerea unui număr mare de factori în model este nepractică; este mai corect să selectați doar un număr relativ mic de factori principali care probabil sunt în corelație cu indicatorul funcțional selectat.

Acest lucru se poate face folosind așa-numita selecție în două etape. În conformitate cu acesta, toți factorii preselectați sunt incluși în model. Apoi, printre aceștia, pe baza unei evaluări cantitative speciale și a unei analize calitative suplimentare, se identifică factorii care influențează nesemnificativ, care sunt îndepărtați treptat până când rămân cei pentru care se poate susține că materialul statistic disponibil este în concordanță cu ipoteza comună a acestora. influență semnificativă asupra variabilei dependente cu forma de conexiune aleasă.

Selecția în două etape a primit expresia cea mai completă în tehnica așa-numitei analize de regresie în mai multe etape, în care eliminarea factorilor neimportanti are loc pe baza indicatorilor semnificației lor, în special pe baza valorii t f - valoarea calculată a testului Studentului.

Să calculăm t f folosind coeficienții de corelație de pereche găsiți și să-i comparăm cu t critic pentru un nivel de semnificație de 5% (două fețe) și 18 grade de libertate (ν = n-2).

unde r este valoarea coeficientului de corelație de pereche;

n – numărul de observații (n=20)

Când se compară t f pentru fiecare coeficient cu t cr = 2,101 constatăm că coeficienţii găsiţi sunt consideraţi semnificativi, deoarece t f > t cr.

t f pentru r yx 1 = 2, 5599 ;

t f pentru r yx 2 = 7,064206 ;

t f pentru r yx 3 = 2,40218 ;

t f pentru r x1 x 2 = 4,338906 ;

t f pentru r x1 x 3 = 15,35065;

t f pentru r x2 x 3 = 4,749981

La selectarea factorilor care urmează să fie incluși în analiză, acestora li se impun cerințe specifice. În primul rând, indicatorii care exprimă acești factori trebuie să fie măsurabili cantitativ.

Factorii incluși în model nu ar trebui să fie într-o relație funcțională sau strânsă între ei. Prezența unor astfel de relații este caracterizată de multicoliniaritate.

Multicolinearitatea indică faptul că unii factori caracterizează unul și același aspect al fenomenului studiat. Prin urmare, includerea lor simultană în model este inadecvată, deoarece se dublează într-o anumită măsură. Dacă nu există ipoteze speciale ale vorbitorilor în favoarea unuia dintre acești factori, ar trebui să se acorde preferință celui care este caracterizat de un coeficient de corelație mare pe perechi (sau parțial).

Se crede că valoarea maximă a coeficientului de corelație între doi factori este 0,8.

Multicoliniaritatea duce de obicei la degenerarea matricei de variabile și, în consecință, la faptul că determinantul principal își scade valoarea și în limită devine aproape de zero. Estimările coeficienților ecuației de regresie devin foarte dependente de acuratețea găsirii datelor sursă și își modifică brusc valorile atunci când se modifică numărul de observații.

Matricea coeficienților de corelație de pereche

Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945

Nodurile matricei conțin coeficienți de corelație perechi care caracterizează relația strânsă dintre caracteristicile factorilor. Analizând acești coeficienți, observăm că cu cât valoarea lor absolută este mai mare, cu atât influența pe care o are caracteristica factorului corespunzătoare asupra rezultatului este mai mare. Analiza matricei rezultate se realizează în două etape:

1. Dacă în prima coloană a matricei există coeficienți de corelație pentru care /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Analizând coeficienții de corelație perechi ai caracteristicilor factorilor între ele, (r XiXj), care caracterizează apropierea relației lor, este necesar să se evalueze independența acestora unul față de celălalt, deoarece aceasta este o condiție necesară pentru analiza de regresie ulterioară. Având în vedere faptul că în economie nu există caracteristici absolut independente, este necesar să le evidențiem, dacă este posibil, pe cele mai independente. Caracteristicile factorilor care sunt strâns corelate între ele se numesc multicoliniare. Includerea caracteristicilor multicoliniare în model face imposibilă interpretarea economică a modelului de regresie, deoarece o modificare a unui factor implică o modificare a factorilor asociați cu acesta, ceea ce poate duce la o „defalcare” a modelului în ansamblu.

Criteriul de multicolateralitate a factorilor este următorul:

/r XiXj / > 0,8

În matricea rezultată a coeficienților de corelație perechi, acest criteriu este îndeplinit de doi indicatori aflați la intersecția rândurilor Și . Dintre fiecare pereche de aceste caracteristici, una trebuie lăsată în model; ar trebui să aibă un impact mai mare asupra caracteristicii rezultate. Ca urmare, factorii și sunt excluși din model, adică. rata de creștere a costului mărfurilor vândute și rata de creștere a volumului vânzărilor acestuia.

Deci, introducem factorii X1 și X2 în modelul de regresie.

În continuare, se efectuează analiza de regresie (serviciu, analiză de date, regresie). Din nou, un tabel de date inițiale este compilat cu factorii X1 și X2. Regresia în general este utilizată pentru a analiza impactul asupra unei variabile dependente separate al valorilor variabilelor (factorilor) independente și permite ca corelația dintre caracteristici să fie reprezentată sub forma unei dependențe funcționale numite ecuație de regresie sau o corelație-regresie model.

Ca rezultat al analizei de regresie, obținem rezultatele calculării regresiei multivariate. Să analizăm rezultatele obținute.

Toți coeficienții de regresie sunt semnificativi conform testului t Student. Coeficientul de corelație multiplă R a fost de 0,925; pătratul acestei valori (coeficient de determinare) înseamnă că în medie 85,5% din variația caracteristicii efective se explică prin variația caracteristicilor factorilor incluse în model. Coeficientul de determinism caracterizează relația strânsă dintre setul de caracteristici factoriale și indicatorul efectiv. Cu cât valoarea R pătratului este mai aproape de 1, cu atât relația este mai puternică. În cazul nostru, un indicator egal cu 0,855 indică selecția corectă a factorilor și prezența unei relații între factori și indicatorul efectiv.

Modelul luat în considerare este adecvat, deoarece valoarea calculată a testului F Fisher depășește semnificativ valoarea sa tabelată (F obs =52,401; F tab =1,53).

Rezultatul general al analizei de corelație și regresie este o ecuație de regresie multiplă, care are forma:

Ecuația de regresie rezultată îndeplinește scopul analizei de corelație-regresie și este un model liniar al dependenței profitului bilanțului întreprinderii de doi factori: coeficientul de creștere a productivității muncii și coeficientul de proprietate industrială.

Pe baza modelului obtinut putem concluziona ca odata cu o crestere a nivelului productivitatii muncii cu 1% fata de nivelul din perioada precedenta, valoarea profitului bilant va creste cu 0,95 puncte procentuale; o creştere a coeficientului proprietăţii industriale cu 1% va duce la o creştere a indicatorului efectiv cu 27,9 puncte procentuale. În consecință, influența dominantă asupra creșterii profitului bilanțului este exercitată de creșterea valorii proprietății în scopuri de producție (reînnoirea și creșterea activelor fixe ale întreprinderii).

Folosind un model de regresie multiplă, se realizează o prognoză multifactorială a caracteristicii efective. Să se știe că X1 = 3,0 și X3 = 0,7. Să substituim valorile caracteristicilor factorilor în model, obținem Control = 0,95*3,0 + 27,9*0,7 – 19,4 = 2,98. Astfel, odata cu cresterea productivitatii muncii si modernizarea mijloacelor fixe la intreprindere, profitul bilantului in trimestrul I 2005 fata de perioada precedenta (trimestrul IV 2004) va creste cu 2,98%.

Datele economice reprezintă caracteristicile cantitative ale oricăror obiecte sau procese economice. Ele se formează sub influența multor factori, nu toți fiind accesibili controlului extern. Factorii necontrolați pot prelua valori aleatorii dintr-un set de valori și, prin urmare, pot face ca datele pe care le definesc să fie aleatorii. Una dintre sarcinile principale în cercetarea economică este analiza dependenţelor dintre variabile.

Când luăm în considerare dependențele dintre caracteristici, este necesar să distingem, în primul rând, două tipuri de conexiuni:

  • functional - sunt caracterizate prin corespondența completă între modificarea caracteristicii factorului și modificarea valorii rezultate: Fiecare valoare a unei caracteristici de factor corespunde unor valori foarte specifice ale caracteristicii rezultate. Acest tip de relație este exprimat ca o relație formulă. Dependența funcțională poate conecta o caracteristică eficientă cu una sau mai multe caracteristici factoriale. Astfel, valoarea salariilor pentru salariile bazate pe timp depinde de numărul de ore lucrate;
  • corelațională- nu există o corespondență completă între modificarea a două semne; impactul factorilor individuali se manifestă doar în medie, cu observarea în masă a datelor reale. Impactul simultan asupra trăsăturii studiate a unui număr mare de factori diferiți duce la faptul că una și aceeași valoare a unei caracteristici a factorului corespunde unei întregi distribuții a valorilor caracteristicii rezultate, deoarece în fiecare caz specific alte caracteristici ale factorilor pot schimba puterea și direcția impactului lor.

Trebuie avut în vedere că, dacă există o relație funcțională între caracteristici, este posibil, cunoscând valoarea caracteristicii factorului, să se determine cu exactitate valoarea semnului rezultant. Numai în prezența unei dependențe de corelare tendința de modificare a caracteristicii rezultate când se modifică valoarea caracteristicii factorului.

Când se studiază relațiile dintre semne, acestea sunt clasificate în funcție de direcție, formă, număr de factori:

  • către conexiunile sunt împărțite în DreptȘi verso. Cu o conexiune directă, direcția de schimbare a caracteristicii rezultate coincide cu direcția de schimbare a caracteristicii factorului. Cu feedback, direcția de schimbare a caracteristicii rezultate este opusă direcției de schimbare a caracteristicii factorului. De exemplu, cu cât sunt mai mari calificările muncitorului, cu atât este mai mare nivelul de productivitate al muncii acestuia (relație directă). Cu cât productivitatea muncii este mai mare, cu atât costul pe unitatea de producție este mai mic (feedback);
  • după formă(tip de funcție) conexiunile sunt împărțite în liniar(linie dreaptă) și neliniară(curbiliniu). O relație liniară este reprezentată printr-o linie dreaptă, o relație neliniară printr-o curbă (parabolă, hiperbolă etc.). Într-o relație liniară, cu creșterea valorii unei caracteristici factoriale, are loc o creștere (scădere) uniformă a valorii caracteristicii rezultate;
  • prin numărul de factori care acționează asupra caracteristicii efective, conexiunile sunt împărțite în cu un singur factor(pereche) și multifactorială.

Studiul dependenței variației trăsăturilor de condițiile de mediu este conținutul teoriei corelației.

Atunci când se efectuează analiza corelației, întregul set de date este considerat ca un set de variabile (factori), fiecare dintre ele conține P observatii.

Când se studiază relația dintre doi factori, aceștia sunt de obicei desemnați X=(x p x 2,...,x n)Și Y= (y ( , y 2 ,..., y și).

Covarianta - asta este statistic măsura interacțiunii două variabile. De exemplu, o valoare pozitivă pentru covarianța randamentelor a două titluri indică faptul că randamentele acestor titluri tind să se miște într-o direcție.

Covarianța între două variabile XȘi Y calculat după cum urmează:

unde sunt valorile reale ale variabilelor

XȘi G;

Dacă variabile aleatorii Chi Y independent, covarianța teoretică este zero.

Covarianța depinde de unitățile în care sunt măsurate variabilele Hee Y, este o cantitate nestandardizată. Prin urmare, la măsură puterea conexiunii o altă statistică numită coeficient de corelație este utilizată între două variabile.

Pentru două variabile XȘi Coeficientul de corelație al perechii Y

este definită după cum urmează:

Unde Ssy- estimări ale variațiilor cantităților Hee Y. Aceste estimări caracterizează gradul de împrăștiere valorile x (, x 2, ..., x n (y 1, y 2, y n)în jurul mediei dvs X y respectiv), sau variabilitate(variabilitatea) acestor variabile pe un set de observații.

Dispersia(estimarea varianței) este determinată de formula

În general, pentru a obține o estimare imparțială a varianței, suma pătratelor trebuie împărțită la numărul de grade de libertate ale estimării. (etc), Unde P - marime de mostra, R - numărul de conexiuni suprapuse pe eșantion. Deoarece eșantionul a fost deja folosit o dată pentru a determina media X, atunci numărul conexiunilor suprapuse în acest caz este egal cu unul (p = 1), iar numărul de grade de libertate al estimării (adică numărul de elemente independente ale eșantionului) este egal cu (P - 1).

Este mai natural să se măsoare gradul de dispersie a valorilor variabilelor în aceleași unități în care este măsurată variabila în sine. Această problemă este rezolvată de un indicator numit deviație standard (deviație standard) sau eroare standard variabil X(variabil Y)și determinat de relație

Termenii din numărătorul formulei (3.2.1) exprimă interacțiunea a două variabile și determină semnul corelației (pozitiv sau negativ). Dacă, de exemplu, există o relație puternică pozitivă între variabile (o creștere a unei variabile în timp ce cealaltă crește), fiecare termen va fi un număr pozitiv. De asemenea, dacă există o relație negativă puternică între variabile, toți termenii din numărător vor fi numere negative, rezultând o valoare de corelație negativă.

Numitorul expresiei pentru coeficientul de corelație perechi [vezi formula (3.2.2)] pur și simplu normalizează numărătorul în așa fel încât coeficientul de corelație se dovedește a fi un număr ușor de interpretat fără dimensiune și ia valori de la -1 la +1.

Numătorul expresiei pentru coeficientul de corelație, care este greu de interpretat din cauza unităților de măsură neobișnuite, este covarianta HiU.În ciuda faptului că uneori este folosită ca o caracteristică independentă (de exemplu, în teoria finanțelor pentru a descrie modificarea comună a prețurilor acțiunilor pe două burse), este mai convenabil să se utilizeze coeficientul de corelație. Corelația și covarianța reprezintă în esență aceeași informație, dar corelația reprezintă această informație într-o formă mai utilă.

Pentru evaluarea calitativă a coeficientului de corelație se folosesc diverse scale, cel mai adesea scala Chaddock. În funcție de valoarea coeficientului de corelație, relația poate avea una dintre următoarele evaluări:

  • 0,1-0,3 - slab;
  • 0,3-0,5 - vizibil;
  • 0,5-0,7 - moderată;
  • 0,7-0,9 - mare;
  • 0,9-1,0 - foarte mare.

Evaluarea gradului de apropiere a unei conexiuni folosind coeficientul de corelare se realizează, de regulă, pe baza unor informații mai mult sau mai puțin limitate despre fenomenul studiat. În acest sens, este necesar să se evalueze semnificația coeficientului de corelație liniară, care face posibilă extinderea concluziilor bazate pe rezultatele eșantionului la populația generală.

Evaluarea semnificației coeficientului de corelație pentru dimensiunile mici ale eșantionului se realizează folosind testul Student 7. În acest caz, valoarea reală (observată) a acestui criteriu este determinată de formulă

Valoarea / obs calculată folosind această formulă este comparată cu valoarea critică a criteriului 7, care este preluată din tabelul cu valorile /-testului Student (vezi Anexa 2) ținând cont de nivelul de semnificație dat oc și numărul de grade de libertate (P - 2).

Dacă 7 obs > 7 tab-uri, atunci valoarea rezultată a coeficientului de corelație este considerată semnificativă (adică ipoteza nulă care afirmă că coeficientul de corelație este egal cu zero este respinsă). Și astfel se ajunge la concluzia că există o relație statistică strânsă între variabilele studiate.

Dacă valoarea g y x aproape de zero, relația dintre variabile este slabă. Dacă corelația dintre variabile aleatoare:

  • pozitiv, apoi pe măsură ce o variabilă aleatoare crește, cealaltă tinde să crească în medie;
  • negativ, apoi pe măsură ce o variabilă aleatoare crește, cealaltă tinde să scadă în medie. Un instrument grafic convenabil pentru analiza datelor asociate este diagramă de dispersie, care reprezintă fiecare observație într-un spațiu de două dimensiuni corespunzătoare a doi factori. Se mai numește un grafic de dispersie, care descrie un set de valori a două caracteristici câmpul de corelare. Fiecare punct din această diagramă are coordonatele x (. și y g Pe măsură ce puterea relației liniare crește, punctele de pe grafic se vor afla mai aproape de linia dreaptă și de mărimea G va fi mai aproape de unitate.

Coeficienții de corelație perechi sunt utilizați pentru a măsura puterea relațiilor liniare dintre diferite perechi de caracteristici dintr-un set de ele. Pentru multe caracteristici se obține matricea coeficienților de corelație de pereche.

Fie ca întregul set de date să fie format dintr-o variabilă Y = =(y p y 2, ..., y p)Și T variabile (factori) X, fiecare dintre ele conţine P observatii. Valori variabile YȘi X, cuprinse în populația observată sunt înregistrate într-un tabel (Tabelul 3.2.1).

Tabelul 3.2.1

Variabil

Număr

observatii

X TZ

X tp

Pe baza datelor din acest tabel, calculați matricea coeficienților de corelație de pereche R, este simetric față de diagonala principală:


Analiza matricei coeficienților de corelație de perechi este utilizată la construirea modelelor de regresie multiple.

O matrice de corelație nu poate descrie complet dependențele dintre cantități. În acest sens, analiza corelației multivariate are în vedere două sarcini:

  • 1. Determinarea relației strânse a unei variabile aleatoare cu totalitatea altor variabile incluse în analiză.
  • 2. Determinarea gradului de apropiere a legăturii dintre două mărimi cu fixarea sau excluderea influenței altor mărimi.

Aceste probleme sunt rezolvate folosind coeficienți de corelație multipli și, respectiv, parțial.

Rezolvarea primei probleme (determinarea relației strânse a unei variabile aleatoare cu totalitatea celorlalte variabile incluse în analiză) se realizează folosind eșantionează coeficientul de corelație multiplă conform formulei

Unde R- R[cm. formula (3.2.6)]; Rjj- complement algebric al unui element din aceeași matrice R.

Coeficient de corelație multiplă pătrat SCHj 2 j _j J+l m numit de obicei coeficient multiplu de determinare a probei; arată ce proporție a variației (distribuirea aleatorie) a valorii studiate Xj explică variația variabilelor aleatoare rămase X ( , X 2 ,..., X t.

Coeficienții de corelare și determinare multiplă sunt cantități pozitive, luând valori în intervalul de la 0 la 1. La aproximarea coeficientului R 2 la unitate, putem concluziona că relația dintre variabilele aleatoare este apropiată, dar nu despre direcția acesteia. Coeficientul de corelație multiplă poate crește doar dacă sunt incluse variabile suplimentare în model și nu va crește dacă oricare dintre caracteristicile existente este exclusă.

Verificarea semnificației coeficientului de determinare se realizează prin compararea valorii calculate a criteriului /' al lui Fisher

cu tabelar F rabl. Valoarea tabelară a criteriului (vezi Anexa 1) este determinată de nivelul de semnificație dat a și gradele de libertate v l = mnv 2 = n-m-l. Coeficient R 2 este semnificativ diferit de zero dacă inegalitatea este valabilă

Dacă variabilele aleatoare luate în considerare se corelează între ele atunci valoarea coeficientului de corelație de pereche este parțial afectată de influența altor mărimi. În acest sens, este necesar să se studieze corelația parțială dintre cantități excluzând influența altor variabile aleatoare (una sau mai multe).

Eșantion de coeficient de corelație parțială determinat de formula

Unde R Jk , Rjj, R kk - adunări algebrice la elementele matricei corespunzătoare R[cm. formula (3.2.6)].

Coeficientul de corelație parțială, precum și coeficientul de corelație de pereche, variază de la -1 la +1.

Expresia (3.2.9) supusă t = 3 va arăta ca

Se numește coeficientul r 12(3). coeficient de corelație între x (Și x 2 pentru fix x y Este simetric față de indicii primari 1, 2. Indicele său secundar 3 se referă la o variabilă fixă.

Exemplul 3.2.1. Calculul coeficienților de pereche,

corelație multiplă și parțială.

În tabel 3.2.2 furnizează informații despre volumele vânzărilor și costurile de publicitate ale unei companii, precum și indicele cheltuielilor consumatorilor pentru un număr de ani în curs.

  • 1. Construiți o diagramă de dispersie (câmp de corelare) pentru variabilele „volumul vânzărilor” și „indicele cheltuielilor consumatorului”.
  • 2. Determinați gradul de influență a indicelui de cheltuieli ale consumatorilor asupra volumului vânzărilor (calculați coeficientul de corelație de pereche).
  • 3. Evaluați semnificația coeficientului de corelație de pereche calculat.
  • 4. Construiți o matrice de coeficienți de corelație perechi pentru trei variabile.
  • 5. Găsiți o estimare a coeficientului de corelație multiplă.
  • 6. Găsiți estimări ale coeficienților de corelație parțială.

1. În exemplul nostru, diagrama de dispersie are forma prezentată în Fig. 3.2.1. Alungirea norului de puncte de pe diagrama de împrăștiere de-a lungul liniei înclinate ne permite să presupunem că există o tendință obiectivă pentru o relație liniară directă între valorile variabilelor X 2 Y(volumul vânzărilor).

Orez. 3.2.1.

2. Calcule intermediare la calculul coeficientului de corelație între variabile X 2(Indicele cheltuielilor de consum) și Y(volumul vânzărilor) sunt date în tabel. 3.2.3.

Valori medii variabile aleatoare X 2Și Y, care sunt cei mai simpli indicatori care caracterizează secvențele jCj, x 2,..., x 16 și y v y 2 ,..., y 16, se calculează folosind următoarele formule:


Volumul vânzărilor Y, mii de ruble.

Index

a consuma

telsky

cheltuieli

Volumul vânzărilor Y, mii de ruble.

Index

a consuma

telsky

cheltuieli

Tabelul 3.2.3

l:, - X

(ȘI - U)(x, - x)

(x, - x) 2

(y, - - y) 2

Dispersia caracterizează gradul de răspândire a valorilor x v x 2,x:

Să luăm acum în considerare soluția exemplului 3.2.1 în Excel.

Pentru a calcula corelația folosind Excel, puteți utiliza funcția =correl(), specificând adresele a două coloane de numere, așa cum se arată în Fig. 3.2.2. Răspunsul este plasat în D8 și este egal cu 0,816.

Orez. 3.2.2.

(Notă: argumentele funcției corelele trebuie să fie numere sau nume, matrice sau referințe care conțin numere. Dacă argumentul, care este o matrice sau o referință, conține text, valori booleene sau celule goale, atunci astfel de valori sunt ignorate; cu toate acestea, celulele care conțin valori zero sunt numărate.

Dacă matrice! și array2 au un număr diferit de puncte de date, apoi funcția correl returnează valoarea de eroare #n/a.

Dacă array1 sau array2 este goală sau dacă o (deviația standard) a valorilor lor este zero, atunci funcția corel returnează valoarea de eroare #div/0!.)

Valoarea critică a statisticii t a lui Student poate fi obținută și folosind funcția studistribuție a 1 pachet Excel. Ca argumente ale funcției, trebuie să specificați numărul de grade de libertate egal cu P- 2 (în exemplul nostru 16 - 2= 14) și nivelul de semnificație a (în exemplul nostru a = 0,1) (Fig. 3.2.3). Dacă valoarea reală/-statisticile luate modulo este mai mare critic, atunci cu probabilitatea (1 - a) coeficientul de corelare este semnificativ diferit de zero.


Orez. 3.2.3. Valoarea critică a statisticii / este 1,7613

Excel include un set de instrumente de analiză a datelor (așa-numitul pachet de analiză) concepute pentru a rezolva diverse probleme statistice. Pentru a calcula matricea coeficienților de corelație de pereche R ar trebui să utilizați instrumentul de corelare (Fig. 3.2.4) și să setați parametrii de analiză în caseta de dialog corespunzătoare. Răspunsul va fi plasat pe o nouă foaie de lucru (Fig. 3.2.5).

1 În Excel 2010, numele funcției studrasprobr schimbat în stu-

DENT.OBR.2X.

Orez. 3.2.4.


Orez. 3.2.5.

  • Fondatorii teoriei corelației sunt considerați a fi statisticienii englezi F. Galton (1822-1911) și K. Pearson (1857-1936). Termenul „corelație” a fost împrumutat din știința naturii și înseamnă „corelație, corespondență”. Ideea corelației ca interdependență între variabile aleatoare stă la baza teoriei matematico-statistice a corelației.

Datele pentru 2011 sunt furnizate pentru teritoriile Districtului Federal de Sud al Federației Ruse

Teritoriile Districtului Federal

Produsul regional brut, miliarde de ruble, Y

Investiții în active fixe, miliarde de ruble, X1

1. Rep. Adygea

2. Rep. Daghestan

3. Rep. Inguşetia

4. Republica Kabardino-Balkariană

5. Rep. Kalmykia

6. Republica Karachay-Cerkess

7. Rep. Osetia de Nord Alania

8. Regiunea Krasnodar)

9. Regiunea Stavropol

10. Regiunea Astrahan.

11. Regiunea Volgograd.

12. Regiunea Rostov.

  • 1. Calculați matricea coeficienților de corelație perechi; evaluează semnificația statistică a coeficienților de corelație.
  • 2. Construiți un câmp de corelație între caracteristica efectivă și factorul cel mai strâns legat de aceasta.
  • 3. Calculați parametrii regresiei perechi liniare pentru fiecare factor X..
  • 4. Evaluați calitatea fiecărui model prin coeficientul de determinare, eroarea medie de aproximare și testul F Fisher. Alege cel mai bun model.

va fi de 80% din valoarea sa maximă. Prezentați grafic: valori reale și de model, puncte de prognoză.

  • 6. Folosind regresia multiplă pas cu pas (metoda de excludere sau metoda de includere), construiți un model de formare a prețului apartamentelor din cauza unor factori semnificativi. Oferiți o interpretare economică a coeficienților modelului de regresie.
  • 7. Evaluați calitatea modelului construit. S-a îmbunătățit calitatea modelului în comparație cu modelul cu un singur factor? Evaluați influența factorilor semnificativi asupra rezultatului folosind coeficienții de elasticitate, în - și -? coeficienți

Când rezolvăm această problemă, vom efectua calcule și vom construi grafice și diagrame folosind setările Excel Data Analysis.

1. Calculați matricea coeficienților de corelație perechi și evaluați semnificația statistică a coeficienților de corelație

În caseta de dialog Corelație, în câmpul Interval de intrare, introduceți intervalul de celule care conțin datele sursă. Deoarece am selectat și titlurile coloanelor, bifăm caseta de selectare Etichete din primul rând.

Am obtinut urmatoarele rezultate:

Tabelul 1.1 Matricea coeficienților de corelație perechi

Analiza matricei coeficienților de corelație perechi arată că variabila dependentă Y, adică produsul regional brut, are o relație mai strânsă cu X1 (investiția în capital fix). Coeficientul de corelație este 0,936. Aceasta înseamnă că 93,6% din variabila dependentă Y (produsul regional brut) depinde de indicatorul X1 (investiția în capital fix).

Vom determina semnificația statistică a coeficienților de corelație folosind testul t Student. Comparăm valoarea tabelului cu valorile calculate.

Să calculăm valoarea tabelului folosind funcția STUDISCOVER.

tabelul t = 0,129 cu un nivel de încredere de 0,9 și grade de libertate (n-2).

Factorul X1 este semnificativ statistic.

2. Să construim un câmp de corelație între atributul efectiv (produsul regional brut) și factorul cel mai strâns legat de acesta (investiția în capital fix)

Pentru a face acest lucru, vom folosi instrumentul Excel scatter plot.

Ca urmare, obținem un câmp de corelație pentru prețul produsului regional brut, miliarde de ruble. și investiții în active fixe, miliarde de ruble. (Figura 1.1.).

Figura 1.1

3. Calculați parametrii regresiei perechi liniare pentru fiecare factor X

Pentru a calcula parametrii regresiei liniare pe perechi, vom folosi instrumentul de regresie inclus în setarea Analiza datelor.

În caseta de dialog Regresie, în câmpul Interval de intrare Y, introduceți adresa intervalului de celule pe care o reprezintă variabila dependentă. În câmp

Intervalul de introducere X introducem adresa intervalului care conține valorile variabilelor independente. Să calculăm parametrii regresiei perechi pentru factorul X.

Pentru X1 am primit următoarele date prezentate în Tabelul 1.2:

Tabelul 1.2

Ecuația de regresie pentru dependența prețului produsului regional brut de investiția în capital fix are forma:

4. Să evaluăm calitatea fiecărui model prin coeficientul de determinare, eroarea medie de aproximare și testul F Fisher. Să stabilim care model este cel mai bun.

Am obținut coeficientul de determinare, eroarea medie de aproximare, ca urmare a calculelor efectuate la paragraful 3. Datele obținute sunt prezentate în următoarele tabele:

Date X1:

Tabelul 1.3a

Tabelul 1.4b

A) Coeficientul de determinare determină ce proporție din variația trăsăturii Y este luată în considerare în model și se datorează influenței factorului X asupra acestuia. Cu cât valoarea coeficientului de determinare este mai mare, cu atât este mai strânsă legătura dintre caracteristici în modelul matematic construit.

Excel se referă la R-pătrat.

Pe baza acestui criteriu, modelul cel mai adecvat este ecuația de regresie a dependenței prețului produsului regional brut de investiția în capital fix (X1).

B) Calculăm eroarea medie de aproximare folosind formula:

unde numărătorul este suma pătratelor abaterii valorilor calculate de la cele reale. În tabele se află în coloana SS, linia Remaining.

Calculăm prețul mediu al unui apartament în Excel folosind funcția MEDIE. = 24,18182 miliarde de ruble.

La efectuarea calculelor economice, un model este considerat suficient de precis dacă eroarea medie de aproximare este mai mică de 5%; modelul este considerat acceptabil dacă eroarea medie de aproximare este mai mică de 15%.

Conform acestui criteriu, cel mai adecvat este modelul matematic pentru ecuația de regresie a dependenței prețului produsului regional brut de investiția în capital fix (X1).

C) Testul F este utilizat pentru a testa semnificația modelului de regresie. Pentru a face acest lucru, se face și o comparație a valorilor critice (tabulare) ale testului Fisher F.

Valorile calculate sunt date în tabelele 1.4b (indicate prin litera F).

Vom calcula valoarea tabelară a testului F Fisher în Excel folosind funcția FDIST. Să luăm probabilitatea egală cu 0,05. Primit: = 4,75

Valorile calculate ale testului Fisher F pentru fiecare factor sunt comparabile cu valoarea tabelului:

71,02 > = 4,75 modelul este adecvat conform acestui criteriu.

După ce am analizat datele conform tuturor celor trei criterii, putem concluziona că cel mai bun model matematic este construit pentru factorul produs regional brut, care este descris de ecuația liniară

5. Pentru modelul selectat de dependență a prețului produsului regional brut

Vom prezice valoarea medie a indicatorului la un nivel de semnificație dacă valoarea prezisă a factorului este de 80% din valoarea sa maximă. Să o prezentăm grafic: valori reale și de model, puncte de prognoză.

Să calculăm valoarea prezisă a lui X; conform condiției, aceasta va fi de 80% din valoarea maximă.

Să calculăm X max în Excel folosind funcția MAX.

0,8 *52,8 = 42,24

Pentru a obține estimări predictive ale variabilei dependente, înlocuim valoarea obținută a variabilei independente în ecuația liniară:

5,07+2,14*42,24 = 304,55 miliarde de ruble.

Să determinăm intervalul de încredere al prognozei, care va avea următoarele limite:

Pentru a calcula intervalul de încredere pentru valoarea prezisă, calculăm abaterea de la linia de regresie.

Pentru un model de regresie pereche, valoarea abaterii este calculată:

acestea. valoarea erorii standard din tabelul 1.5a.

(Deoarece numărul de grade de libertate este egal cu unu, numitorul va fi egal cu n-2). prognoza regresiei perechilor de corelație

Pentru a calcula coeficientul, vom folosi funcția Excel STUDISCOVER, luăm probabilitatea egală cu 0,1, iar numărul de grade de libertate 38.

Calculăm valoarea folosind Excel și obținem 12294.


Să determinăm limitele superioare și inferioare ale intervalului.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Astfel, valoarea prognozată = 304,55 mii dolari se va situa între limita inferioară egală cu 277,078 mii dolari. și o limită superioară egală cu 332,022 miliarde. Freca.

Valorile reale și de model, punctele de prognoză sunt prezentate grafic în Figura 1.2.


Figura 1.2

6. Folosind regresia multiplă pas cu pas (metoda eliminării), vom construi un model de formare a prețului produsului regional brut datorită unor factori semnificativi

Pentru a construi regresia multiplă, vom folosi funcția de regresie din Excel, incluzând toți factorii. Ca rezultat, obținem tabelele cu rezultate, din care avem nevoie de testul t al Studentului.

Tabelul 1.8a

Tabelul 1.8b

Tabelul 1.8c.

Primim un model ca:

Deoarece< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Să alegem cea mai mică valoare absolută a testului t al lui Student, este egală cu 8,427, o comparăm cu valoarea tabelului, pe care o calculăm în Excel, luăm nivelul de semnificație egal cu 0,10, numărul de grade de libertate n-m-1= 12-4=8: =1,8595

Deoarece 8.427>1.8595 modelul ar trebui considerat adecvat.

7. Pentru a evalua factorul semnificativ al modelului matematic rezultat, calculăm coeficienții de elasticitate și - coeficienții

Coeficientul de elasticitate arată cu ce procent se va modifica atributul efectiv atunci când atributul factorului se modifică cu 1%:

E X4 = 2,137 * (10,69/24,182) = 0,94%

Adică, cu o creștere a investiției în capital fix de 1%, costul crește în medie cu 0,94%.

Coeficientul arată în ce parte a abaterii standard se modifică valoarea medie a variabilei dependente cu o modificare a variabilei independente cu o abatere standard.

2,137* (14.736/33,632) = 0,936.

Datele despre abaterea standard sunt preluate din tabele obținute cu ajutorul instrumentului Statistică descriptivă.

Tabelul 1.11 Statistici descriptive (Y)

Tabelul 1.12 Statistici descriptive (X4)

Coeficientul determină ponderea influenței factorului în influența totală a tuturor factorilor:

Pentru a calcula coeficienții de corelație de perechi, calculăm matricea coeficienților de corelație de perechi în Excel folosind instrumentul de corelare din setările Analiza datelor.

Tabelul 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Concluzie: Din calculele obținute, putem concluziona că atributul efectiv Y (produsul regional brut) are o dependență mare de factorul X1 (investiția în capital fix) (cu 100%).

Bibliografie

  • 1. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Econometrie. Curs pentru incepatori. Tutorial. a 2-a ed. - M.: Delo, 1998. - p. 69 - 74.
  • 2. Atelier de econometrie: Manual / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko și colab.2002. - p. 49 - 105.
  • 3. Dougherty K. Introducere în econometrie: Trad. din engleza - M.: INFRA-M, 1999. - XIV, p. 262 - 285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Matematică aplicată și fundamente ale econometriei. -1998., p. 115-147.
  • 5. Kremer N.Sh., Putko B.A. Econometrie. -2007. de la 175-251.
y X (1) X (2) X (3) X (4) X (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
X (1) 0.43 1.00 0.85 0.98 0.11 0.34
X (2) 0.37 0.85 1.00 0.88 0.03 0.46
X (3) 0.40 0.98 0.88 1.00 0.03 0.28
X (4) 0.58 0.11 0.03 0.03 1.00 0.57
X (5) 0.33 0.34 0.46 0.28 0.57 1.00

Analiza matricei coeficienților de corelație pereche arată că indicatorul efectiv este cel mai strâns legat de indicator X(4) - cantitatea de îngrășământ consumată la 1 hectar ().

În același timp, legătura dintre atribute-argumente este destul de strânsă. Astfel, există o relație practic funcțională între numărul de tractoare cu roți ( X(1)) și numărul de instrumente de prelucrare a solului de suprafață .

Prezența multicoliniarității este indicată și de coeficienții de corelație și . Având în vedere relația strânsă dintre indicatori X (1) , X(2) și X(3), doar unul dintre ele poate fi inclus în modelul de regresie a randamentului.

Pentru a demonstra impactul negativ al multicolinearității, luați în considerare un model de regresie al randamentului, incluzând toți indicatorii de intrare:

F obs = 121.

Valorile estimărilor corectate ale abaterilor standard ale estimărilor coeficienților ecuației sunt indicate în paranteze .

În ecuația de regresie sunt prezentați următorii parametri de adecvare: coeficientul de determinare multiplu; estimarea corectată a varianței reziduale, eroarea relativă medie de aproximare și valoarea calculată a criteriului F obs = 121.

Ecuația de regresie este semnificativă deoarece F obs = 121 > F kp = 2,85 găsit din tabel F-distribuţii la a=0,05; n 1 =6 și n 2 =14.

De aici rezultă că Q¹0, adică și cel puțin unul dintre coeficienții ecuației q j (j= 0, 1, 2, ..., 5) nu este zero.

Pentru a testa ipoteza despre semnificația coeficienților individuali de regresie H0: q j =0, unde j=1,2,3,4,5, comparați valoarea critică t kp = 2,14, găsit din tabel t-distribuţii la nivelul de semnificaţie a=2 Q=0,05 și numărul de grade de libertate n=14, cu valoarea calculată . Din ecuație rezultă că coeficientul de regresie este semnificativ statistic numai atunci când X(4) din ½ t 4 ½=2,90 > t kp = 2,14.



Semnele negative ale coeficienților de regresie nu se pretează la interpretare economică când X(1) și X(5) . Din valorile negative ale coeficienților rezultă că creșterea saturației agriculturii cu tractoare cu roți ( X(1)) și produse fitosanitare ( X(5)) are un efect negativ asupra randamentului. Prin urmare, ecuația de regresie rezultată este inacceptabilă.

Pentru a obține o ecuație de regresie cu coeficienți semnificativi, folosim un algoritm de analiză de regresie pas cu pas. Inițial, folosim un algoritm pas cu pas cu eliminarea variabilelor.

Să excludem variabila din model X(1) , care corespunde valorii minime absolute de ½ t 1 ½=0,01. Pentru variabilele rămase, construim din nou ecuația de regresie:

Ecuația rezultată este semnificativă deoarece F observat = 155 > F kp = 2,90, găsit la nivelul de semnificație a = 0,05 și numerele de grade de libertate n 1 = 5 și n 2 = 15 conform tabelului F-distributie, i.e. vector q¹0. Cu toate acestea, doar coeficientul de regresie la X(4) . Valori estimate ½ t j ½ pentru alți coeficienți este mai mic t kr = 2,131, găsit din tabel t-distributii la a=2 Q=0,05 și n=15.

Prin excluderea variabilei din model X(3) , care corespunde valorii minime t 3 = 0,35 și obținem ecuația de regresie:

(2.9)

În ecuația rezultată, coeficientul at X(5) . Prin excludere X(5) obținem ecuația de regresie:

(2.10)

Am obținut o ecuație de regresie semnificativă cu coeficienți semnificativi și interpretabili.

Cu toate acestea, ecuația rezultată nu este singurul model de randament „bun” și nu „cel mai bun” din exemplul nostru.

Să arătăm asta în condiția de multicoliniaritate, un algoritm treptat cu includerea variabilelor este mai eficient. Primul pas în modelul de randament y variabila inclusa X(4) , care are cel mai mare coeficient de corelație cu y, explicat prin variabila - r(y,X(4))=0,58. În a doua etapă, inclusiv ecuația împreună cu X(4) variabile X(1) sau X(3), vom obține modele care, din motive economice și caracteristici statistice, depășesc (2.10):

(2.11)

(2.12)

Includerea oricăreia dintre cele trei variabile rămase în ecuație îi înrăutățește proprietățile. Vezi, de exemplu, ecuația (2.9).

Astfel, avem trei modele de randament „bun”, dintre care trebuie să alegem unul din motive economice și statistice.

Conform criteriilor statistice, modelul (2.11) este cel mai adecvat. Ea corespunde valorilor minime ale varianței reziduale = 2,26 și erorii relative medii de aproximare și celor mai mari valori și Fob = 273.

Modelul (2.12) are indicatori de adecvare puțin mai slabi, urmat de modelul (2.10).

Vom alege acum cel mai bun dintre modele (2.11) și (2.12). Aceste modele diferă unele de altele în ceea ce privește variabilele X(1) și X(3) . Cu toate acestea, în modelele de randament variabila X(1) (numărul de tractoare cu roți la 100 ha) este mai de preferat decât variabil X(3) (numărul de instrumente de prelucrare a solului la 100 ha), care este într-o oarecare măsură secundar (sau derivat din X (1)).

În acest sens, din motive economice, ar trebui să se acorde preferință modelului (2.12). Astfel, după implementarea algoritmului de analiză a regresiei în etape cu includerea variabilelor și ținând cont de faptul că doar una dintre cele trei variabile aferente ar trebui să intre în ecuație ( X (1) , X(2) sau X(3)) alegeți ecuația finală de regresie:

Ecuația este semnificativă la a=0,05, deoarece F obs = 266 > F kp = 3,20, găsit din tabel F-distribuţii la a= Q=0,05; n 1 =3 și n 2 =17. Toți coeficienții de regresie din ecuația ½ sunt de asemenea semnificativi t j½> t kp(a=2 Q=0,05; n=17)=2,11. Coeficientul de regresie q 1 ar trebui considerat semnificativ (q 1 ¹0) din motive economice, în timp ce t 1 = 2,09 doar puțin mai puțin t kp = 2,11.

Din ecuația de regresie rezultă că o creștere cu unu a numărului de tractoare la 100 de hectare de teren arabil (la o valoare fixă X(4)) conduce la o creștere a randamentelor de cereale cu o medie de 0,345 c/ha.

Un calcul aproximativ al coeficienților de elasticitate e 1 »0,068 și e 2 »0,161 arată că odată cu creșterea indicatorilor X(1) și X(4) cu 1%, randamentul cerealelor crește în medie cu 0,068% și, respectiv, 0,161%.

Coeficientul multiplu de determinare indică faptul că doar 46,9% din variația randamentului este explicată de indicatorii incluși în model ( X(1) și X(4)), adică saturarea producției vegetale cu tractoare și îngrășăminte. Restul variației se datorează acțiunii unor factori necontabiliați ( X (2) , X (3) , X(5), condițiile meteorologice etc.). Eroarea relativă medie de aproximare caracterizează adecvarea modelului, precum și valoarea varianței reziduale. La interpretarea ecuației de regresie sunt de interes valorile erorilor relative de aproximare . Să reamintim că - valoarea modelului indicatorului efectiv caracterizează valoarea medie a randamentului pentru totalitatea regiunilor luate în considerare, cu condiția ca valorile variabilelor explicative X(1) și X(4) sunt fixate la același nivel și anume X (1) = x i(1) și X (4) = xi(4) . Apoi, conform valorilor lui d i Puteți compara regiunile după randament. Zone cărora le corespund valorile d i>0, au un randament peste medie și d i<0 - ниже среднего.

În exemplul nostru, în ceea ce privește randamentul, producția de culturi este cea mai eficientă în zona corespunzătoare lui d 7 =28%, unde randamentul este cu 28% mai mare decât media regională, iar cel mai puțin eficient este în zona cu d 20 =-27,3%.


Sarcini și exerciții

2.1. Din populația generală ( y, X (1) , ..., X(p)), unde y are o lege de distribuție normală cu așteptare matematică condiționată și varianță s 2, un eșantion aleatoriu de n, lăsați-l să plece ( y eu, x i (1) , ..., x i(p)) - rezultat i a-a observație ( i=1, 2, ..., n). Determinați: a) așteptarea matematică a estimării celor mai mici pătrate ale vectorului q; b) matricea de covarianță a estimării celor mai mici pătrate ale vectorului q; c) așteptarea matematică a evaluării.

2.2. Conform condițiilor problemei 2.1, găsiți așteptarea matematică a sumei abaterilor pătrate datorate regresiei, i.e. EQ R, Unde

.

2.3. Conform condițiilor problemei 2.1, se determină așteptarea matematică a sumei abaterilor pătrate cauzate de variația reziduală relativă la liniile de regresie, i.e. EQ ost, unde

2.4. Demonstrați că atunci când ipoteza H 0 este îndeplinită: q=0 statistică

are o distribuție F cu grade de libertate n 1 =p+1 și n 2 =n-p-1.

2.5. Demonstrați că atunci când ipoteza H 0: q j =0 este îndeplinită, statistica are o distribuție t cu numărul de grade de libertate n=n-p-1.

2.6. Pe baza datelor (Tabelul 2.3) cu privire la dependența de contracție a pâinii furajere ( y) cu privire la durata de stocare ( X) găsiți o estimare punctuală a așteptării condiționate în ipoteza că ecuația de regresie generală este liniară.

Tabelul 2.3.

Necesar: a) găsiți estimări ale varianței reziduale s 2 sub ipoteza că ecuația de regresie generală are forma ; b) verificați la a=0,05 semnificația ecuației de regresie, i.e. ipoteza H 0: q=0; c) cu fiabilitatea g=0,9, se determină estimări de interval ale parametrilor q 0, q 1; d) cu fiabilitatea g=0,95, determinați intervalul estimat al așteptării matematice condiționate la X 0 =6; e) determinați la g=0,95 intervalul de încredere al predicției la punctul X=12.

2.7. Pe baza datelor privind dinamica ritmului de creștere a prețurilor acțiunilor pe 5 luni, prezentate în tabel. 2.4.

Tabelul 2.4.

luni ( X)
y (%)

iar în ipoteza că ecuația generală de regresie are forma , se cere: a) să se determine estimări atât ale parametrilor ecuației de regresie cât și ale varianței reziduale s 2 ; b) se verifică la a=0,01 semnificația coeficientului de regresie, i.e. ipotezele H 0: q 1 =0;

c) cu fiabilitatea g=0,95, găsiți estimări de interval ale parametrilor q 0 și q 1; d) cu fiabilitatea g=0,9, stabiliți o estimare pe intervale a așteptării matematice condiționate la X 0 =4; e) determinați la g=0,9 intervalul de încredere al predicției la punctul X=5.

2.8. Rezultatele studiului dinamicii creșterii în greutate a animalelor tinere sunt prezentate în Tabelul 2.5.

Tabelul 2.5.

Presupunând că ecuația generală de regresie este liniară, se cere: a) să se determine estimări atât ale parametrilor ecuației de regresie, cât și ale varianței reziduale s 2 ; b) verificați la a=0,05 semnificația ecuației de regresie, i.e. ipotezele H 0: q=0;

c) cu fiabilitatea g=0,8, găsiți estimări de interval ale parametrilor q 0 și q 1; d) cu fiabilitatea g=0,98, determinați și comparați estimările de interval ale așteptărilor matematice condiționate la X 0 =3 și X 1 =6;

e) determinați la g=0,98 intervalul de încredere al predicției la punctul X=8.

2.9. Cost ( y) un exemplar al cărții în funcție de tiraj ( X) (mii de exemplare) se caracterizează prin datele culese de editură (Tabelul 2.6). Determinați estimările celor mai mici pătrate și parametrii unei ecuații de regresie hiperbolice, cu fiabilitate g=0,9, construiți intervale de încredere pentru parametrii q 0 și q 1, precum și așteptarea condiționată la X=10.

Tabelul 2.6.

Determinați estimările și parametrii ecuației de regresie de forma , testați ipoteza H 0 la a = 0,05: q 1 = 0 și construiți intervale de încredere cu fiabilitatea g = 0,9 pentru parametrii q 0 și q 1 și așteptarea matematică condiționată la X=20.

2.11. În tabel 2.8 au prezentat date privind ratele de creștere (%) ale următorilor indicatori macroeconomici n=10 țări dezvoltate ale lumii pentru 1992: PNB - X(1) , producție industrială - X(2) , indicele prețurilor - X (3) .

Tabelul 2.8.

Țări x și parametrii ecuației de regresie, estimarea varianței reziduale; b) se verifică la a=0,05 semnificația coeficientului de regresie, adică. H0: q1 =0; c) cu fiabilitatea g=0,9, găsiți estimările de interval q 0 și q 1; d) găsiți la g=0,95 intervalul de încredere pentru la punctul X 0 =x i, Unde i=5; e) comparați caracteristicile statistice ale ecuațiilor de regresie: 1, 2 și 3.

2.12. Rezolvați problema 2.11 luând ( la) index X(1) , iar pentru motive explicative ( X) variabil X (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Statistica aplicată și fundamentele econometriei: manual. M., UNITATEA, 1998 (ediția a II-a 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Statistica aplicata in probleme si exercitii: Manual. M. UNITATE - DANA, 2001;

3. Ayvazyan S.A., Enyukov I.S., Meshalkin L.D. Statistici aplicate. Cercetarea dependenței. M., Finanţe şi Statistică, 1985, 487 p.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov I.S., Meshalkin L.D. Statistici aplicate. Clasificare și reducerea dimensiunilor. M., Finanţe şi Statistică, 1989, 607 p.;

5. Johnston J. Econometric methods, M.: Statistics, 1980, 446 p.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Metode statistice multivariate. M., Finanţe şi Statistică, 2000;

7. Mkhitaryan V.S., Troshin L.I. Studiul dependențelor folosind metode de corelare și regresie. M., MESI, 1995, 120 p.;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Metode statistice multivariate în economie. M., MESI, 1995, 149 p.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Statistici matematice pentru oameni de afaceri și manageri. M., MESI, 2000, 140 p.;

10. Lukashin Yu.I. Metode de regresie și previziune adaptivă: Manual, M., MESI, 1997.

11. Lukashin Yu.I. Metode adaptative de prognoză pe termen scurt. - M., Statistică, 1979.


APLICAȚII


Anexa 1. Opțiuni pentru sarcini pentru cercetare independentă pe computer.

CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane