Aflați matricea inversă (X T X) -1

Ecuație de regresie multiplă în formă naturală și standardizată. Coeficienți de regresie standardizați

Coeficienții ecuației de regresie, ca orice indicatori absoluti, nu pot fi utilizați într-o analiză comparativă dacă unitățile de măsură ale variabilelor corespunzătoare sunt diferite. De exemplu, dacă y - cheltuielile familiei pentru mâncare, X 1 - dimensiunea familiei și X 2 este venitul total al familiei și definim o dependență de tip = a + b 1 X 1 + b 2 X 2 și b 2 > b 1 , atunci aceasta nu înseamnă că X 2 efect mai puternic asupra y , Cum X 1 , deoarece b 2 este modificarea cheltuielilor familiei cu o modificare a venitului cu 1 rublă și b 1 - modificarea cheltuielilor la modificarea mărimii familiei cu 1 persoană.

Comparabilitatea coeficienților ecuației de regresie se realizează luând în considerare ecuația de regresie standardizată:

y 0 \u003d  1 x 1 0 +  2 x 2 0 + ... +  m x m 0 + e,

unde y 0 și X 0 k valori variabile standardizate y și X k :

S y și S sunt abaterile standard ale variabilelor y și X k ,

k (k=) -coeficienții ecuației de regresie (dar nu și parametrii ecuației de regresie, spre deosebire de notația dată mai devreme). -coeficienții arată cu ce parte a abaterii sale standard (S y) se va modifica variabila dependentă y dacă variabila independentă X k se va modifica prin abaterea sa standard (S). Estimările parametrilor ecuației de regresie în termeni absoluți (b k) și coeficienții β sunt legate prin relația:

Coeficienții  ai ecuației de regresie la o scară standardizată creează o idee reală a impactului variabilelor independente asupra indicatorului modelat. Dacă valoarea coeficientului  pentru orice variabilă depășește valoarea coeficientului  corespunzător pentru o altă variabilă, atunci influența primei variabile asupra modificării indicatorului efectiv ar trebui recunoscută ca fiind mai semnificativă. Trebuie avut în vedere faptul că ecuația de regresie standardizată, datorită concentrării variabilelor, nu are termen liber prin construcție.

Pentru regresia simplă, coeficientul  coincide cu coeficientul de corelație de pereche, ceea ce face posibilă acordarea coeficientului de corelație de pereche un sens semantic.

Atunci când se analizează impactul indicatorilor incluși în ecuația de regresie asupra trăsăturii modelate, se folosesc și coeficienții de elasticitate împreună cu coeficienții . De exemplu, indicatorul de elasticitate medie este calculat prin formula

și arată câte procente se va modifica în medie variabila dependentă dacă valoarea medie a variabilei independente corespunzătoare se modifică cu un procent (ceteris paribus).

2.2.9. Variabile discrete în analiza regresiei

De obicei, variabilele din modelele de regresie au intervale continue. Cu toate acestea, teoria nu impune nicio restricție asupra naturii unor astfel de variabile. Destul de des este necesar să se ia în considerare în analiza de regresie influența caracteristicilor calitative și dependența acestora de diverși factori. În acest caz, devine necesară introducerea unor variabile discrete în modelul de regresie. Variabilele discrete pot fi independente sau dependente. Să luăm în considerare aceste cazuri separat. Să considerăm mai întâi cazul variabilelor independente discrete.

Variabile fictive în analiza de regresie

Pentru a include caracteristici calitative ca variabile independente în regresie, acestea trebuie digitizate. O modalitate de a le digitiza este utilizarea variabilelor fictive. Numele nu are succes în totalitate - nu sunt fictive, este doar mai convenabil în aceste scopuri să folosiți variabile care iau doar două valori - zero sau una. Asta numesc ei fictiv. De obicei, o variabilă calitativă poate lua mai multe niveluri-valori. De exemplu, gen - masculin, feminin; calificare - mare, medie, scăzută; sezonalitate - trimestrele I, II, III și IV etc. Există o regulă conform căreia, pentru a digitiza astfel de variabile, este necesară introducerea numărului de variabile fictive, cu unul mai puțin decât numărul de niveluri ale indicatorului modelat. . Acest lucru este necesar pentru ca astfel de variabile să nu fie dependente liniar.

În exemplele noastre, sexul este o variabilă, egală cu 1 pentru bărbați și 0 pentru femei. Calificarea are trei niveluri, deci sunt necesare două variabile fictive: de exemplu, z 1 = 1 pentru nivel înalt, 0 pentru altele; z 2 = 1 pentru nivelul mediu, 0 pentru altele. Este imposibil să introduceți o a treia variabilă similară, deoarece în acest caz s-ar dovedi a fi dependente liniar (z 1 + z 2 + z 3 \u003d 1), determinantul matricei (X T X) ar merge la zero și ar găsi matricea inversă (X T X) -1 nu ar fi reușit. După cum știți, estimările parametrilor ecuației de regresie sunt determinate din raportul: T X) -1 X T Y).

Coeficienții pentru variabilele fictive arată modul în care valoarea variabilei dependente diferă la nivelul analizat față de nivelul lipsă. De exemplu, dacă nivelul salarial a fost modelat în funcție de mai multe caracteristici și nivel de calificare, atunci coeficientul de la z 1 ar arăta cât de mult diferă salariul specialiștilor cu un nivel ridicat de calificare de salariul unui specialist cu un nivel scăzut de calificare , toate celelalte fiind egale, iar coeficientul de la z 2 - o semnificație similară pentru specialiștii cu un nivel mediu de calificare. În cazul sezonalității, ar trebui introduse trei variabile fictive (dacă sunt luate în considerare datele trimestriale) iar coeficienții pentru acestea ar arăta cât de mult diferă valoarea variabilei dependente pentru trimestrul corespunzător de nivelul variabilei dependente pentru trimestru care nu a fost introdus când au fost digitalizate.

Variabilele fictive sunt, de asemenea, introduse pentru a modela schimbările structurale în dinamica indicatorilor studiați în analiza seriilor temporale.

Exemplul 4 Ecuație de regresie standardizată și variabile fictive

Luați în considerare un exemplu de utilizare a coeficienților standardizați și a variabilelor fictive pe exemplul unei analize a pieței apartamentelor cu două camere pe baza ecuației de regresie multiplă cu următorul set de variabile:

PRET - pret;

TOTSP - suprafata totala;

LIVSP - living;

KITSP - zona de bucatarie;

DIST - distanta pana la centrul orasului;

WALK - egal cu 1 daca la statia de metrou se poate ajunge pe jos si egal cu 0 daca trebuie sa folosesti transportul in comun;

CARAMIDA - egala cu 1 daca casa este caramida si egala cu 0 daca este panou;

ETAJ - egal cu 1 daca apartamentul nu este la primul sau ultimul etaj si egal cu 0 in caz contrar;

TEL - egal cu 1 daca apartamentul are telefon si egal cu 1 daca nu;

BAL este egal cu 1 dacă există balcon și egal cu 0 dacă nu există balcon.

Calculele au fost efectuate folosind software-ul STATISTICA (Figura 2.23). Prezența coeficienților  vă permite să ordonați variabilele în funcție de gradul de influență a acestora asupra variabilei dependente. Să analizăm pe scurt rezultatele calculului.

Pe baza statisticilor lui Fisher, concluzionăm că ecuația de regresie este semnificativă (nivelul p< 0,05). Обработана информация о 6 286 квартирах (n–m–1 = 6 276, а m = 9). Все коэффициенты уравнения регрессии (кроме при переменной BAL) значимы (р-величины для них < 0,05), а наличие или отсутствие балкона в этом случае существенно не сказывается на цене квартиры.

Figura 2.24 – Raportul pieței apartamentelor bazat pe STATISTICA PPP

Coeficientul de determinare multiplă este de 52%, prin urmare, variabilele incluse în regresie determină modificarea prețului cu 52%, iar restul de 48% din modificarea prețului unui apartament depinde de factori necontabiliați. Inclusiv din fluctuațiile aleatorii ale prețurilor.

Fiecare dintre coeficienții variabilei arată cât de mult se va modifica prețul unui apartament (ceteris paribus) dacă această variabilă se modifică cu una. Deci, de exemplu, atunci când modificați suprafața totală cu 1 mp. m, prețul unui apartament se va modifica în medie cu 0,791 USD, iar când apartamentul se află la 1 km distanță de centrul orașului, prețul unui apartament va scădea în medie cu 0,596 USD. etc. Variabile fictive (ultimele 5) arată cât de mult se va schimba în medie prețul unui apartament dacă treci de la un nivel al acestei variabile la altul. Deci, de exemplu, dacă casa este din cărămidă, atunci apartamentul din ea este în medie de 3.104 USD. e. mai scump decât același într-o casă cu panouri, iar prezența unui telefon într-un apartament îi crește prețul cu o medie de 1.493 USD. e., etc.

Pe baza coeficienților  se pot trage următoarele concluzii. Cel mai mare coeficient , egal cu 0,514, este coeficientul pentru variabila „suprafața totală”, prin urmare, în primul rând, prețul unui apartament se formează sub influența suprafeței sale totale. Următorul factor în ceea ce privește gradul de influență asupra modificării prețului unui apartament este distanța până la centrul orașului, apoi materialul din care este construită casa, apoi zona bucătăriei etc. .

Pagina 1


Coeficienții de regresie standardizați arată câte sigma se va schimba rezultatul în medie dacă factorul corespunzător x se modifică cu o sigma, în timp ce nivelul mediu al altor factori rămâne neschimbat. Datorită faptului că toate variabilele sunt setate ca centrate și normalizate, coeficienții standardizați de reness D sunt comparabili între ei. Comparându-i unul cu altul, puteți clasifica factorii în funcție de puterea impactului lor asupra rezultatului. Acesta este principalul avantaj al coeficienților de recurs standardizați, în contrast cu coeficienții de recurs puri, care sunt incomparabili între ei.

Consistența corelației parțiale și a coeficienților de regresie standardizați este cel mai clar văzută dintr-o comparație a formulelor lor într-o analiză cu doi factori.

Consistența corelației parțiale și a coeficienților de regresie standardizați este cel mai clar văzută dintr-o comparație a formulelor lor într-o analiză bidirecțională.

Pentru a determina valorile estimărilor la coeficienții de regresie standardizați a (se folosesc cel mai des următoarele metode de rezolvare a unui sistem de ecuații normale: metoda determinanților, metoda rădăcinii pătrate și metoda matricei. Recent, metoda matricei a avut a fost utilizat pe scară largă pentru rezolvarea problemelor de analiză de regresie.Aici considerăm soluția unui sistem de ecuații normale prin metoda determinanților.

Cu alte cuvinte, în analiza cu doi factori, coeficienții de corelație parțială sunt coeficienți de regresie standardizați înmulțiți cu rădăcina pătrată a raportului dintre cotele variațiilor reziduale ale factorului fix la factor și la rezultat.

Există o altă posibilitate de a evalua rolul caracteristicilor grupării, semnificația lor pentru clasificare: pe baza coeficienților de regresie standardizați sau a coeficienților de determinare separați (vezi cap.

După cum se vede din tabel. 18, componentele compoziției studiate au fost repartizate în funcție de valoarea absolută a coeficienților de regresie (b5) cu eroarea lor pătrată (sbz) pe rând de la monoxid de carbon și acizi organici la aldehide și vapori de ulei. La calcularea coeficienților de regresie standardizați (p), s-a dovedit că, ținând cont de intervalul de fluctuații ale concentrațiilor, cetonele și monoxidul de carbon ies în prim-plan în formarea toxicității amestecului în ansamblu, în timp ce acizii organici rămân. pe locul trei.

Coeficienții de regresie condiționat puri bf sunt numere numite exprimate în diferite unități de măsură și, prin urmare, sunt incomparabili între ei. Pentru a le converti în indicatori relativi comparabili, se aplică aceeași transformare ca și pentru obținerea coeficientului de corelație de pereche. Valoarea rezultată se numește coeficient de regresie standardizat sau - coeficient.

Coeficienții de regresie condiționat-pură A; sunt numere numite, exprimate în diferite unități de măsură și, prin urmare, sunt incomparabile între ele. Pentru a le converti în indicatori relativi comparabili, se aplică aceeași transformare ca și pentru obținerea coeficientului de corelație de pereche. Valoarea rezultată se numește coeficient de regresie standardizat sau - coeficient.

În procesul de elaborare a standardelor de personal, sunt colectate date inițiale despre numărul de personal de conducere și valorile factorilor pentru întreprinderile de bază selectate. În continuare, sunt selectați factori semnificativi pentru fiecare funcție pe baza analizei de corelație, pe baza valorii coeficienților de corelație. Sunt selectați factorii cu cea mai mare valoare a coeficientului de corelație de pereche cu funcția și a coeficientului de regresie standardizat.

Rezultatele calculelor de mai sus fac posibilă aranjarea în ordine descrescătoare a coeficienților de regresie corespunzători amestecului studiat, cuantificând astfel gradul de pericol al acestora. Totuși, coeficientul de regresie obținut în acest mod nu ia în considerare intervalul de fluctuații posibile ale fiecărui component din amestec. Ca urmare, produsele de degradare cu coeficienți de regresie mari, dar care fluctuează într-un interval mic de concentrații, pot avea un efect mai mic asupra efectului toxic total decât ingredientele cu b relativ mic, al căror conținut în amestec variază într-un interval mai larg. Prin urmare, pare oportună efectuarea unei operații suplimentare - calculul așa-numiților coeficienți de regresie standardizați p (J.

Pagini:      1

Exercițiu.

  1. Pentru un anumit set de date, construiți un model de regresie multiplă liniară. Evaluați acuratețea și adecvarea ecuației de regresie construită.
  2. Oferiți o interpretare economică a parametrilor modelului.
  3. Calculați coeficienții modelului standardizat și scrieți ecuația de regresie în formă standardizată. Este adevărat că prețul unui bun are o influență mai mare asupra volumului ofertei unui bun decât salariile angajaților?
  4. Pentru modelul rezultat (în formă naturală), se verifică homoscedasticitatea reziduurilor prin aplicarea testului Goldfeld-Quandt.
  5. Verificați modelul rezultat pentru autocorelația reziduală utilizând testul Durbin-Watson.
  6. Verificați dacă ipoteza despre omogenitatea datelor originale este adecvată în sensul regresiei. Este posibil să combinați două eșantioane (pentru primele 8 și celelalte 8 observații) într-una singură și să luați în considerare un singur model de regresie Y pe X?

1. Estimarea ecuației de regresie. Să definim vectorul estimărilor coeficienților de regresie folosind serviciul Ecuație de regresie multiplă. Conform metodei celor mai mici pătrate, vectorul s se obţine din expresia: s = (X T X) -1 X T Y
Matricea X

1 182.94 1018
1 193.45 920
1 160.09 686
1 157.99 405
1 123.83 683
1 152.02 530
1 130.53 525
1 137.38 418
1 137.58 425
1 118.78 161
1 142.9 242
1 99.49 226
1 116.17 162
1 185.66 70

Matricea Y
4.07
4
2.98
2.2
2.83
3
2.35
2.04
1.97
1.02
1.44
1.22
1.11
0.82

XT Matrix
1 1 1 1 1 1 1 1 1 1 1 1 1 1
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

Înmulțiți matrice, (X T X)
2.25 -0.0161 0.00037
-0.0161 0.000132 -7,0E-6
0.00037 -7,0E-61.0E-6

Vectorul estimărilor coeficienților de regresie este egal cu

Y(X) =
2,25 -0,0161 0,00037
-0,0161 0,000132 -7,0E-6
0,00037 -7,0E-61.0E-6
*
31,05
4737,044
18230,79
=
0,18
0,00297
0,00347

Ecuația de regresie (evaluarea ecuației de regresie)
Y = 0,18 + 0,00297X 1 + 0,00347X 2

2. Matricea coeficienților de corelație perechi R. Numărul de observații n = 14. Numărul de variabile independente din model este 2, iar numărul de regresori, ținând cont de vectorul unitar, este egal cu numărul de coeficienți necunoscuți. Ținând cont de semnul Y, dimensiunea matricei devine egală cu 4. Matricea variabilelor independente X are dimensiunea (14 x 4).
Matrice compusă din Y și X

1 4.07 182.94 1018
1 4 193.45 920
1 2.98 160.09 686
1 2.2 157.99 405
1 2.83 123.83 683
1 3 152.02 530
1 2.35 130.53 525
1 2.04 137.38 418
1 1.97 137.58 425
1 1.02 118.78 161
1 1.44 142.9 242
1 1.22 99.49 226
1 1.11 116.17 162
1 0.82 185.66 70

Matricea transpusă.

1 1 1 1 1 1 1 1 1 1 1 1 1 1
4.07 4 2.98 2.2 2.83 3 2.35 2.04 1.97 1.02 1.44 1.22 1.11 0.82
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

A T A matrice.

14 31.05 2038.81 6471
31.05 83.37 4737.04 18230.79
2038.81 4737.04 307155.61 995591.55
6471 18230.79 995591.55 4062413

Matricea rezultată are următoarea corespondență:

∑n∑y∑x1∑x2
∑y∑y2∑x1y∑x2y
∑x1∑yx 1∑x 1 2∑x2x1
∑x2∑yx2∑x1x2∑x 2 2

Să găsim coeficienții de corelație perechi.
Caracteristicile x și y∑(x i ) ∑(y i ) ∑(x i y i )
Pentru y și x 1 2038.81 145.629 31.05 2.218 4737.044 338.36
Pentru y și x 2 6471 462.214 31.05 2.218 18230.79 1302.199
Pentru x 1 și x 2 6471 462.214 2038.81 145.629 995591.55 71113.682
Caracteristicile x și y
Pentru y și x 1 731.797 1.036 27.052 1.018
Pentru y și x 2 76530.311 1.036 276.641 1.018
Pentru x 1 și x 2 76530.311 731.797 276.641 27.052

Matricea coeficienților de corelație perechi R:
- yx 1x2
y 1 0.558 0.984
x 1 0.558 1 0.508
x2 0.984 0.508 1

Pentru a selecta cei mai semnificativi factori x i, se iau în considerare următoarele condiții:
- relația dintre caracteristica efectivă și factor ar trebui să fie mai mare decât relația de interfactor;
- relația dintre factori nu trebuie să fie mai mare de 0,7. Dacă matricea are un coeficient de corelație interfactorială r xjxi > 0,7, atunci există multicoliniaritate în acest model de regresie multiplă.;
- cu o relaţie interfactorială ridicată a unei trăsături se selectează factori cu un coeficient de corelaţie mai mic între ei.
În cazul nostru, toți coeficienții de corelație de pereche |r| Modelul de regresie pe o scară standard Modelul de regresie pe o scară standard presupune că toate valorile caracteristicilor studiate sunt convertite în standarde (valori standardizate) folosind formulele:

unde x ji este valoarea variabilei x ji din observația i-a.

Astfel, originea fiecărei variabile standardizate este combinată cu valoarea medie a acesteia, iar abaterea sa standard este luată ca unitate de modificare. S.
Dacă relația dintre variabilele la scară naturală este liniară, atunci schimbarea originii și unității de măsură nu va încălca această proprietate, astfel încât variabilele standardizate vor fi legate printr-o relație liniară:
t y = ∑β j t xj
Pentru a estima coeficienții β, folosim metoda celor mai mici pătrate. În acest caz, sistemul de ecuații normale va avea forma:
r x1y =β 1 +r x1x2 β 2 + ... + r x1xm β m
r x2y =r x2x1 β 1 + β 2 + ... + r x2xm β m
...
r xmy =r xmx1 β 1 + r xmx2 β 2 + ... + β m
Pentru datele noastre (luăm din matricea coeficienților de corelație perechi):
0,558 = β 1 + 0,508β 2
0,984 = 0,508β 1 + β 2
Acest sistem de ecuații liniare se rezolvă prin metoda Gauss: β 1 = 0,0789; β2 = 0,944;
Forma standardizată a ecuației de regresie este:
y 0 = 0,0789x1 + 0,944x2
Coeficienții β găsiți din acest sistem fac posibilă determinarea valorilor coeficienților în regresie la scară naturală folosind formulele:

Coeficienți standardizați de regresie parțială. Coeficienți standardizați de regresie parțială - coeficienții β (β j) arată cu ce parte a abaterii sale standard S (y) se va schimba semnul rezultat y cu o modificare a factorului corespunzător x j cu valoarea abaterii sale standard (S xj) cu aceeași influență a altor factori (incluși în ecuație).
După maximul β j, se poate judeca care factor are cea mai mare influență asupra rezultatului Y.
În funcție de coeficienții de elasticitate și coeficienții β, se pot trage concluzii opuse. Motivele pentru aceasta sunt: ​​a) variația unui factor este foarte mare; b) influenţa multidirecţională a factorilor asupra rezultatului.
Coeficientul β j poate fi interpretat și ca un indicator al influenței directe (imediate). j--lea factor (x j) pe rezultatul (y). În regresie multiplă j Cel de-al-lea factor are nu numai influență directă, ci și indirectă (indirectă) asupra rezultatului (adică influență prin alți factori ai modelului).
Influența indirectă este măsurată prin valoarea: ∑β i r xj,xi , unde m este numărul de factori din model. Influență deplină j-a factorul pe rezultat egal cu suma influențelor directe și indirecte măsoară coeficientul de corelație liniară pereche a acestui factor și rezultatul - r xj,y .
Deci, pentru exemplul nostru, influența directă a factorului x 1 asupra rezultatului Y în ecuația de regresie este măsurată prin β j și este 0,0789; influența indirectă (indirectă) a acestui factor asupra rezultatului este definită ca:
r x1x2 β 2 = 0,508 * 0,944 = 0,4796

În econometrie, o abordare diferită este adesea folosită pentru a determina parametrii regresiei multiple (2.13) cu coeficientul exclus:

Împărțiți ambele părți ale ecuației la abaterea standard a variabilei explicate S Yși reprezentați-l sub forma:

Împărțiți și înmulțiți fiecare termen cu abaterea standard a variabilei factoriale corespunzătoare pentru a ajunge la variabilele standardizate (centrate și normalizate):

unde noile variabile sunt notate ca

.

Toate variabilele standardizate au o medie de zero și aceeași varianță de unu.

Ecuația de regresie în formă standardizată este:

Unde
- coeficienţi de regresie standardizaţi.

Coeficienți de regresie standardizați diferită de coeficienți forma obișnuită, naturală, prin aceea că valoarea lor nu depinde de scara de măsurare a variabilelor explicate și explicative ale modelului. În plus, există o relație simplă între ei:

, (3.2)

ceea ce oferă o altă modalitate de calculare a coeficienților prin valori cunoscute , ceea ce este mai convenabil în cazul, de exemplu, a unui model de regresie cu doi factori.

5.2. Sistem normal de ecuații cu cele mai mici pătrate în standardizat

variabile

Se pare că pentru a calcula coeficienții regresiei standardizate, trebuie doar să cunoașteți coeficienții perechi ai corelației liniare. Pentru a arăta cum se face acest lucru, excludem necunoscutul din sistemul normal de ecuații ale celor mai mici pătrate folosind prima ecuație. Înmulțirea primei ecuații cu (
) și adunând-o termen cu termen cu a doua ecuație, obținem:

Înlocuirea expresiilor din paranteze cu notația pentru varianță și covarianță

Să rescriem a doua ecuație într-o formă convenabilă pentru simplificare suplimentară:

Împărțiți ambele părți ale acestei ecuații la abaterea standard a variabilelor S Yși ` S X 1 , iar fiecare termen este împărțit și înmulțit cu abaterea standard a variabilei corespunzătoare numărului termenului:

Prezentarea caracteristicilor unei relații statistice liniare:

și coeficienți de regresie standardizați

,

primim:

După transformări similare ale tuturor celorlalte ecuații, sistemul normal de ecuații LSM liniare (2.12) ia următoarea formă, mai simplă:

(3.3)

5.3. Opțiuni de regresie standardizate

Coeficienții de regresie standardizați în cazul particular al unui model cu doi factori sunt determinați din următorul sistem de ecuații:

(3.4)

Rezolvând acest sistem de ecuații, găsim:

, (3.5)

. (3.6)

Înlocuind valorile găsite ale coeficienților de corelație de pereche în ecuațiile (3.4) și (3.5), obținem și . Apoi, folosind formulele (3.2), este ușor de calculat estimările pentru coeficienți și , iar apoi, dacă este necesar, calculați estimarea conform formulei

6. Posibilităţi de analiză economică bazată pe un model multifactorial

6.1. Coeficienți de regresie standardizați

Coeficienții de regresie standardizați arată câte abateri standard modificarea mediei variabilei explicate Y dacă variabila explicativă corespunzătoare X i se va schimba cu suma
una dintre abaterile sale standard, menținând în același timp aceleași valori ale nivelului mediu al tuturor celorlalți factori.

Datorită faptului că în regresia standardizată toate variabilele sunt date ca variabile aleatoare centrate și normalizate, coeficienții comparabile între ele. Comparându-le între ele, puteți clasa factorii corespunzători X i prin puterea impactului asupra variabilei care se explică Y. Acesta este principalul avantaj al coeficienților de regresie standardizați din coeficienți regresii în formă naturală, care sunt incomparabile între ele.

Această caracteristică a coeficienților de regresie standardizați face posibilă utilizarea la eliminarea factorilor mai puțin semnificativi X i cu valori aproape de zero ale estimărilor lor de eșantion . Decizia de a le exclude din ecuația modelului de regresie liniară se ia după testarea ipotezelor statistice despre egalitatea valorii sale medii la zero.

Coeficientul beta egal cu 0,074 (Tabelul 3.2.1) arată că dacă salariile reale se modifică cu valoarea abaterii lor standard (σx1), atunci rata de creștere naturală a populației se va modifica cu o medie de 0,074 σy. Coeficientul beta egal cu 0,02 arată că, dacă rata de căsătorie totală se modifică cu valoarea deviației sale standard (cu σx2), atunci rata naturală de creștere a populației se va modifica cu o medie de 0,02 σy. În mod similar, o modificare a numărului de infracțiuni la 1000 de persoane cu valoarea abaterii sale standard (cu σх3) va duce la o modificare a caracteristicii efective cu o medie de 0,366 σy și la o modificare a intrării în metri pătrați de locuințe. spații pe persoană pe an prin valoarea abaterii sale standard (cu σх4) duce la o modificare a caracteristicii efective cu o medie de 1,32σу.

Coeficientul de elasticitate arată câte procente y se modifică în medie cu o modificare a factorului de semn cu 1%. Din analiza seriei de dinamică se știe că valoarea de 1% a creșterii indicatorului efectiv este negativă, întrucât în ​​toate unitățile populației se constată o scădere naturală a populației. Prin urmare, creșterea înseamnă de fapt o scădere a pierderii. Deci, coeficienții negativi de elasticitate în acest caz reflectă faptul că, cu o creștere a fiecărei caracteristici a factorilor cu 1%, coeficientul de uzură naturală va scădea cu numărul corespunzător de procente. Odată cu o creștere a salariilor reale cu 1%, rata de uzură va scădea cu 0,219%, cu o creștere a ratei de căsătorie totală cu 1%, aceasta va scădea cu 0,156%. O creștere a numărului de infracțiuni la 1.000 de persoane cu 1% se caracterizează printr-o reducere a scăderii naturale a populației cu 0,564. Desigur, asta nu înseamnă că prin creșterea criminalității este posibilă îmbunătățirea situației demografice. Rezultatele obținute indică faptul că, cu cât sunt salvați mai mulți oameni la 1000 din populație, cu atât mai multe crime se încadrează în această mie. Creșterea intrării mp. locuințe pe persoană pe an cu 1% duce la o reducere a pierderilor naturale cu 0,482%

O analiză a coeficienților de elasticitate și a coeficienților beta arată că factorul de punere în funcțiune a metri pătrați de locuință pe cap de locuitor are cea mai mare influență asupra coeficientului de creștere naturală a populației, deoarece acesta corespunde cu cea mai mare valoare a coeficientului beta (1.32). Totuși, acest lucru nu înseamnă că cele mai mari oportunități de modificare a coeficientului de creștere naturală a populației sunt asociate cu o modificare a acestui dintre factorii luați în considerare. Rezultatul obținut reflectă faptul că cererea de pe piața locuințelor corespunde ofertei, adică cu cât creșterea naturală a populației este mai mare, cu atât este mai mare nevoia acestei populații de locuințe și cu atât se construiește mai mult.

Al doilea ca mărime beta (0,366) corespunde numărului de infracțiuni la 1000 de persoane. Desigur, asta nu înseamnă că prin creșterea criminalității este posibilă îmbunătățirea situației demografice. Rezultatele obținute indică faptul că, cu cât sunt salvați mai mulți oameni la 1000 din populație, cu atât mai multe crime se încadrează în această mie.

Cea mai mare dintre caracteristicile rămase, coeficientul beta (0,074), corespunde indicatorului salariului real. Cele mai mari oportunități de modificare a coeficientului de creștere naturală a populației sunt asociate cu o modificare a acestui dintre factorii luați în considerare. Indicatorul ratei generale de căsătorie este inferior în acest sens cu salariile reale, datorită faptului că scăderea naturală a populației din Rusia se datorează în primul rând mortalității ridicate, a cărei rată de creștere poate fi redusă mai degrabă prin sprijin material decât printr-un sporirea faptelor de căsătorie.

3.3 Gruparea combinată a regiunilor în funcție de salariul real și rata de căsătorie totală

O grupare combinată sau multidimensională este o grupare bazată pe două sau mai multe caracteristici. Valoarea acestei grupări constă în faptul că arată nu numai influența fiecăruia dintre factori asupra rezultatului, ci și influența combinației lor.

Să determinăm efectul salariului real și al ratei totale a căsătoriei asupra natalității la 1.000 de persoane.

Evidențiem grupurile tipice în funcție de caracteristicile subliniate. Pentru a face acest lucru, vom construi și analiza o serie de ierarhizare și intervale pe o bază de factori (valoarea salariului), vom determina numărul de grupuri și dimensiunea intervalului; apoi, în cadrul fiecărei grupe, vom construi o serie clasată și interval în funcție de cel de-al doilea semn (rata de căsătorie) și, de asemenea, vom stabili numărul de grupuri și intervalul. Procedura de realizare a acestei lucrări este prezentată în Capitolul 2, prin urmare, omițând calculele, prezentăm rezultatele. Pentru valoarea salariilor reale se disting 3 grupe tipice, pentru rata nupțială totală - 2 grupe.

Vom realiza un aspect al unui tabel combinat, în care vom prevedea împărțirea populației în grupuri și subgrupe, precum și coloane pentru înregistrarea numărului de regiuni și a natalității la 1000 de persoane din populație. Pentru grupurile și subgrupurile selectate, calculăm ratele natalității (Tabelul 3.3.1)

Tabelul 3.3.1

Influența salariilor reale și a ratei nupității totale asupra natalității.

Să analizăm datele obținute cu privire la dependența natalității de salariul real și a ratei nupității. Deoarece este studiat un semn - rata natalității, vom scrie datele despre acesta într-un tabel de combinații de șah de următoarea formă (Tabelul 3.3.2)

Gruparea combinată vă permite să evaluați gradul de influență asupra natalității fiecărui factor separat și interacțiunea acestora.

Tabelul 3.3.2

Dependența natalității de salariul real și de rata nupității

Să studiem mai întâi efectul asupra natalității al valorii salariilor reale cu o valoare fixă ​​a unei alte caracteristici de grupare - rata nupității. Deci, cu o rată a nupțialității de la 13,2 la 25,625, rata medie a natalității crește pe măsură ce salariile cresc de la 9,04 în grupa I la 9,16 în grupa a 2-a și 9,56 în grupa a 3-a; creşterea natalităţii din salarii în grupa a 3-a faţă de grupa 1 este: 9,56-9,04 = 0,52 persoane la 1000 de locuitori. Cu o rată a nupțialității de 25,625-38,05, creșterea de la aceeași sumă a salariilor este: 10,27-9,49 = 0,78 persoane la 1000 de locuitori. Creșterea din interacțiunea factorilor este: 0,78-0,52=0,26 persoane la 1000 populație. De aici rezultă o concluzie complet firească: o creștere a bunăstării motivează, sau mai degrabă permite, cu încredere în viitor, să realizeze dorința unei persoane de a se căsători și de a crea o familie cu copii. Aceasta arată interacțiunea factorilor.

În același mod, estimăm impactul asupra natalității al ratei de căsătorie la un nivel fix al salariilor. Pentru a face acest lucru, comparăm rata natalității pentru grupurile „a” și „b” din cadrul fiecărui grup în ceea ce privește salariile reale. Creșterea natalității cu o creștere a ratei căsătoriei la 25,625-38,05 la 1000 de locuitori în comparație cu grupul „a” este: în grupa 1 cu un salariu de 5707,9 - 6808,7 ruble. pe lună - 9,49-9,04 \u003d 0,45 persoane la 1000 de locuitori, în grupa a 2-a - 10,01-9,16 \u003d 0,85 persoane la 1000 de locuitori și în grupa a 3-a - 10,27- 9,56=0,71 de persoane la 1000 de locuitori. După cum puteți vedea, decizia de a avea un copil depinde de starea civilă, adică. există o interacțiune a factorilor, dând o creștere de 0,26 persoane la 1000 de locuitori.

Cu o creștere comună a ambilor factori, natalitatea crește de la 9,04 în subgrupa 1 „a” la 10,27 persoane la 1000 populație în subgrupa 3 „b”.

Reprezentanții Comisiei Economice pentru Europa a Națiunilor Unite au anunțat recent că vârsta la prima căsătorie în țările europene a crescut cu cinci ani. Băieții și fetele preferă să se căsătorească și să se căsătorească după 30 de ani. Rușii nu îndrăznesc să se căsătorească înainte de 24-26 de ani. De asemenea, comună în Europa și Rusia a devenit o tendință de reducere a numărului de uniuni matrimoniale. Tinerii preferă din ce în ce mai mult cariera și libertatea personală. Experții autohtoni văd aceste procese ca semne ale unei crize profunde în familia tradițională. În opinia lor, ea își trăiește literalmente ultimele zile. Sociologii susțin că viața privată trece acum printr-o perioadă de restructurare. Familia în sensul obișnuit al cuvântului, care trăiește după schema „mamă-tată-copii”, devine treptat un lucru din trecut. În viața privată, rușii experimentează din ce în ce mai mult, inventează din ce în ce mai multe forme noi de familie care să răspundă cerințelor vremurilor. „Acum, o persoană își schimbă locurile de muncă, profesiile, interesele și locurile de reședință mai des”, a spus Anatoly Vishnevsky, directorul Centrului pentru Demografie Umană și Ecologie, Novye Izvestia. „El își schimbă adesea soții, ceea ce era considerat inacceptabil acum 20 de ani. .”

Sociologii notează că unul dintre motivele creșterii divorțurilor în Rusia este nivelul scăzut de viață al populației. „Potrivit statisticilor, în Rusia sunt cu 10-15% mai multe divorțuri decât în ​​Europa”, a spus domnul Gontmakher (director științific al Centrului de Cercetare și Inovare Socială) pentru NI. - Dar motivele divorțului sunt diferite pentru noi și pentru ei. Superioritatea noastră este dictată în principal de faptul că problemele economice afectează din ce în ce mai mult viața rușilor. Soții se ceartă mai des dacă au condiții de viață înghesuite. Tinerii nu reușesc întotdeauna să trăiască independent. În plus, în regiuni, mulți bărbați beau, nu lucrează și nu își pot întreține familiile. Acest lucru duce și la divorț.

Concluzie

În această lucrare se realizează o analiză statistică și economică a impactului nivelului de trai al populației asupra proceselor de creștere naturală.

O analiză a seriilor de timp a arătat că în ultimii 10 ani a avut loc o creștere a salariilor reale și a minimului de existență. În general, pe parcursul acestor 10 ani, semnul efectiv - coeficientul de creștere naturală - este staționar. Stabilitatea proceselor emergente de schimbare a caracteristicilor selectate este de așa natură încât prognoza este posibilă numai pentru valoarea salariilor reale și rata mortalității. Conform tendinței parabolice construite până în 2010, valoarea prognozată a salariului mediu real va fi de 17473,5 ruble, iar rata mortalității va scădea la 12,75 persoane la 1000.

Gruparea analitică a arătat o relație directă între indicatori: odată cu creșterea salariilor, indicatorii de creștere naturală se îmbunătățesc.

Cu toate acestea, o familie de doi lucrători cu un salariu mediu poate asigura un nivel minim de consum pentru 2 copii din grupul tipic cel mai de jos, 3 copii din grupul tipic mediu și cel mai înalt. Având în vedere că doi copii „înlocuiesc” viețile părinților lor în viitor, o ușoară creștere a populației este posibilă doar în grupurile tipice mijlocii și cele mai înalte, iar apoi doar cu condiția unei rate scăzute a mortalității în comparație cu natalitatea. Potențialul de fertilitate, care este suportat de salarii în Rusia, este scăzut pentru a îmbunătăți situația demografică din țară. Acest lucru dezvăluie doar necesitatea introducerii unui proiect național demografic în Rusia. O creștere a salariilor are un efect mai favorabil asupra ratei mortalității decât asupra natalității.

Construirea unui model de corelație-regresie a relevat că influența simultană a semnelor factorilor (salarii, rate de căsătorie, rate ale criminalității și punerea în funcțiune a locuințelor) asupra productivității (creșterii naturale) se observă cu o putere medie de conexiune. Variația coeficientului de creștere naturală a populației cu 44,9% se caracterizează prin influența unor factori selectați, iar 55,1% prin alte cauze nesocotite și aleatorii. Cele mai mari oportunități de modificare a coeficientului de creștere naturală a populației sunt asociate cu o modificare a valorii salariilor reale.

Gruparea combinată a confirmat că o creștere a bogăției motivează, sau mai degrabă permite, cu încredere în viitor, să realizeze dorința unei persoane de a se căsători și de a crea o familie cu copii.

Și, în sfârșit, este necesar să se evalueze eficiența rezolvării problemei demografiei în țara noastră. În general, impactul pozitiv și eficient al stimulentelor materiale asupra procesului de mișcare naturală a populației a fost dovedit. Un alt lucru este că există un complex de probleme socio-psihologice (alcoolism, violență, sinucidere), care reduc inexorabil dimensiunea populației noastre. Motivul lor principal este atitudinea unei persoane față de sine și față de ceilalți. Dar aceste probleme nu pot fi rezolvate doar de stat; societatea civilă ar trebui să vină în propriul ajutor în problema dispariției, formând valori morale axate pe crearea unei familii prospere.

Iar statul poate și trebuie să facă totul pentru a ridica nivelul și calitatea vieții în țară. Nu se poate spune că statul nostru neglijează aceste îndatoriri. Face tot posibilul să găsească și să încerce diferite căi de ieșire din criza demografică.

Lista literaturii folosite

1) Borisov E.F. Teoria economică: manual - ed. a II-a, revăzută. si suplimentare - M .: TK Velby, Editura Prospekt, 2005. - 544 p.

2) Belousova S. analiza nivelului sărăciei.// Economist.-2006, Nr. 10.-p.67

3) Davydova L. A. Teoria statisticii. Tutorial. Moscova. Bulevard. 2005. 155 pagini;

4) Demografie: Manual / Sub general. ed. PE. Volgin. M.: Editura RAG-urilor, 2003 - 384 p.

5) Efimova E. P. Statistica socială. Moscova. Finanțe și statistici. 2003. 559 pagini;

6) Efimova E.P., Ryabtsev V.M. Teoria generală a statisticii. Ediție educațională. Moscova. Finanțe și statistici. 1991. 304 pagini;

7) Zinchenko A.P. Workshop de teoria generală a statisticii și statisticii agricole. Moscova. Finanțe și statistici. 1988. 328 pagini;

8) Kadomtseva S. Politică socială și populație.// Economist.-2006, Nr. 7.-p.49

9) Kozyrev V.M. Fundamentele economiei moderne: manual. -ed. a II-a, revizuită. si suplimentare –M.: Finanțe și statistică, 2001.-432p.

10) Konygina N. Brintseva G. Demograf Anatoly Vishnevsky despre ceea ce îl face pe un rus să aleagă între copii și confort. 7

11) Nazarova N.G. Curs de statistică socială. Moscova. Finstatinform. 2000. 770 pagini;

13) Fundamentele demografiei: Manual / N.V. Zvereva, I.N. Veselkova, V.V. Elizarov.-M.: Mai sus. Shk., 2004.-374 p.: ill.

14) Adresa președintelui Federației Ruse către Adunarea Federală a Federației Ruse din 26 aprilie 2007.

15) Raisberg B.A., Lozovsky L.Sh., Starodubtseva E.B. Dicționar economic modern. – ed. a IV-a, revizuită. si suplimentare -M.: INFRA-M, 2005.-480s.

16) Rudakova R.P., Bukin L.L., Gavrilov V.I. Atelier de statistică. - Sankt Petersburg: Peter, 2007.-288p.

17) Site-ul web al Serviciului Federal de Statistică www.gks.ru

18) Shaikin D.N. Evaluarea prospectivă a populației Rusiei pe termen mediu.// Întrebări de statistică.-2007, nr. 4 -p.47

SCOR (CHEIA PENTRU CHIPURI)

1-salariu nominal mediu lunar în 2006 (în ruble)

2-indici de prețuri de consum pentru toate tipurile de bunuri și servicii plătite în 2006 ca procent din decembrie anul trecut

3 - salariul mediu lunar real în 2006 (în ruble)

4 - populație la începutul anului 2006

5 - populație la sfârșitul anului 2006

6 - populația medie anuală în 2006

7 - numărul de nașteri în 2006, persoane

8 - numărul deceselor în 2006, oameni

9 - natalitatea în 2006 la 1000 de locuitori

10 - rata mortalității în 2006 la 1000 de locuitori

11 - coeficientul de creștere naturală în 2006 la 1000 de locuitori

12 - valoarea minimului de existență pentru 2006 (în ruble)

13 - numărul de infracțiuni comise la 1000 de locuitori ai populației

14 - punerea în funcțiune a metri pătrați de locuință de persoană pe an

15 - rata totală de căsătorie la 1000 de locuitori

Atasamentul 1

Masa

Salariile reale, freacă.

Anexa 2

Minim de existență, frecare.

Anexa 3

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane