Trova la matrice inversa (X T X) -1

Equazione di regressione multipla in forma naturale e standardizzata. Coefficienti di regressione standardizzati

I coefficienti dell'equazione di regressione, come qualsiasi indicatore assoluto, non possono essere utilizzati nell'analisi comparativa se le unità di misura delle variabili corrispondenti sono diverse. Ad esempio, se – spese familiari per il cibo, X 1 – dimensione della famiglia, e X 2 è il reddito familiare totale e definiamo una relazione del tipo = un+ B 1 X 1 + B 2 X 2 e b 2 > b 1 , allora questo non significa questo X 2 ha un effetto più forte su , Come X 1 , Perché B 2 è la variazione delle spese familiari quando il reddito cambia di 1 rublo, e B 1 – variazione delle spese quando la dimensione della famiglia cambia di 1 persona.

La comparabilità dei coefficienti dell'equazione di regressione si ottiene considerando un'equazione di regressione standardizzata:

y 0 =  1 x 1 0 +  2 x 2 0 + … +  m x m 0 + e,

dove y 0 e X 0 K valori variabili standardizzati E X K :

S y e S – deviazioni standard delle variabili E X K ,

k (k=) coefficienti  dell'equazione di regressione (ma non parametri dell'equazione di regressione, contrariamente alle notazioni precedenti). I coefficienti  mostrano di quale parte della sua deviazione standard (S y) cambierà la variabile dipendente , se la variabile indipendente X K cambierà in base al valore della sua deviazione standard (S). Le stime dei parametri dell'equazione di regressione in termini assoluti (b k) e dei coefficienti β sono legate dalla relazione:

I coefficienti  di un'equazione di regressione su una scala standardizzata forniscono una rappresentazione realistica dell'impatto delle variabili indipendenti sull'indicatore modellato. Se il valore del coefficiente  per una qualsiasi variabile supera il valore del corrispondente coefficiente  per un'altra variabile, allora l'influenza della prima variabile sulla variazione dell'indicatore di performance dovrebbe essere considerata più significativa. Va tenuto presente che l'equazione di regressione standardizzata, a causa della centratura delle variabili, non ha un termine libero per costruzione.

Nella regressione semplice il coefficiente  coincide con il coefficiente di correlazione della coppia, il che rende possibile dare al coefficiente di correlazione della coppia un significato significativo.

Quando si analizza l'impatto degli indicatori inclusi nell'equazione di regressione sulla caratteristica modellata, insieme ai coefficienti , vengono utilizzati anche i coefficienti di elasticità. Ad esempio, l'indicatore di elasticità media viene calcolato dalla formula

e mostra di quale percentuale in media cambierà la variabile dipendente se il valore medio della corrispondente variabile indipendente cambia dell'1% (a parità di tutte le altre condizioni).

2.2.9. Variabili discrete nell'analisi di regressione

In genere, le variabili nei modelli di regressione hanno intervalli continui di variazione. Tuttavia, la teoria non impone alcuna restrizione sulla natura di tali variabili. Molto spesso è necessario tenere conto nell'analisi di regressione dell'influenza delle caratteristiche qualitative e della loro dipendenza da vari fattori. In questo caso diventa necessario introdurre variabili discrete nel modello di regressione. Le variabili discrete possono essere indipendenti o dipendenti. Consideriamo questi casi separatamente. Consideriamo innanzitutto il caso di variabili indipendenti discrete.

Variabili fittizie nell'analisi di regressione

Per includere caratteristiche qualitative nella regressione come variabili indipendenti, devono essere digitalizzate. Un metodo per quantificarli consiste nell'utilizzare variabili fittizie. Il nome non è del tutto appropriato: non sono fittizi, ma per questi scopi è più conveniente utilizzare variabili che assumono solo due valori: zero o uno. Quindi furono chiamati fittizi. Tipicamente, una variabile qualitativa può assumere diversi livelli di valori. Ad esempio, genere: maschio, femmina; qualifica – alta, media, bassa; stagionalità - I, II, III e IV trimestre, ecc. Esiste una regola secondo la quale, per digitalizzare tali variabili, è necessario inserire il numero di variabili dummy, una in meno rispetto al numero di livelli dell'indicatore modellato. Ciò è necessario affinché tali variabili non risultino linearmente dipendenti.

Nei nostri esempi: il genere è una variabile, pari a 1 per gli uomini e 0 per le donne. La qualificazione ha tre livelli, il che significa che sono necessarie due variabili dummy: ad esempio z 1 = 1 per un livello alto, 0 per gli altri; z 2 = 1 per il livello medio, 0 per gli altri. Una terza variabile simile non può essere introdotta, perché in questo caso risulterebbe linearmente dipendente (z 1 + z 2 + z 3 = 1), il determinante della matrice (X T X) si azzererebbe e non sarebbe possibile trovare la matrice inversa (X T X) -1 sarebbe possibile. Come è noto, le stime dei parametri dell'equazione di regressione sono determinate dalla relazione: T X) -1 X T Y).

I coefficienti sulle variabili dummy mostrano quanto differisce il valore della variabile dipendente al livello analizzato rispetto al livello mancante. Ad esempio, se il livello salariale fosse modellato in base a diverse caratteristiche e livello di competenza, il coefficiente per z 1 mostrerebbe come lo stipendio degli specialisti con un alto livello di qualifica differisce dallo stipendio di uno specialista con un basso livello di qualifica, a parità di altre condizioni e il coefficiente per z 2 – un significato simile per gli specialisti con un livello di qualifica medio. Nel caso della stagionalità, dovrebbero essere inserite tre variabili dummy (se si considerano i dati trimestrali) e i coefficienti su di esse mostrerebbero come il valore della variabile dipendente differisce per il trimestre corrispondente dal livello della variabile dipendente per il trimestre che non è stato inserito durante la digitalizzazione.

Vengono inoltre introdotte variabili dummy per modellare i cambiamenti strutturali nella dinamica degli indicatori studiati durante l'analisi delle serie temporali.

Esempio 4. Equazioni di regressione standardizzate e variabili fittizie

Consideriamo un esempio di utilizzo di coefficienti standardizzati e variabili dummy utilizzando l'esempio dell'analisi del mercato degli appartamenti bilocali sulla base di un'equazione di regressione multipla con il seguente insieme di variabili:

PREZZO – prezzo;

TOTSP – superficie totale;

LIVSP – spazio abitativo;

KITSP – zona cucina;

DIST – distanza dal centro città;

CAMMINA – pari a 1 se puoi raggiungere la stazione della metropolitana a piedi e pari a 0 se devi utilizzare i mezzi pubblici;

MATTONE – pari a 1 se la casa è in mattoni e pari a 0 se è a pannelli;

PIANO – pari a 1 se l'appartamento non è al primo o ultimo piano e pari a 0 altrimenti;

TEL – pari a 1 se nell'appartamento è presente il telefono, pari a 1 in caso contrario;

BAL – vale 1 se c'è un balcone ed è uguale a 0 se non c'è balcone.

I calcoli sono stati effettuati utilizzando il software STATISTICA (Figura 2.23). La presenza di coefficienti  consente di ordinare le variabili in base al grado della loro influenza sulla variabile dipendente. Effettuiamo una breve analisi dei risultati del calcolo.

Sulla base delle statistiche di Fisher, concludiamo sul significato dell'equazione di regressione (livello p< 0,05). Обработана информация о 6 286 квартирах (n–m–1 = 6 276, а m = 9). Все коэффициенты уравнения регрессии (кроме при переменной BAL) значимы (р-величины для них < 0,05), а наличие или отсутствие балкона в этом случае существенно не сказывается на цене квартиры.

Figura 2.24 – Report sul mercato degli appartamenti basato su STATISTICA PPP

Il coefficiente di determinazione multipla è del 52%, quindi le variabili incluse nella regressione determinano la variazione del prezzo del 52% e il restante 48% della variazione del prezzo dell'appartamento dipende da fattori non contabilizzati. Anche da fluttuazioni casuali dei prezzi.

Ciascuno dei coefficienti di una variabile mostra quanto cambierà il prezzo di un appartamento (a parità di tutte le altre condizioni) se questa variabile cambia di uno. Quindi, ad esempio, quando la superficie totale cambia di 1 mq. m, il prezzo di un appartamento cambierà in media di 0,791 USD, e se l'appartamento si sposta di 1 km dal centro della città, il prezzo di un appartamento diminuirà in media di 0,596 USD. ecc. Le variabili fittizie (ultime 5) mostrano quanto cambierà il prezzo medio di un appartamento se si passa da un livello di questa variabile a un altro. Quindi, ad esempio, se la casa è di mattoni, l'appartamento al suo interno costa in media 3.104 USD. Cioè, più costoso dello stesso in una casa a pannelli, e la presenza di un telefono nell'appartamento aumenta il suo prezzo in media di 1.493 dollari. e., ecc.

Sulla base dei coefficienti  si possono trarre le seguenti conclusioni. Il coefficiente  più grande, pari a 0,514, è il coefficiente della variabile “superficie totale”, quindi, prima di tutto, il prezzo di un appartamento si forma sotto l'influenza della sua superficie totale. Il prossimo fattore che influenza la variazione del prezzo di un appartamento è la distanza dal centro città, poi il materiale con cui è costruita la casa, poi la zona cucina, ecc.

Pagina 1


I coefficienti di regressione standardizzati mostrano di quanti sigma cambierà il risultato medio se il corrispondente fattore x cambia di un sigma mentre il livello medio degli altri fattori rimane invariato. Dato che tutte le variabili sono specificate come centrate e normalizzate, i coefficienti standardizzati della religione D sono confrontabili tra loro. Confrontandoli tra loro, è possibile classificare i fattori in base alla forza del loro impatto sul risultato. Questo è il vantaggio principale dei coefficienti di confessione standardizzati, in contrasto con i coefficienti di religione pura, che sono incomparabili.

La coerenza della correlazione parziale e dei coefficienti di regressione standardizzati è più chiaramente visibile da un confronto delle loro formule nell'analisi a due fattori.

La coerenza della correlazione parziale e dei coefficienti di regressione standardizzati è più chiaramente visibile da un confronto delle loro formule in analisi bivariata.

Per determinare i valori delle stime ai coefficienti di regressione standardizzati a (vengono spesso utilizzati i seguenti metodi per risolvere un sistema di equazioni normali: il metodo dei determinanti, il metodo della radice quadrata e il metodo della matrice. Recentemente, il metodo della matrice ha è stato ampiamente utilizzato per risolvere problemi di analisi di regressione. Qui considereremo la risoluzione di un sistema di equazioni normali con il metodo dei determinanti.

In altre parole, nell'analisi a due fattori, i coefficienti di correlazione parziale sono coefficienti di regressione standardizzati moltiplicati per la radice quadrata del rapporto tra le quote di varianze residue del fattore fisso rispetto al fattore e al risultato.

Esiste un'altra possibilità per valutare il ruolo delle caratteristiche di raggruppamento e il loro significato per la classificazione: sulla base di coefficienti di regressione standardizzati o coefficienti di determinazione separata (vedi Cap.

Come si può vedere dalla tabella. 18, i componenti della composizione studiata sono stati distribuiti secondo il valore assoluto dei coefficienti di regressione (b5) con il loro errore quadrato (5br) in una serie dal monossido di carbonio e acidi organici alle aldeidi e vapori d'olio. Nel calcolare i coefficienti di regressione standardizzati (p), si è scoperto che, tenendo conto dell'intervallo di fluttuazioni della concentrazione, i chetoni e il monossido di carbonio generalmente vengono in primo piano nella formazione della tossicità della miscela, mentre gli acidi organici rimangono al terzo posto .

I coefficienti di regressione pura condizionale bf sono Numeri Nominati espressi in diverse unità di misura e pertanto non sono confrontabili tra loro. Per convertirli in indicatori relativi comparabili, viene utilizzata la stessa trasformazione utilizzata per ottenere il coefficiente di correlazione a coppie. Il valore risultante è chiamato coefficiente o coefficiente di regressione standardizzato.

Coefficienti di regressione pura condizionale A; sono numeri denominati espressi in unità di misura diverse e sono quindi incomparabili tra loro. Per convertirli in indicatori relativi comparabili, viene utilizzata la stessa trasformazione utilizzata per ottenere il coefficiente di correlazione a coppie. Il valore risultante è chiamato coefficiente o coefficiente di regressione standardizzato.

Nel processo di sviluppo degli standard sull'organico, vengono raccolti i dati iniziali sul numero delle buste paga del personale dirigente e sui valori dei fattori per le imprese di base selezionate. Successivamente, vengono selezionati i fattori significativi per ciascuna funzione in base all'analisi di correlazione, in base al valore dei coefficienti di correlazione. Vengono selezionati i fattori con il valore più alto del coefficiente di correlazione della coppia con la funzione e del coefficiente di regressione standardizzato.

I risultati dei calcoli sopra riportati consentono di disporre in ordine decrescente i coefficienti di regressione corrispondenti alla miscela in esame, e quindi di quantificarne il grado di pericolosità. Tuttavia, il coefficiente di regressione così ottenuto non tiene conto dell'intervallo di possibili fluttuazioni di ciascun componente della miscela. Di conseguenza, i prodotti di distruzione che hanno coefficienti di regressione elevati, ma fluttuano in un intervallo di concentrazione ristretto, possono avere un'influenza minore sull'effetto tossico complessivo rispetto agli ingredienti con b relativamente piccolo, il cui contenuto nella miscela varia in un intervallo più ampio. Sembra quindi opportuno eseguire un'operazione aggiuntiva: il calcolo dei cosiddetti coefficienti di regressione standardizzati p (J.

Pagine:      1

Esercizio.

  1. Per un dato set di dati, costruisci un modello di regressione multipla lineare. Valutare l'accuratezza e l'adeguatezza dell'equazione di regressione costruita.
  2. Fornire un'interpretazione economica dei parametri del modello.
  3. Calcolare i coefficienti standardizzati del modello e scrivere l'equazione di regressione in forma standardizzata. È vero che il prezzo di un bene ha un impatto maggiore sul volume dell’offerta del bene rispetto ai salari dei dipendenti?
  4. Per il modello risultante (in forma naturale), verificare se i residui sono omoschedastici applicando il test di Goldfeld-Quandt.
  5. Testare il modello risultante per l'autocorrelazione dei residui utilizzando il test di Durbin-Watson.
  6. Verificare se l'assunzione di omogeneità dei dati originali nel senso della regressione è adeguata. È possibile combinare due campioni (per le prime 8 e le restanti 8 osservazioni) in uno solo e considerare un unico modello di regressione di Y su X?

1. Stima dell'equazione di regressione. Determiniamo il vettore delle stime dei coefficienti di regressione utilizzando il servizio Equazioni di regressione multipla. Secondo il metodo dei minimi quadrati, il vettore S ottenuto dall'espressione: s = (X T X) -1 X T Y
Matrice X

1 182.94 1018
1 193.45 920
1 160.09 686
1 157.99 405
1 123.83 683
1 152.02 530
1 130.53 525
1 137.38 418
1 137.58 425
1 118.78 161
1 142.9 242
1 99.49 226
1 116.17 162
1 185.66 70

Matrice Y
4.07
4
2.98
2.2
2.83
3
2.35
2.04
1.97
1.02
1.44
1.22
1.11
0.82

Matrice X T
1 1 1 1 1 1 1 1 1 1 1 1 1 1
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

Matrici di moltiplicazione, (X T X)
2.25 -0.0161 0.00037
-0.0161 0.000132 -7.0E-6
0.00037 -7.0E-61.0E-6

Il vettore delle stime dei coefficienti di regressione è uguale a

Y(X) =
2,25 -0,0161 0,00037
-0,0161 0,000132 -7.0E-6
0,00037 -7.0E-61.0E-6
*
31,05
4737,044
18230,79
=
0,18
0,00297
0,00347

Equazione di regressione (stima dell'equazione di regressione)
Y = 0,18 + 0,00297X1 + 0,00347X2

2. Matrice di coefficienti di correlazione accoppiati R. Numero di osservazioni n = 14. Il numero di variabili indipendenti nel modello è 2 e il numero di regressori che tengono conto del vettore unitario è uguale al numero di coefficienti sconosciuti. Tenendo conto del segno Y, la dimensione della matrice diventa pari a 4. La matrice di variabili indipendenti X ha una dimensione (14 x 4).
Matrice composta da Y e X

1 4.07 182.94 1018
1 4 193.45 920
1 2.98 160.09 686
1 2.2 157.99 405
1 2.83 123.83 683
1 3 152.02 530
1 2.35 130.53 525
1 2.04 137.38 418
1 1.97 137.58 425
1 1.02 118.78 161
1 1.44 142.9 242
1 1.22 99.49 226
1 1.11 116.17 162
1 0.82 185.66 70

Matrice trasposta.

1 1 1 1 1 1 1 1 1 1 1 1 1 1
4.07 4 2.98 2.2 2.83 3 2.35 2.04 1.97 1.02 1.44 1.22 1.11 0.82
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

Matrice A T A.

14 31.05 2038.81 6471
31.05 83.37 4737.04 18230.79
2038.81 4737.04 307155.61 995591.55
6471 18230.79 995591.55 4062413

La matrice risultante ha la seguente corrispondenza:

∑n∑a∑x1∑x2
∑a∑a 2∑x 1 anno∑x 2 anni
∑x1∑yx 1∑x1 2∑x2x1
∑x2∑yx 2∑x1x2∑x22

Troviamo i coefficienti di correlazione delle coppie.
Presenta x e y∑(xi) ∑(sì) ∑(x io y io )
Per y e x 1 2038.81 145.629 31.05 2.218 4737.044 338.36
Per y e x 2 6471 462.214 31.05 2.218 18230.79 1302.199
Per x1 e x2 6471 462.214 2038.81 145.629 995591.55 71113.682
Presenta x e y
Per y e x 1 731.797 1.036 27.052 1.018
Per y e x 2 76530.311 1.036 276.641 1.018
Per x1 e x2 76530.311 731.797 276.641 27.052

Matrice dei coefficienti di correlazione di coppia R:
- x1x2
1 0.558 0.984
x1 0.558 1 0.508
x2 0.984 0.508 1

Per selezionare i fattori più significativi x i, vengono prese in considerazione le seguenti condizioni:
- il legame tra la caratteristica risultante e il fattore uno deve essere maggiore del legame interfattore;
- il rapporto tra i fattori non deve essere superiore a 0,7. Se la matrice ha un coefficiente di correlazione tra interfattori r xjxi > 0,7, allora c'è multicollinearità in questo modello di regressione multipla.;
- con un'elevata connessione interfattoriale di una caratteristica, vengono selezionati fattori con un coefficiente di correlazione inferiore tra loro.
Nel nostro caso, tutti i coefficienti di correlazione a coppie |r| Modello di regressione su scala standard Un modello di regressione su scala standard presuppone che tutti i valori delle caratteristiche studiate siano convertiti in standard (valori standardizzati) utilizzando le formule:

dove x ji è il valore della variabile x ji nell'i-esima osservazione.

Pertanto, l'origine di ciascuna variabile standardizzata viene combinata con il suo valore medio e la sua deviazione standard viene presa come unità di variazione S.
Se la relazione tra le variabili su scala naturale è lineare, la modifica dell'origine e dell'unità di misura non violerà questa proprietà, quindi anche le variabili standardizzate saranno correlate da una relazione lineare:
t y = ∑β j t xj
Per stimare i coefficienti β, utilizziamo OLS. In questo caso il sistema di equazioni normali avrà la forma:
r x1y =β 1 +r x1x2 β 2 + ... + r x1xm β m
r x2y =r x2x1 β 1 + β 2 + ... + r x2xm β m
...
r xmy =r xmx1 β 1 + r xmx2 β 2 + ... + β m
Per i nostri dati (li prendiamo dalla matrice dei coefficienti di correlazione delle coppie):
0,558 = β1 + 0,508β2
0,984 = 0,508β1 + β2
Risolviamo questo sistema di equazioni lineari utilizzando il metodo gaussiano: β 1 = 0,0789; β2 = 0,944;
La forma standardizzata dell’equazione di regressione è:
y0 = 0,0789x1 + 0,944x2
I coefficienti β rilevati da questo sistema consentono di determinare i valori dei coefficienti in regressione su scala naturale utilizzando le formule:

Coefficienti di regressione parziale standardizzati. Coefficienti di regressione parziale standardizzati: i coefficienti β (β j) mostrano di quale parte della deviazione standard S(y) cambierà il risultato con una variazione del fattore corrispondente x j del valore della sua deviazione standard (S xj) con l'influenza costante di altri fattori (inclusi nell'equazione).
Dal valore β j massimo si può giudicare quale fattore ha una maggiore influenza sul risultato Y.
I coefficienti di elasticità e i coefficienti β possono portare a conclusioni opposte. Le ragioni di ciò sono: a) la variazione di un fattore è molto ampia; b) influenza multidirezionale dei fattori sul risultato.
Il coefficiente β j può anche essere interpretato come un indicatore di influenza diretta (immediata). J-esimo fattore (x j) sul risultato (y). Nella regressione multipla J Il fattore non ha solo un effetto diretto, ma anche indiretto (indiretto) sul risultato (ovvero, influenza attraverso altri fattori del modello).
L'influenza indiretta è misurata dal valore: ∑β i r xj,xi , dove m è il numero di fattori nel modello. Impatto totale jesimo il fattore sul risultato pari alla somma delle influenze dirette e indirette misura il coefficiente di correlazione della coppia lineare di questo fattore e il risultato - r xj,y.
Nel nostro esempio, quindi, l'influenza diretta del fattore x 1 sul risultato Y nell'equazione di regressione è misurata da β j ed è pari a 0,0789; l’influenza indiretta (mediata) di questo fattore sul risultato è definita come:
rx1x2β2 = 0,508 * 0,944 = 0,4796

In econometria, viene spesso utilizzato un approccio diverso per determinare i parametri di regressione multipla (2.13) con il coefficiente escluso:

Dividiamo entrambi i lati dell'equazione per la deviazione standard della variabile spiegata S Y e presentarlo nella forma:

Dividiamo e moltiplichiamo ogni termine per la deviazione standard della variabile fattore corrispondente per arrivare a variabili standardizzate (centrate e normalizzate):

dove le nuove variabili sono indicate come

.

Tutte le variabili standardizzate hanno una media pari a zero e la stessa varianza pari a uno.

L’equazione di regressione in forma standardizzata è:

Dove
- coefficienti di regressione standardizzati.

Coefficienti di regressione standardizzati differiscono dai coefficienti forma ordinaria e naturale in quanto il loro valore non dipende dalla scala di misurazione delle variabili spiegate ed esplicative del modello. Inoltre, esiste una semplice relazione tra loro:

, (3.2)

che fornisce un altro modo per calcolare i coefficienti da valori conosciuti , più conveniente nel caso, ad esempio, di un modello di regressione a due fattori.

5.2. Sistema normale di equazioni dei minimi quadrati in standardizzato

variabili

Si scopre che per calcolare i coefficienti di regressione standardizzati è necessario conoscere solo i coefficienti di correlazione lineare a coppie. Per mostrare come ciò avviene, escludiamo l'incognita dal normale sistema di equazioni dei minimi quadrati utilizzando la prima equazione. Moltiplicando la prima equazione per (
) e sommandolo termine per termine con la seconda equazione, otteniamo:

Sostituendo le espressioni tra parentesi con le notazioni per varianza e covarianza

Riscriviamo la seconda equazione in una forma conveniente per un'ulteriore semplificazione:

Dividiamo entrambi i lati di questa equazione per la deviazione standard delle variabili S Y E ` S X 1 , e dividi ciascun termine e moltiplicalo per la deviazione standard della variabile corrispondente al numero del termine:

Introducendo le caratteristiche di una relazione statistica lineare:

e coefficienti di regressione standardizzati

,

noi abbiamo:

Dopo trasformazioni simili di tutte le altre equazioni, il sistema normale di equazioni lineari dei minimi quadrati (2.12) assume la seguente forma più semplice:

(3.3)

5.3. Opzioni di regressione standardizzate

I coefficienti di regressione standardizzati nel caso speciale di un modello con due fattori sono determinati dal seguente sistema di equazioni:

(3.4)

Risolvendo questo sistema di equazioni, troviamo:

, (3.5)

. (3.6)

Sostituendo i valori trovati dei coefficienti di correlazione di coppia nelle equazioni (3.4) e (3.5), otteniamo E . Quindi, utilizzando le formule (3.2), è facile calcolare le stime dei coefficienti E , e poi, se necessario, calcolare il preventivo secondo la formula

6. Possibilità di analisi economica basata su un modello multifattoriale

6.1. Coefficienti di regressione standardizzati

I coefficienti di regressione standardizzati mostrano quante deviazioni standard la variabile media spiegata cambierà Y, se la corrispondente variabile esplicativa X io cambierà in base all'importo
una delle sue deviazioni standard mantenendo invariato il livello medio di tutti gli altri fattori.

A causa del fatto che nella regressione standardizzata tutte le variabili sono specificate come variabili casuali centrate e normalizzate, i coefficienti paragonabili tra loro. Confrontandoli tra loro è possibile classificare i fattori ad essi corrispondenti X io dalla forza dell’impatto sulla variabile spiegata Y. Questo è il vantaggio principale dei coefficienti di regressione standardizzati dai coefficienti regressioni in forma naturale, che sono incomparabili.

Questa caratteristica dei coefficienti di regressione standardizzati consente di utilizzarli quando si eliminano i fattori meno significativi X io con valori delle loro stime campionarie prossimi allo zero . La decisione di escluderli dall'equazione del modello di regressione lineare viene presa dopo aver verificato l'ipotesi statistica che il suo valore medio sia uguale a zero.

Un coefficiente beta pari a 0,074 (Tabella 3.2.1) mostra che se i salari reali cambiano del valore della loro deviazione standard (σх1), allora il coefficiente di crescita naturale della popolazione cambierà in media di 0,074 σу. Un coefficiente beta di 0,02 mostra che se il tasso grezzo di matrimonio cambia del valore della sua deviazione standard (di σх2), allora il tasso di crescita naturale della popolazione cambierà in media di 0,02 σу. Allo stesso modo, una variazione del numero di reati per 1000 persone del valore della sua deviazione standard (di σх3) porterà a una modifica della caratteristica risultante in media di 0,366 σу e ad una variazione nell'input di metri quadrati di superficie residenziale locali per persona all'anno per il valore della sua deviazione standard (di σх4) porta a una modifica della caratteristica effettiva in media di 1,32σу.

Il coefficiente di elasticità mostra di quale percentuale in media y cambia con una modifica dell'attributo fattore dell'1%. Dall'analisi delle serie storiche si nota che il valore di un aumento dell'1% di una caratteristica effettiva è negativo, poiché in tutte le unità della popolazione si verifica un calo naturale della popolazione. Pertanto, la crescita significa in realtà una riduzione delle perdite. Ciò significa che i coefficienti di elasticità negativi in ​​questo caso riflettono il fatto che con un aumento dell'1% in ciascuna delle caratteristiche del fattore, il coefficiente di perdita naturale diminuirà del corrispondente numero percentuale. Con un aumento dei salari reali dell’1%, il tasso di declino naturale diminuirà dello 0,219%; con un aumento del tasso di matrimonio complessivo dell’1%, diminuirà dello 0,156%. Un aumento del numero di crimini per 1000 abitanti dell’1% è caratterizzato da una riduzione del declino naturale della popolazione di 0,564. Naturalmente, ciò non significa che l’aumento della criminalità possa migliorare la situazione demografica. I risultati ottenuti indicano che più persone rimangono ogni 1.000 abitanti, più si verificano crimini ogni mille. Ingresso crescente mq. alloggio per persona all’anno dell’1% porta ad una riduzione della perdita naturale dello 0,482%

Dall'analisi dei coefficienti di elasticità e dei coefficienti beta emerge che la maggiore influenza sul tasso di crescita naturale della popolazione è esercitata dal fattore di committenza mq di abitazione pro capite, poiché corrisponde al valore più alto del coefficiente beta (1,32). Tuttavia, ciò non significa che le maggiori opportunità di modificare il tasso di crescita naturale della popolazione siano associate a cambiamenti in questo dei fattori considerati. Il risultato ottenuto riflette il fatto che la domanda nel mercato immobiliare corrisponde all'offerta, ovvero maggiore è la crescita naturale della popolazione, maggiore è la necessità di alloggi di questa popolazione e più viene costruita.

Il secondo coefficiente beta più grande (0,366) corrisponde al numero di crimini ogni 1000 persone. Naturalmente ciò non significa che aumentando la criminalità si possa migliorare la situazione demografica. I risultati ottenuti indicano che più persone rimangono ogni 1.000 abitanti, più si verificano crimini ogni mille.

Il maggiore degli indicatori rimanenti, il coefficiente beta (0,074), corrisponde all'indicatore dei salari reali. Le maggiori opportunità per modificare il tasso di crescita naturale della popolazione sono associate a cambiamenti in questo dei fattori considerati. L'indicatore del tasso di matrimonio complessivo è inferiore a questo riguardo ai salari reali perché il calo naturale della popolazione in Russia è dovuto, innanzitutto, all'elevato tasso di mortalità della popolazione, il cui tasso di crescita può essere ridotto piuttosto dalla sicurezza materiale che dall’aumento del numero dei matrimoni.

3.3 Raggruppamento combinato di regioni per salari reali e tasso di nuzialità complessivo

Il raggruppamento combinato o multidimensionale è un raggruppamento basato su due o più caratteristiche. Il valore di questo raggruppamento sta nel fatto che mostra non solo l'influenza di ciascun fattore sul risultato, ma anche l'influenza della loro combinazione.

Determiniamo l'influenza del valore dei salari reali e del tasso di matrimonio generale sul tasso di natalità per 1000 persone.

Identifichiamo i gruppi tipici in base alle caratteristiche previste. Per fare ciò, costruiremo e analizzeremo serie classificate e intervallate in base all'attributo fattore (valore salariale), determineremo il numero di gruppi e la dimensione dell'intervallo; quindi, all'interno di ciascun gruppo, costruiremo una serie classificata e intervallata in base al secondo criterio (tasso di matrimonio) e imposteremo anche il numero di gruppi e l'intervallo. La procedura per svolgere questo lavoro è presentata nel Capitolo 2, pertanto, tralasciando i calcoli, presentiamo i risultati. Per il valore dei salari reali sono stati identificati 3 gruppi tipici, per il tasso di matrimonio complessivo - 2 gruppi.

Elaboreremo uno schema di tabella combinata in cui prevederemo la divisione della popolazione in gruppi e sottogruppi, nonché colonne per la registrazione del numero di regioni e del tasso di natalità per 1000 abitanti della popolazione. Per i gruppi e sottogruppi selezionati, calcoliamo i tassi di natalità (Tabella 3.3.1)

Tabella 3.3.1

L’influenza dei salari reali e del tasso di matrimonio complessivo sul tasso di natalità.

Analizziamo i dati ottenuti sulla dipendenza del tasso di natalità dai salari reali e dal tasso di matrimonio. Poiché si sta studiando una caratteristica: il tasso di fertilità, scriveremo i dati a riguardo in una tabella di combinazioni di scacchi nella seguente forma (Tabella 3.3.2)

Il raggruppamento combinato consente di valutare separatamente il grado di influenza sul tasso di natalità di ciascun fattore e la loro interazione.

Tabella 3.3.2

Dipendenza del tasso di natalità dai salari reali e dai tassi di matrimonio

Studiamo innanzitutto l'effetto sul tasso di natalità del valore del salario reale a un valore fisso di un'altra caratteristica del raggruppamento: il tasso di matrimonio. Pertanto, con un tasso di matrimonio compreso tra 13,2 e 25,625, il tasso medio di natalità aumenta all'aumentare dei salari da 9,04 nel 1° gruppo a 9,16 nel 2° gruppo e 9,56 nel 3° gruppo; l'aumento della natalità da salario della 3a fascia rispetto alla 1a è: 9,56-9,04 = 0,52 persone ogni 1000 abitanti. Con un tasso di matrimonio di 25,625-38,05, l’aumento a parità di salario è pari a: 10,27-9,49 = 0,78 persone ogni 1000 abitanti. L'aumento derivante dall'interazione dei fattori è pari a: 0,78-0,52 = 0,26 persone per 1000 abitanti. Da ciò segue una conclusione del tutto naturale: un aumento del benessere motiva, o meglio consente, con fiducia nel futuro, di realizzare il desiderio di una persona di sposarsi e di creare una famiglia con figli. Ciò mostra l'interazione dei fattori.

Allo stesso modo, stimeremo l’impatto sul tasso di fertilità del tasso di matrimonio a un livello salariale fisso. Per fare ciò, confrontiamo il tasso di natalità per i gruppi “a” e “b” all’interno di ciascun gruppo in base al valore dei salari reali. L'aumento del tasso di natalità con l'aumento del tasso di matrimonio a 25.625-38.05 per 1.000 abitanti rispetto al gruppo “a” è: nel 1° gruppo con uno stipendio di 5707,9 – 6808,7 rubli. al mese - 9,49-9,04 = 0,45 persone per 1000 abitanti, nel 2° gruppo - 10,01-9,16 = 0,85 persone per 1000 abitanti e nel 3° - 10,27- 9,56=0,71 persone per 1000 abitanti. Come puoi vedere, la decisione di avere un figlio dipende dallo stato civile, cioè. c'è un'interazione di fattori, dando un aumento di 0,26 persone ogni 1000 abitanti.

Con un aumento congiunto di entrambi i fattori, il tasso di natalità aumenta da 9,04 nel sottogruppo 1 “a” a 10,27 persone ogni 1000 abitanti nel sottogruppo 3 “b”.

I rappresentanti della Commissione economica per l'Europa delle Nazioni Unite hanno recentemente annunciato che l'età del primo matrimonio nei paesi europei è aumentata di cinque anni. Ragazzi e ragazze preferiscono sposarsi dopo i 30 anni. I russi non osano sposarsi prima dei 24-26 anni. Comune anche all'Europa e alla Russia è la tendenza alla riduzione del numero dei matrimoni. I giovani preferiscono sempre più la carriera e la libertà personale. Gli esperti nazionali vedono in questi processi i segni di una profonda crisi della famiglia tradizionale. Secondo loro, sta letteralmente vivendo i suoi ultimi giorni. I sociologi affermano che la vita privata sta attraversando un periodo di ristrutturazione. La famiglia nel senso comune del termine, che vive secondo lo schema “mamma-padre-figli”, sta gradualmente diventando un ricordo del passato. Nella vita privata i russi sperimentano sempre più, inventando sempre nuove forme di famiglia che rispondessero alle esigenze del tempo. "Ora una persona cambia più spesso lavoro, professione, interessi, luogo di residenza", ha detto a Novye Izvestia Anatoly Vishnevskij, direttore del Centro per la demografia e l'ecologia umana, "cambia spesso anche coniuge, cosa considerata inaccettabile 20 anni fa" .”

I sociologi notano che uno dei motivi dell'aumento dei divorzi in Russia è il basso tenore di vita della popolazione. "Secondo le statistiche, ci sono circa il 10-15% in più di divorzi in Russia che in Europa", ha detto Gontmakher (direttore scientifico del Centro per la ricerca e l'innovazione sociale) a NI. – Ma le ragioni del divorzio sono diverse per noi e per loro. Il nostro primato è dettato principalmente dal fatto che i problemi economici influiscono sempre più sulla vita dei russi. I coniugi litigano più spesso se hanno condizioni di vita anguste. Non sempre i giovani riescono a vivere in modo indipendente. Inoltre, nelle regioni, molti uomini bevono, non lavorano e non possono provvedere alle proprie famiglie. Anche questo è motivo di divorzio”.

Conclusione

In questo lavoro è stata effettuata un'analisi statistica ed economica dell'influenza del tenore di vita della popolazione sui processi di crescita naturale.

Dall'analisi della dinamica è emerso che negli ultimi 10 anni si è verificato un aumento dei salari reali e del costo della vita. In generale, in questi 10 anni, l'attributo effettivo – il coefficiente di incremento naturale – è stazionario. La stabilità dei processi emergenti di cambiamento delle caratteristiche selezionate è tale che fare una previsione è possibile solo per il valore dei salari reali e del tasso di mortalità. Secondo l’andamento parabolico accumulato, entro il 2010 il valore previsto del salario reale medio sarà di 17.473,5 rubli e il tasso di mortalità scenderà a 12,75 persone su 1.000.

Il raggruppamento analitico ha mostrato una relazione diretta tra gli indicatori: con l'aumento dei salari, gli indicatori di crescita naturale migliorano.

Tuttavia, una famiglia di due lavoratori con uno stipendio medio può fornire un livello minimo di consumo per 2 bambini - nel gruppo tipico più basso, 3 bambini - nel gruppo tipico medio e più alto. Considerando che due bambini “sostituiranno” in futuro la vita dei loro genitori, un leggero aumento della popolazione è possibile solo nei gruppi tipici medi e alti, e quindi a condizione di un tasso di mortalità basso rispetto al tasso di natalità. Il potenziale di fertilità, che deriva dai salari in Russia, è basso per migliorare la situazione demografica del paese. Ciò rivela precisamente la necessità del progetto demografico nazionale introdotto in Russia. Un aumento dei salari ha un effetto più favorevole sul tasso di mortalità che su quello di natalità.

La costruzione di un modello di correlazione-regressione ha rivelato che l’influenza simultanea delle caratteristiche dei fattori (salari, tassi di matrimonio, tassi di criminalità e committenza immobiliare) su quello produttivo (aumento naturale) si osserva con una forza di connessione media. La variazione del tasso di crescita naturale della popolazione del 44,9% è caratterizzata dall'influenza di fattori selezionati e del 55,1% da altre ragioni non contabilizzate e casuali. Le maggiori opportunità di modificare il tasso di crescita naturale della popolazione sono associate a variazioni del valore dei salari reali.

Il gruppo riunito ha confermato che l’aumento del benessere motiva, o meglio permette, con fiducia nel futuro, di realizzare il desiderio di una persona di sposarsi e di creare una famiglia con figli.

Infine, dobbiamo valutare l’efficacia della soluzione del problema demografico nel nostro Paese. In generale, è stata dimostrata l’influenza positiva ed efficace degli incentivi materiali sul processo di movimento naturale delle popolazioni. Un'altra cosa è che esiste un complesso di problemi socio-psicologici (alcolismo, violenza, suicidio) che riducono inesorabilmente la nostra popolazione. La loro ragione principale è l’atteggiamento di una persona verso se stessa e gli altri. Ma questi problemi non possono essere risolti solo dallo Stato; la società civile deve venire in proprio aiuto nel problema dell’estinzione, formando valori morali incentrati sulla creazione di una famiglia prospera.

E lo Stato può e deve fare di tutto per migliorare il livello e la qualità della vita nel Paese. Non si può dire che il nostro Stato trascuri queste responsabilità. Sta facendo tutto il possibile, cercando e tentando diverse vie d’uscita dalla crisi demografica.

Elenco della letteratura usata

1) Borisov E.F. Teoria economica: libro di testo - 2a ed., rivista. e aggiuntivi – M.: TK Welby, casa editrice Prospekt, 2005. – 544 p.

2) Belousova S. analisi del livello di povertà.// Economist.-2006, n. 10.-p.67

3) Davydova L. A. Teoria della statistica. Esercitazione. Mosca. Viale. 2005. 155 pagg.;

4)Demografia: Libro di testo/Parte generale. ed. SUL. Volgina. M.: Casa editrice RAGS, 2003 – 384 p.

5) Efimova E. P. Statistiche sociali. Mosca. Finanza e statistica. 2003. 559 pagg.;

6)Efimova E.P., Ryabtsev V.M. Teoria generale della statistica. Edizione didattica. Mosca. Finanza e statistica. 1991. 304 pp.;

7)Zinchenko A.P. Workshop sulla teoria generale della statistica e sulla statistica agricola. Mosca. Finanza e statistica. 1988. 328 pp.;

8) Kadomtseva S. Politica sociale e popolazione.// Economist.-2006, n. 7.-p.49

9) Kozyrev V.M. Fondamenti di economia moderna: libro di testo. -2a ed., rivista. e aggiuntivi –M.: Finanza e Statistica, 2001.-432 p.

10) Konygina N. Brintseva G. Il demografo Anatoly Vishnevsky su ciò che costringe un russo a scegliere tra i bambini e il comfort. // Rossiyskaya Gazeta. - 2006, 7 novembre - N. 249 - p. 7

11) Nazarova N.G. Corso di statistica sociale. Mosca. Finstatinform. 2000. 770 pp.;

13) Fondamenti di demografia: libro di testo / N.V. Zvereva, I.N. Veselkova, V.V. Elizarov.-M.: Più in alto. Shk., 2004.-374 p.: ill.

14) Discorso del Presidente della Federazione Russa all'Assemblea Federale della Federazione Russa del 26 aprile 2007.

15) Raisberg B.A., Lozovsky L.Sh., Starodubtseva E.B. Dizionario economico moderno. –4a edizione, rivista. e aggiuntivi -M.:INFRA-M, 2005.-480 p.

16) Rudakova R.P., Bukin L.L., Gavrilov V.I. Workshop sulla statistica. -SPb.: Pietro, 2007.-288pp.

17) Sito web del Servizio statistico federale www.gks.ru

18) Shaikin D.N. Valutazione prospettica della popolazione russa a medio termine. // Questioni di statistica. - 2007, N. 4 – p. 47

SISTEMA DI INDICATORI (KEY TO CHIPS)

1-salario nominale medio mensile nel 2006 (in rubli)

2 Indici dei prezzi al consumo per tutti i tipi di beni e servizi a pagamento nel 2006 in percentuale rispetto a dicembre dello scorso anno

3 - Salario reale medio mensile nel 2006 (in rubli)

4 – popolazione all’inizio del 2006

5 – popolazione alla fine del 2006

6 – popolazione media annua nel 2006

7 – numero di nascite nel 2006, persone

8 – numero di morti nel 2006, persone

9 – tasso di natalità nel 2006 per 1000 abitanti

10 – tasso di mortalità nel 2006 per 1000 abitanti

11 – tasso di incremento naturale nel 2006 per 1000 abitanti

12 – costo della vita nel 2006 (in rubli)

13 – numero di reati commessi ogni 1000 persone

14 – messa in servizio di mq di alloggio per persona all'anno

15 – tasso di matrimonio complessivo per 1000 abitanti

Allegato 1

Tavolo

Salari reali, strofina.

Appendice 2

Il costo della vita, strofina.

Appendice 3

CATEGORIE

ARTICOLI POPOLARI

2023 “kingad.ru” - esame ecografico di organi umani