Trova la matrice inversa (X T X) -1

Equazione di regressione multipla in forma naturale e standardizzata. Coefficienti di regressione standardizzati

I coefficienti dell'equazione di regressione, come qualsiasi indicatore assoluto, non possono essere utilizzati in un'analisi comparativa se le unità di misura delle variabili corrispondenti sono diverse. Ad esempio, se si - le spese familiari per il cibo, X 1 - dimensione della famiglia e X 2 è il reddito familiare totale, e definiamo una dipendenza del tipo = un + B 1 X 1 + B 2 X 2 e b 2 > b 1 , allora questo non significa questo X 2 effetto più forte su si , Come X 1 , Perché B 2 è la variazione delle spese familiari con una variazione del reddito di 1 rublo e B 1 - modifica delle spese quando si modifica la dimensione della famiglia di 1 persona.

La comparabilità dei coefficienti dell'equazione di regressione si ottiene considerando l'equazione di regressione standardizzata:

y 0 \u003d  1 x 1 0 +  2 x 2 0 + ... +  m x m 0 + e,

dove y 0 e X 0 K valori standardizzati delle variabili si E X K :

S y e S sono le deviazioni standard delle variabili si E X K ,

bk (k=) -coefficienti dell'equazione di regressione (ma non i parametri dell'equazione di regressione, contrariamente alla notazione data in precedenza). I coefficienti β mostrano di quale parte della sua deviazione standard (S y) cambierà la variabile dipendente si se la variabile indipendente X K cambierà della sua deviazione standard (S). Le stime dei parametri dell'equazione di regressione in termini assoluti (b k) e i coefficienti β sono correlate dalla relazione:

I coefficienti  dell'equazione di regressione su una scala standardizzata creano un'idea reale dell'impatto delle variabili indipendenti sull'indicatore modellato. Se il valore del coefficiente β per qualsiasi variabile supera il valore del corrispondente coefficiente β per un'altra variabile, allora l'influenza della prima variabile sulla variazione dell'indicatore effettivo dovrebbe essere riconosciuta come più significativa. Va tenuto presente che l'equazione di regressione standardizzata, a causa della centratura delle variabili, non ha un termine libero per costruzione.

Per la regressione semplice, il coefficiente  coincide con il coefficiente di correlazione di coppia, il che rende possibile attribuire un significato semantico al coefficiente di correlazione di coppia.

Quando si analizza l'impatto degli indicatori inclusi nell'equazione di regressione sul tratto modellato, vengono utilizzati anche i coefficienti di elasticità insieme ai coefficienti . Ad esempio, l'indicatore di elasticità media è calcolato dalla formula

e mostra di quale percentuale la variabile dipendente cambierà in media se il valore medio della corrispondente variabile indipendente cambia dell'uno percento (ceteris paribus).

2.2.9. Variabili discrete nell'analisi di regressione

In genere, le variabili nei modelli di regressione hanno intervalli continui. Tuttavia, la teoria non impone alcuna restrizione sulla natura di tali variabili. Molto spesso è necessario tenere conto nell'analisi di regressione dell'influenza delle caratteristiche qualitative e della loro dipendenza da vari fattori. In questo caso, diventa necessario introdurre variabili discrete nel modello di regressione. Le variabili discrete possono essere indipendenti o dipendenti. Consideriamo questi casi separatamente. Consideriamo dapprima il caso di variabili indipendenti discrete.

Variabili fittizie nell'analisi di regressione

Per includere caratteristiche qualitative come variabili indipendenti nella regressione, devono essere digitalizzate. Un modo per digitalizzarli è usare variabili fittizie. Il nome non ha del tutto successo: non sono fittizi, è solo più conveniente per questi scopi utilizzare variabili che accettano solo due valori: zero o uno. Questo è ciò che chiamano fittizio. Di solito, una variabile qualitativa può assumere diversi livelli di valore. Ad esempio, genere: maschio, femmina; qualifica - alta, media, bassa; stagionalità - I, II, III e IV trimestre, ecc. Esiste una regola secondo la quale, per digitalizzare tali variabili, è necessario inserire il numero di variabili fittizie, una in meno rispetto al numero di livelli dell'indicatore modellato . Ciò è necessario affinché tali variabili non siano linearmente dipendenti.

Nei nostri esempi, il genere è una variabile, pari a 1 per i maschi e 0 per le femmine. La qualificazione ha tre livelli, quindi sono necessarie due variabili fittizie: ad esempio, z 1 = 1 per il livello alto, 0 per gli altri; z 2 = 1 per il livello medio, 0 per gli altri. È impossibile introdurre una terza variabile simile, perché in questo caso risulterebbe linearmente dipendente (z 1 + z 2 + z 3 \u003d 1), il determinante della matrice (X T X) andrebbe a zero e troverebbe la matrice inversa (X T X) -1 non sarebbe riuscita. Come sapete, le stime dei parametri dell'equazione di regressione sono determinate dal rapporto: T X) -1 X T Y).

I coefficienti per le variabili fittizie mostrano come il valore della variabile dipendente differisce al livello analizzato rispetto al livello mancante. Ad esempio, se il livello salariale è stato modellato in base a diverse caratteristiche e livello di abilità, il coefficiente in z 1 mostrerebbe quanto lo stipendio di specialisti con un alto livello di qualifica differisce dallo stipendio di uno specialista con un basso livello di qualifica , a parità di altre condizioni, e il coefficiente in z 2 - un significato simile per specialisti con un livello medio di qualifica. Nel caso della stagionalità, dovrebbero essere introdotte tre variabili fittizie (se si considerano i dati trimestrali) e i relativi coefficienti mostrerebbero quanto il valore della variabile dipendente differisce per il trimestre corrispondente dal livello della variabile dipendente per il quarto che non è stato inserito quando sono stati digitalizzati.

Vengono inoltre introdotte variabili fittizie per modellare i cambiamenti strutturali nella dinamica degli indicatori studiati nell'analisi delle serie storiche.

Esempio 4 Equazione di regressione standardizzata e variabili fittizie

Si consideri un esempio di utilizzo di coefficienti standardizzati e variabili fittizie sull'esempio di un'analisi del mercato dei bilocali basata sull'equazione di regressione multipla con il seguente insieme di variabili:

PREZZO - prezzo;

TOTSP - area totale;

LIVSP - zona giorno;

KITSP - zona cucina;

DIST - distanza dal centro città;

WALK - pari a 1 se la stazione della metropolitana è raggiungibile a piedi e pari a 0 se è necessario utilizzare i mezzi pubblici;

MATTONE - pari a 1 se la casa è in muratura e pari a 0 se è a pannelli;

PIANO - pari a 1 se l'appartamento non è al primo o all'ultimo piano e pari a 0 altrimenti;

TEL - pari a 1 se l'appartamento è dotato di telefono e pari a 1 in caso contrario;

BAL è uguale a 1 se c'è un balcone e uguale a 0 se non c'è balcone.

I calcoli sono stati eseguiti utilizzando il software STATISTICA (Figura 2.23). La presenza dei coefficienti  consente di ordinare le variabili in base al grado della loro influenza sulla variabile dipendente. Analizziamo brevemente i risultati del calcolo.

Sulla base delle statistiche di Fisher, concludiamo che l'equazione di regressione è significativa (p-level< 0,05). Обработана информация о 6 286 квартирах (n–m–1 = 6 276, а m = 9). Все коэффициенты уравнения регрессии (кроме при переменной BAL) значимы (р-величины для них < 0,05), а наличие или отсутствие балкона в этом случае существенно не сказывается на цене квартиры.

Figura 2.24 – Report sul mercato degli appartamenti basato su STATISTICA PPP

Il coefficiente di determinazione multipla è del 52%, pertanto le variabili incluse nella regressione determinano la variazione del prezzo del 52% e il restante 48% della variazione del prezzo di un appartamento dipende da fattori non contabilizzati. Compreso da fluttuazioni di prezzo casuali.

Ciascuno dei coefficienti della variabile mostra quanto cambierà il prezzo di un appartamento (ceteris paribus) se questa variabile cambia di uno. Quindi, ad esempio, quando si modifica l'area totale di 1 mq. m, il prezzo di un appartamento in media cambierà di 0,791 USD e quando l'appartamento si trova a 1 km dal centro della città, il prezzo di un appartamento diminuirà in media di 0,596 USD. ecc. Le variabili fittizie (le ultime 5) mostrano quanto cambierà in media il prezzo di un appartamento se ci si sposta da un livello all'altro di questa variabile. Quindi, ad esempio, se la casa è in mattoni, l'appartamento al suo interno costa in media 3.104 USD. e. più costoso dello stesso in una casa a pannelli e la presenza di un telefono in un appartamento ne aumenta il prezzo in media di 1.493 USD. e., ecc.

Sulla base dei coefficienti , si possono trarre le seguenti conclusioni. Il più grande coefficiente , pari a 0,514, è il coefficiente per la variabile "area totale", quindi, prima di tutto, il prezzo di un appartamento si forma sotto l'influenza della sua area totale. Il fattore successivo in termini di grado di influenza sulla variazione del prezzo di un appartamento è la distanza dal centro città, quindi il materiale con cui è costruita la casa, quindi l'area della cucina, ecc. .

Pagina 1


I coefficienti di regressione standardizzati mostrano di quanti sigma il risultato cambierà in media se il corrispondente fattore x cambia di un sigma, mentre il livello medio degli altri fattori rimane invariato. Poiché tutte le variabili sono impostate come centrate e normalizzate, i coefficienti standardizzati di reness D sono confrontabili tra loro. Confrontandoli tra loro, puoi classificare i fattori in base alla forza del loro impatto sul risultato. Questo è il vantaggio principale dei coefficienti di ricorso standardizzati, a differenza dei coefficienti di ricorso puro, che sono incomparabili tra loro.

La coerenza della correlazione parziale e dei coefficienti di regressione standardizzati si vede più chiaramente da un confronto delle loro formule in un'analisi a due fattori.

La coerenza della correlazione parziale e dei coefficienti di regressione standardizzati si vede più chiaramente da un confronto delle loro formule in un'analisi a due vie.

Per determinare i valori delle stime a dei coefficienti di regressione standardizzati a (i seguenti metodi per risolvere un sistema di equazioni normali sono più spesso usati: il metodo dei determinanti, il metodo della radice quadrata e il metodo della matrice. Recentemente, il metodo della matrice ha stato ampiamente utilizzato per risolvere problemi di analisi di regressione.Qui consideriamo la soluzione di un sistema di equazioni normali con il metodo delle determinanti.

In altre parole, nell'analisi a due fattori, i coefficienti di correlazione parziale sono coefficienti di regressione standardizzati moltiplicati per la radice quadrata del rapporto tra le quote di varianze residue del fattore fisso rispetto al fattore e al risultato.

Esiste un'altra possibilità di valutare il ruolo delle caratteristiche di raggruppamento, il loro significato per la classificazione: sulla base di coefficienti di regressione standardizzati o coefficienti di determinazione separati (vedi Cap.

Come si può vedere dalla Tav. 18, i componenti della composizione studiata sono stati distribuiti in base al valore assoluto dei coefficienti di regressione (b5) con il loro errore quadrato (sbz) di fila dal monossido di carbonio e dagli acidi organici alle aldeidi e ai vapori d'olio. Nel calcolare i coefficienti di regressione standardizzati (p), si è scoperto che, tenendo conto dell'intervallo di fluttuazioni delle concentrazioni, i chetoni e il monossido di carbonio vengono in primo piano nella formazione della tossicità della miscela nel suo insieme, mentre gli acidi organici rimangono al terzo posto.

I coefficienti di regressione condizionatamente puri bf sono Numeri Nominati espressi in diverse unità di misura e quindi non confrontabili tra loro. Per convertirli in indicatori relativi confrontabili, viene applicata la stessa trasformazione utilizzata per ottenere il coefficiente di correlazione di coppia. Il valore risultante è chiamato coefficiente di regressione standardizzato o coefficiente -.

Coefficienti di regressione condizionatamente pura A; sono numeri denominati, espressi in diverse unità di misura, e quindi non confrontabili tra loro. Per convertirli in indicatori relativi confrontabili, viene applicata la stessa trasformazione utilizzata per ottenere il coefficiente di correlazione di coppia. Il valore risultante è chiamato coefficiente di regressione standardizzato o coefficiente -.

Nel processo di sviluppo degli standard per l'organico, vengono raccolti i dati iniziali sull'organico del personale dirigente e i valori dei fattori per le imprese di base selezionate. Successivamente, i fattori significativi vengono selezionati per ciascuna funzione in base all'analisi di correlazione, in base al valore dei coefficienti di correlazione. Vengono selezionati i fattori con il valore più alto del coefficiente di correlazione della coppia con la funzione e il coefficiente di regressione standardizzato.

I risultati dei suddetti calcoli consentono di disporre in ordine decrescente i coefficienti di regressione corrispondenti alla miscela in studio, e quindi di quantificarne il grado di pericolosità. Tuttavia, il coefficiente di regressione così ottenuto non tiene conto dell'intervallo di possibili fluttuazioni di ciascun componente della miscela. Di conseguenza, i prodotti di degradazione con coefficienti di regressione elevati, ma fluttuanti in un intervallo ristretto di concentrazioni, possono avere un effetto minore sull'effetto tossico totale rispetto agli ingredienti con b relativamente piccolo, il cui contenuto nella miscela varia in un intervallo più ampio. Pertanto, sembra opportuno eseguire un'operazione aggiuntiva: il calcolo dei cosiddetti coefficienti di regressione standardizzati p (J.

Pagine:      1

Esercizio.

  1. Per un determinato set di dati, crea un modello di regressione multipla lineare. Valutare l'accuratezza e l'adeguatezza dell'equazione di regressione costruita.
  2. Fornire un'interpretazione economica dei parametri del modello.
  3. Calcola i coefficienti del modello standardizzato e scrivi l'equazione di regressione in forma standardizzata. È vero che il prezzo di un bene ha un'influenza maggiore sul volume dell'offerta di un bene rispetto ai salari dei dipendenti?
  4. Per il modello risultante (in forma naturale), verificare l'omoschedasticità dei residui applicando il test di Goldfeld-Quandt.
  5. Controllare il modello risultante per l'autocorrelazione residua utilizzando il test di Durbin-Watson.
  6. Verificare se l'ipotesi sull'omogeneità dei dati originali è adeguata nel senso della regressione. È possibile combinare due campioni (per le prime 8 e le restanti 8 osservazioni) in uno e considerare un unico modello di regressione Y su X ?

1. Stima dell'equazione di regressione. Definiamo il vettore delle stime dei coefficienti di regressione utilizzando il servizio Multiple Regression Equation. Secondo il metodo dei minimi quadrati, il vettore S si ottiene dall'espressione: s = (X T X) -1 X T Y
Matrice X

1 182.94 1018
1 193.45 920
1 160.09 686
1 157.99 405
1 123.83 683
1 152.02 530
1 130.53 525
1 137.38 418
1 137.58 425
1 118.78 161
1 142.9 242
1 99.49 226
1 116.17 162
1 185.66 70

Matrice Y
4.07
4
2.98
2.2
2.83
3
2.35
2.04
1.97
1.02
1.44
1.22
1.11
0.82

Matrice XT
1 1 1 1 1 1 1 1 1 1 1 1 1 1
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

Moltiplicare matrici, (X T X)
2.25 -0.0161 0.00037
-0.0161 0.000132 -7.0E-6
0.00037 -7.0E-61.0E-6

Il vettore delle stime dei coefficienti di regressione è uguale a

Y(X) =
2,25 -0,0161 0,00037
-0,0161 0,000132 -7.0E-6
0,00037 -7.0E-61.0E-6
*
31,05
4737,044
18230,79
=
0,18
0,00297
0,00347

Equazione di regressione (valutazione dell'equazione di regressione)
Y = 0,18 + 0,00297X 1 + 0,00347X 2

2. Matrice di coefficienti di correlazione accoppiati R. Il numero di osservazioni n = 14. Il numero di variabili indipendenti nel modello è 2 e il numero di regressori, tenendo conto del vettore unitario, è uguale al numero di coefficienti sconosciuti. Tenendo conto del segno Y, la dimensione della matrice diventa uguale a 4. La matrice delle variabili indipendenti X ha la dimensione (14 x 4).
Matrice composta da Y e X

1 4.07 182.94 1018
1 4 193.45 920
1 2.98 160.09 686
1 2.2 157.99 405
1 2.83 123.83 683
1 3 152.02 530
1 2.35 130.53 525
1 2.04 137.38 418
1 1.97 137.58 425
1 1.02 118.78 161
1 1.44 142.9 242
1 1.22 99.49 226
1 1.11 116.17 162
1 0.82 185.66 70

La matrice trasposta.

1 1 1 1 1 1 1 1 1 1 1 1 1 1
4.07 4 2.98 2.2 2.83 3 2.35 2.04 1.97 1.02 1.44 1.22 1.11 0.82
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

Matrice AT A.

14 31.05 2038.81 6471
31.05 83.37 4737.04 18230.79
2038.81 4737.04 307155.61 995591.55
6471 18230.79 995591.55 4062413

La matrice risultante ha la seguente corrispondenza:

∑n∑y∑x1∑x2
∑y∑y2∑x1y∑x2y
∑x1∑yx 1∑x 1 2∑x2x1
∑x2∑yx2∑x1x2∑x 2 2

Troviamo i coefficienti di correlazione accoppiati.
Funzioni x e y∑(x io ) ∑(y io ) ∑(x io y io)
Per y e x 1 2038.81 145.629 31.05 2.218 4737.044 338.36
Per y e x 2 6471 462.214 31.05 2.218 18230.79 1302.199
Per x 1 e x 2 6471 462.214 2038.81 145.629 995591.55 71113.682
Funzioni x e y
Per y e x 1 731.797 1.036 27.052 1.018
Per y e x 2 76530.311 1.036 276.641 1.018
Per x 1 e x 2 76530.311 731.797 276.641 27.052

Matrice dei coefficienti di correlazione accoppiati R:
- six 1x2
si 1 0.558 0.984
x 1 0.558 1 0.508
x2 0.984 0.508 1

Per selezionare i fattori più significativi x i, vengono prese in considerazione le seguenti condizioni:
- il rapporto tra la caratteristica effettiva e il fattore dovrebbe essere superiore al rapporto interfattore;
- il rapporto tra i fattori non deve essere superiore a 0,7. Se la matrice ha un coefficiente di correlazione interfattoriale r xjxi > 0.7, allora c'è multicollinearità in questo modello di regressione multipla.;
- con un'elevata relazione interfattoriale di un tratto, vengono selezionati fattori con un coefficiente di correlazione inferiore tra loro.
Nel nostro caso, tutti i coefficienti di correlazione di coppia |r| Modello di regressione su scala standard Il modello di regressione su scala standard presuppone che tutti i valori delle caratteristiche studiate siano convertiti in standard (valori standardizzati) utilizzando le formule:

dove x ji è il valore della variabile x ji nell'i-esima osservazione.

Pertanto, l'origine di ciascuna variabile standardizzata viene combinata con il suo valore medio e la sua deviazione standard viene presa come unità di variazione S.
Se la relazione tra le variabili su una scala naturale è lineare, la modifica dell'origine e dell'unità di misura non violerà questa proprietà, in modo che le variabili standardizzate saranno correlate da una relazione lineare:
t y = ∑β j t xj
Per stimare i coefficienti β, utilizziamo il metodo dei minimi quadrati. In questo caso, il sistema di equazioni normali avrà la forma:
r x1y =β 1 +r x1x2 β 2 + ... + r x1xm β m
r x2y =r x2x1 β 1 + β 2 + ... + r x2xm β m
...
r xmy =r xmx1 β 1 + r xmx2 β 2 + ... + β m
Per i nostri dati (prendiamo dalla matrice dei coefficienti di correlazione accoppiati):
0,558 = β 1 + 0,508 β 2
0,984 = 0,508β 1 + β 2
Questo sistema di equazioni lineari è risolto con il metodo di Gauss: β 1 = 0,0789; β2 = 0,944;
La forma standardizzata dell'equazione di regressione è:
y 0 = 0,0789x1 + 0,944x2
I coefficienti β trovati da questo sistema consentono di determinare i valori dei coefficienti nella regressione su scala naturale utilizzando le formule:

Coefficienti di regressione parziale standardizzati. Coefficienti di regressione parziale standardizzati - I coefficienti β (β j) mostrano di quale parte della sua deviazione standard S (y) cambierà il risultato del segno si con una variazione del fattore corrispondente x j del valore della sua deviazione standard (S xj) con la stessa influenza di altri fattori (inclusi nell'equazione).
Dal massimo β j, si può giudicare quale fattore ha la maggiore influenza sul risultato Y.
In base ai coefficienti di elasticità e ai coefficienti β, si possono trarre conclusioni opposte. Le ragioni di ciò sono: a) la variazione di un fattore è molto ampia; b) influenza multidirezionale dei fattori sul risultato.
Il coefficiente β j può anche essere interpretato come un indicatore di influenza diretta (immediata). J-esimo fattore (x j) sul risultato (y). In regressione multipla J L'esimo fattore ha un'influenza non solo diretta, ma anche indiretta (indiretta) sul risultato (ovvero influenza attraverso altri fattori del modello).
L'influenza indiretta è misurata dal valore: ∑β i r xj,xi , dove m è il numero di fattori nel modello. Impatto totale j-esimo fattore sul risultato pari alla somma delle influenze dirette e indirette misura il coefficiente di correlazione di coppia lineare di questo fattore e il risultato - r xj,y .
Quindi, per il nostro esempio, l'influenza diretta del fattore x 1 sul risultato Y nell'equazione di regressione è misurata da β j ed è 0,0789; l'influenza indiretta (indiretta) di questo fattore sul risultato è definita come:
rx1x2β2 = 0,508 * 0,944 = 0,4796

In econometria, viene spesso utilizzato un approccio diverso per determinare i parametri della regressione multipla (2.13) con il coefficiente escluso:

Dividi entrambi i lati dell'equazione per la deviazione standard della variabile spiegata S Y e rappresentarlo nella forma:

Dividi e moltiplica ciascun termine per la deviazione standard della variabile fattoriale corrispondente per ottenere le variabili standardizzate (centrate e normalizzate):

dove le nuove variabili sono denotate come

.

Tutte le variabili standardizzate hanno una media di zero e la stessa varianza di uno.

L'equazione di regressione in forma standardizzata è:

Dove
- coefficienti di regressione standardizzati.

Coefficienti di regressione standardizzati diversi dai coefficienti la forma abituale, naturale, in quanto il loro valore non dipende dalla scala di misurazione delle variabili spiegate ed esplicative del modello. Inoltre, esiste una semplice relazione tra loro:

, (3.2)

che fornisce un altro modo per calcolare i coefficienti da valori noti , che è più conveniente nel caso, ad esempio, di un modello di regressione a due fattori.

5.2. Sistema normale di equazioni ai minimi quadrati standardizzato

variabili

Si scopre che per calcolare i coefficienti della regressione standardizzata, è sufficiente conoscere i coefficienti a coppie della correlazione lineare. Per mostrare come si fa, escludiamo l'incognita dal normale sistema di equazioni dei minimi quadrati utilizzando la prima equazione. Moltiplicando la prima equazione per (
) e sommandolo termine per termine con la seconda equazione, otteniamo:

Sostituzione delle espressioni tra parentesi con la notazione di varianza e covarianza

Riscriviamo la seconda equazione in una forma conveniente per un'ulteriore semplificazione:

Dividi entrambi i lati di questa equazione per la deviazione standard delle variabili S Y E ` S X 1 , e ogni termine viene diviso e moltiplicato per la deviazione standard della variabile corrispondente al numero del termine:

Presentazione delle caratteristiche di una relazione statistica lineare:

e coefficienti di regressione standardizzati

,

noi abbiamo:

Dopo trasformazioni simili di tutte le altre equazioni, il sistema normale di equazioni LSM lineari (2.12) assume la seguente forma più semplice:

(3.3)

5.3. Opzioni di regressione standardizzate

I coefficienti di regressione standardizzati nel caso particolare di un modello con due fattori sono determinati dal seguente sistema di equazioni:

(3.4)

Risolvendo questo sistema di equazioni troviamo:

, (3.5)

. (3.6)

Sostituendo i valori trovati dei coefficienti di correlazione delle coppie nelle equazioni (3.4) e (3.5), otteniamo E . Quindi, utilizzando le formule (3.2), è facile calcolare le stime per i coefficienti E , quindi, se necessario, calcolare la stima secondo la formula

6. Possibilità di analisi economica basata su un modello multifattoriale

6.1. Coefficienti di regressione standardizzati

I coefficienti di regressione standardizzati mostrano quante deviazioni standard cambiamento sulla media della variabile spiegata Y se la corrispondente variabile esplicativa X io cambierà in base all'importo
una delle sue deviazioni standard mantenendo gli stessi valori del livello medio di tutti gli altri fattori.

A causa del fatto che nella regressione standardizzata tutte le variabili sono fornite come variabili casuali centrate e normalizzate, i coefficienti paragonabili tra loro. Confrontandoli tra loro, puoi classificare i fattori corrispondenti X io dalla forza dell'impatto sulla variabile che viene spiegata Y. Questo è il vantaggio principale dei coefficienti di regressione standardizzati dai coefficienti regressioni in forma naturale, che sono incomparabili tra loro.

Questa caratteristica dei coefficienti di regressione standardizzati consente di utilizzare quando si escludono i fattori meno significativi X io con valori prossimi allo zero delle loro stime campionarie . La decisione di escluderli dall'equazione del modello di regressione lineare viene presa dopo aver verificato le ipotesi statistiche sull'uguaglianza del suo valore medio a zero.

Il coefficiente beta pari a 0,074 (tabella 3.2.1) mostra che se i salari reali cambiano del valore della loro deviazione standard (σx1), allora il tasso di crescita naturale della popolazione cambierà in media di 0,074 σy. Il coefficiente beta pari a 0,02 mostra che se il tasso di matrimonio totale cambia del valore della sua deviazione standard (di σx2), allora il tasso di crescita naturale della popolazione cambierà in media di 0,02 σy. Allo stesso modo, una variazione del numero di reati per 1000 persone del valore della sua deviazione standard (di σх3) comporterà una variazione della caratteristica effettiva di una media di 0,366 σy, e una variazione dell'ingresso di metri quadrati di abitazioni locali per persona all'anno in base al valore della sua deviazione standard (di σх4) porta a un cambiamento nella caratteristica effettiva di una media di 1,32σу.

Il coefficiente di elasticità mostra di quante percentuali y cambia in media con una variazione del fattore di segno dell'1%. Dall'analisi della serie di dinamiche, è noto che il valore dell'1% dell'aumento dell'indicatore effettivo è negativo, poiché in tutte le unità della popolazione c'è un calo naturale della popolazione. Pertanto, l'aumento significa in realtà una diminuzione della perdita. Pertanto, i coefficienti di elasticità negativi in ​​\u200b\u200bquesto caso riflettono il fatto che con un aumento dell'1% di ciascuna delle caratteristiche del fattore, il coefficiente di attrito naturale diminuirà del corrispondente numero percentuale. Con un aumento del salario reale dell'1%, il tasso di abbandono diminuirà dello 0,219%, con un aumento del tasso di matrimonio totale dell'1%, diminuirà dello 0,156%. Un aumento del numero di reati per 1.000 persone dell'1% è caratterizzato da una riduzione del declino naturale della popolazione di 0,564. Naturalmente, questo non significa che aumentando la criminalità sia possibile migliorare la situazione demografica. I risultati ottenuti indicano che più persone vengono salvate ogni 1000 della popolazione, corrispondentemente più reati ricadono su questo migliaio. Incremento ingresso mq. alloggio per persona all'anno dell'1% porta a una riduzione della perdita naturale dello 0,482%

L'analisi dei coefficienti di elasticità e dei coefficienti beta mostra che il fattore di messa in servizio dei metri quadrati di abitazioni pro capite ha la maggiore influenza sul coefficiente di crescita naturale della popolazione, in quanto corrisponde al valore più alto del coefficiente beta (1,32). Tuttavia, ciò non significa che le maggiori opportunità per modificare il coefficiente di crescita naturale della popolazione siano associate a un cambiamento in questo dei fattori considerati. Il risultato ottenuto riflette il fatto che la domanda nel mercato immobiliare corrisponde all'offerta, cioè maggiore è l'aumento naturale della popolazione, maggiore è il bisogno di questa popolazione di alloggi e più si costruisce.

Il secondo beta più grande (0,366) corrisponde al numero di reati per 1000 persone. Naturalmente, questo non significa che aumentando la criminalità sia possibile migliorare la situazione demografica. I risultati ottenuti indicano che più persone vengono salvate ogni 1000 della popolazione, corrispondentemente più reati ricadono su questo migliaio.

La più grande delle restanti caratteristiche, il coefficiente beta (0,074), corrisponde all'indicatore del salario reale. Le maggiori opportunità per modificare il coefficiente di crescita naturale della popolazione sono associate a un cambiamento in questo dei fattori considerati. L'indicatore del tasso di matrimonio generale è inferiore a questo riguardo ai salari reali a causa del fatto che il declino naturale della popolazione in Russia è dovuto principalmente all'elevata mortalità, il cui tasso di crescita può essere ridotto dal sostegno materiale piuttosto che da un aumento dei fatti del matrimonio.

3.3 Raggruppamento combinato di oblast per salari reali e tasso di matrimonio totale

Un raggruppamento combinato o multidimensionale è un raggruppamento basato su due o più caratteristiche. Il valore di questo raggruppamento sta nel fatto che mostra non solo l'influenza di ciascuno dei fattori sul risultato, ma anche l'influenza della loro combinazione.

Determiniamo l'effetto dei salari reali e del tasso di matrimonio totale sul tasso di natalità per 1.000 persone.

Individuiamo gruppi tipici in base alle caratteristiche delineate. Per fare ciò, costruiremo e analizzeremo una serie classificata e un intervallo su base fattoriale (valore del salario), determineremo il numero di gruppi e la dimensione dell'intervallo; poi, all'interno di ogni gruppo, costruiremo una serie classificata e intervallata secondo il secondo segno (tasso di matrimonio) e fisseremo anche il numero di gruppi e l'intervallo. La procedura per eseguire questo lavoro è presentata nel Capitolo 2, quindi, omettendo i calcoli, presentiamo i risultati. Per il valore dei salari reali si distinguono 3 gruppi tipici, per il tasso di matrimonio totale - 2 gruppi.

Realizzeremo un layout di una tabella di combinazione, in cui forniremo la divisione della popolazione in gruppi e sottogruppi, nonché colonne per la registrazione del numero di regioni e del tasso di natalità per 1000 persone della popolazione. Per i gruppi e sottogruppi selezionati, calcoliamo i tassi di natalità (Tabella 3.3.1)

Tabella 3.3.1

L'influenza dei salari reali e del tasso di matrimonio totale sul tasso di natalità.

Analizziamo i dati ottenuti sulla dipendenza del tasso di natalità dai salari reali e dal tasso di matrimonio. Poiché si sta studiando un segno: il tasso di natalità, scriveremo i dati su di esso in una tabella di combinazioni di scacchi della seguente forma (Tabella 3.3.2)

Il raggruppamento combinato consente di valutare separatamente il grado di influenza sul tasso di natalità di ciascun fattore e la loro interazione.

Tabella 3.3.2

Dipendenza del tasso di natalità dal salario reale e dal tasso di matrimonio

Studiamo prima l'effetto sul tasso di natalità del valore dei salari reali con un valore fisso di un'altra caratteristica di raggruppamento: il tasso di matrimonio. Quindi, con un tasso di nuzialità da 13,2 a 25,625, la natalità media cresce all'aumentare dei salari da 9,04 nel 1° gruppo a 9,16 nel 2° gruppo e 9,56 nel 3° gruppo; l'aumento del tasso di natalità dai salari nel 3° gruppo rispetto al 1° è: 9,56-9,04 = 0,52 persone per 1000 abitanti. Con un tasso di matrimonio di 25,625-38,05, l'aumento dalla stessa quantità di salari è: 10,27-9,49 = 0,78 persone per 1000 abitanti. L'aumento dall'interazione dei fattori è: 0,78-0,52=0,26 persone per 1000 abitanti. Ne consegue una conclusione del tutto naturale: un aumento del benessere motiva, o meglio consente, con fiducia nel futuro, di realizzare il desiderio di una persona di sposarsi e creare una famiglia con figli. Questo mostra l'interazione dei fattori.

Allo stesso modo, stimiamo l'impatto sul tasso di natalità del tasso di matrimonio a un livello salariale fisso. Per fare ciò, confrontiamo il tasso di natalità per i gruppi "a" e "b" all'interno di ciascun gruppo in termini di salari reali. L'aumento del tasso di natalità con un aumento del tasso di matrimonio a 25.625-38.05 per 1000 abitanti rispetto al gruppo "a" è: nel 1 ° gruppo con uno stipendio di 5707,9 - 6808,7 rubli. al mese - 9,49-9,04 = 0,45 persone per 1000 abitanti, nel 2° gruppo - 10,01-9,16 = 0,85 persone per 1000 abitanti e nel 3° gruppo - 10,27- 9,56=0,71 persone per 1000 abitanti. Come puoi vedere, la decisione di avere un figlio dipende dallo stato civile, ad es. c'è un'interazione di fattori, che dà un aumento di 0,26 persone per 1000 abitanti.

Con un aumento congiunto di entrambi i fattori, il tasso di natalità aumenta da 9,04 nel sottogruppo 1 "a" a 10,27 persone per 1000 abitanti nel sottogruppo 3 "b".

I rappresentanti della Commissione economica per l'Europa delle Nazioni Unite hanno recentemente annunciato che l'età del primo matrimonio nei paesi europei è aumentata di cinque anni. Ragazzi e ragazze preferiscono sposarsi e sposarsi dopo i 30 anni. I russi non osano sposarsi prima dei 24-26 anni. Comune anche all'Europa e alla Russia è diventata una tendenza verso una riduzione del numero di unioni matrimoniali. I giovani preferiscono sempre più la carriera e la libertà personale. Gli esperti domestici vedono questi processi come segni di una profonda crisi nella famiglia tradizionale. Secondo loro, sta letteralmente vivendo i suoi ultimi giorni. I sociologi sostengono che la vita privata stia attraversando un periodo di ristrutturazione. La famiglia nel senso comune del termine, che vive secondo lo schema "mamma-papà-figli", sta gradualmente diventando un ricordo del passato. Nella vita privata, i russi stanno sperimentando sempre più, inventando sempre più nuove forme di famiglia che soddisfino le esigenze dei tempi. "Ora una persona cambia lavoro, professione, interessi e luoghi di residenza più spesso", ha detto a Novye Izvestia Anatoly Vishnevsky, direttore del Centro per la demografia umana e l'ecologia, "cambia spesso anche coniuge, cosa considerata inaccettabile 20 anni fa .”

I sociologi notano che uno dei motivi della crescita dei divorzi in Russia è il basso tenore di vita della popolazione. "Secondo le statistiche, ci sono circa il 10-15% in più di divorzi in Russia che in Europa", ha detto a NI Gontmakher (direttore scientifico del Centro per la ricerca e l'innovazione sociale). - Ma i motivi del divorzio sono diversi per noi e per loro. La nostra superiorità è dettata principalmente dal fatto che i problemi economici influiscono sempre più sulla vita dei russi. I coniugi litigano più spesso se hanno condizioni di vita anguste. I giovani non sempre riescono a vivere in modo indipendente. Inoltre, nelle regioni, molti uomini bevono, non lavorano e non possono provvedere alla propria famiglia. Questo porta anche al divorzio.

Conclusione

In questo lavoro viene svolta un'analisi statistica ed economica dell'impatto del tenore di vita della popolazione sui processi di accrescimento naturale.

L'analisi delle serie storiche ha mostrato che negli ultimi 10 anni c'è stato un aumento dei salari reali e del minimo di sussistenza. In generale, in questi 10 anni, il segno effettivo - il coefficiente di incremento naturale - è stazionario. La stabilità dei processi di cambiamento emergenti nelle caratteristiche selezionate è tale che la previsione è possibile solo per il valore dei salari reali e del tasso di mortalità. Secondo la tendenza parabolica costruita entro il 2010, il valore previsto del salario reale medio sarà di 17473,5 rubli e il tasso di mortalità scenderà a 12,75 persone per 1000.

Il raggruppamento analitico ha evidenziato una relazione diretta tra gli indicatori: con la crescita dei salari, migliorano gli indicatori di incremento naturale.

Tuttavia, una famiglia di due lavoratori con un salario medio può fornire un livello minimo di consumo per 2 figli nel gruppo tipico più basso, 3 figli nel gruppo tipico medio e più alto. Considerando che due figli "sostituiscono" in futuro la vita dei genitori, un leggero aumento della popolazione è possibile solo nei gruppi tipici medi e alti, e quindi solo a condizione di un basso tasso di mortalità rispetto al tasso di natalità. Il potenziale di fertilità, che è sostenuto dai salari in Russia, è basso per migliorare la situazione demografica nel paese. Questo rivela solo la necessità dell'introduzione di un progetto nazionale demografico in Russia. Un aumento dei salari ha un effetto più favorevole sul tasso di mortalità che sul tasso di natalità.

La costruzione di un modello di correlazione-regressione ha rivelato che l'influenza simultanea dei segni dei fattori (salari, tassi di matrimonio, tassi di criminalità e commissione di alloggi) sul produttivo (aumento naturale) si osserva con una forza media di connessione. La variazione del coefficiente di crescita naturale della popolazione del 44,9% è caratterizzata dall'influenza di fattori selezionati e del 55,1% da altre cause non contabilizzate e casuali. Le maggiori opportunità per modificare il coefficiente di crescita naturale della popolazione sono associate a un cambiamento nel valore dei salari reali.

Il raggruppamento combinato ha confermato che un aumento della ricchezza motiva, o meglio consente, con fiducia nel futuro, di realizzare il desiderio di una persona di sposarsi e creare una famiglia con figli.

E infine, è necessario valutare l'efficacia della risoluzione del problema della demografia nel nostro Paese. In generale, è stato dimostrato l'impatto positivo ed efficace degli incentivi materiali sul processo di movimento naturale della popolazione. Un'altra cosa è che esiste un complesso di problemi socio-psicologici (alcolismo, violenza, suicidio), che stanno inesorabilmente riducendo le dimensioni della nostra popolazione. La loro ragione principale è l'atteggiamento di una persona verso se stessa e gli altri. Ma questi problemi non possono essere risolti solo dallo Stato, la società civile dovrebbe venire in proprio aiuto nel problema dell'estinzione, formando valori morali incentrati sulla creazione di una famiglia prospera.

E lo Stato può e deve fare di tutto per elevare il livello e la qualità della vita nel Paese. Non si può dire che il nostro Stato trascuri questi doveri. Fa del suo meglio per trovare e provare varie vie d'uscita dalla crisi demografica.

Elenco della letteratura usata

1) Borisov E.F. Teoria economica: libro di testo - 2a ed., Rivisto. e aggiuntivi - M.: TK Velby, casa editrice Prospekt, 2005. - 544 p.

2) Belousova S. analisi del livello di povertà.// Economist.-2006, n. 10.-p.67

3) Davydova L. A. Teoria della statistica. Esercitazione. Mosca. Viale. 2005. 155 pagine;

4) Demografia: libro di testo / Sotto il generale. ed. SUL. Volgin. M.: Casa editrice dei RAGS, 2003 - 384 p.

5) Efimova E. P. Statistiche sociali. Mosca. Finanza e statistica. 2003. 559 pagine;

6) Efimova E.P., Ryabtsev V.M. Teoria generale della statistica. Edizione didattica. Mosca. Finanza e statistica. 1991. 304 pagine;

7) Zinchenko A.P. Workshop sulla teoria generale della statistica e della statistica agraria. Mosca. Finanza e statistica. 1988. 328 pagine;

8) Kadomtseva S. Politica sociale e popolazione.// Economist.-2006, n. 7.-p.49

9) Kozyrev V.M. Fondamenti di economia moderna: libro di testo. -2a ed., rivista. e aggiuntivi –M.: Finanza e statistica, 2001.-432p.

10) Konygina N. Brintseva G. Il demografo Anatoly Vishnevsky su ciò che fa scegliere un russo tra bambini e comodità. 7

11) Nazarova N.G. Corso di statistica sociale. Mosca. Finstatinform. 2000. 770 pagine;

13) Fondamenti di demografia: libro di testo / N.V. Zvereva, I.N. Veselkova, V.V. Elizarov.-M.: Superiore. Shk., 2004.-374 p.: riprod.

14) Discorso del Presidente della Federazione Russa all'Assemblea Federale della Federazione Russa del 26 aprile 2007.

15) Raisberg B.A., Lozovsky L.Sh., Starodubtseva E.B. Dizionario economico moderno. –4a ed., rivista. e aggiuntivi -M.: INFRA-M, 2005.-480s.

16) Rudakova R.P., Bukin L.L., Gavrilov V.I. Laboratorio di statistica. - San Pietroburgo: Peter, 2007.-288p.

17) Sito web del Servizio federale di statistica www.gks.ru

18) Shaikin D.N. Valutazione prospettica della popolazione della Russia a medio termine.// Domande statistiche.-2007, n. 4 -p.47

PUNTEGGIO (CHIAVE PER CHIPS)

1 salario nominale mensile medio nel 2006 (in rubli)

2-indici dei prezzi al consumo per tutti i tipi di beni e servizi a pagamento nel 2006 in percentuale di dicembre dello scorso anno

3- salari reali mensili medi nel 2006 (in rubli)

4 - popolazione all'inizio del 2006

5 - popolazione alla fine del 2006

6 - popolazione media annua nel 2006

7 - il numero di nascite nel 2006, persone

8 - il numero di morti nel 2006, persone

9 - tasso di natalità nel 2006 per 1000 abitanti

10 - tasso di mortalità nel 2006 per 1000 abitanti

11 - coefficiente di incremento naturale nel 2006 per 1000 abitanti

12 - il valore del minimo di sussistenza per il 2006 (in rubli)

13 - il numero di crimini commessi per 1000 persone della popolazione

14 - messa in servizio di mq di alloggi per persona all'anno

15 - tasso di matrimonio totale per 1000 abitanti

Allegato 1

Tavolo

Salari reali, strofina.

Allegato 2

Minimo di sussistenza, strofinare.

Allegato 3

CATEGORIE

ARTICOLI POPOLARI

2023 "kingad.ru" - esame ecografico degli organi umani