Znajdź macierz odwrotną (X T X) -1

Równanie regresji wielokrotnej w postaci naturalnej i standaryzowanej. Standaryzowane współczynniki regresji

Współczynników równania regresji, podobnie jak wszelkich wskaźników bezwzględnych, nie można stosować w analizie porównawczej, jeśli jednostki miary odpowiednich zmiennych są różne. Na przykład, jeśli y – wydatki rodzinne na wyżywienie, X 1 – wielkość rodziny oraz X 2 jest całkowitym dochodem rodziny i definiujemy relację jak = + B 1 X 1 + B 2 X 2 i b 2 > b 1 , to nie oznacza to tego X 2 ma silniejszy wpływ na y , Jak X 1 , ponieważ B 2 to zmiana wydatków rodzinnych, gdy dochód zmienia się o 1 rubel, oraz B 1 – zmiana wydatków w przypadku zmiany liczebności rodziny o 1 osobę.

Porównywalność współczynników równania regresji osiąga się poprzez uwzględnienie standaryzowanego równania regresji:

y 0 =  1 x 1 0 +  2 x 2 0 + … +  m x m 0 + mi,

gdzie y 0 i X 0 k standaryzowane wartości zmiennych y I X k :

S y i S – odchylenia standardowe zmiennych y I X k ,

 k (k=) -współczynniki równania regresji (ale nie parametry równania regresji, w przeciwieństwie do poprzednich zapisów). Współczynniki  pokazują, o jaką część odchylenia standardowego (S y) zmieni się zmienna zależna y , jeśli zmienna niezależna X k zmieni się o wartość odchylenia standardowego (S). Oszacowania parametrów równania regresji w wartościach bezwzględnych (b k) i współczynnikach β powiązane są zależnością:

Współczynniki  równania regresji w skali standaryzowanej dają realistyczną reprezentację wpływu zmiennych niezależnych na modelowany wskaźnik. Jeżeli wartość współczynnika  dla którejkolwiek zmiennej przekracza wartość odpowiedniego współczynnika  dla innej zmiennej, to wpływ pierwszej zmiennej na zmianę wskaźnika efektywności należy uznać za bardziej znaczący. Należy mieć na uwadze, że standaryzowane równanie regresji ze względu na centrowanie zmiennych nie posiada w konstrukcji członu swobodnego.

W przypadku prostej regresji współczynnik  pokrywa się ze współczynnikiem korelacji par, co umożliwia nadanie współczynnikowi korelacji par znaczącego znaczenia.

Analizując wpływ wskaźników zawartych w równaniu regresji na modelowaną charakterystykę, obok współczynników , wykorzystuje się także współczynniki elastyczności. Na przykład średni wskaźnik elastyczności oblicza się ze wzoru

i pokazuje, o jaki procent średnio zmieni się zmienna zależna, jeśli średnia wartość odpowiedniej zmiennej niezależnej zmieni się o jeden procent (przy pozostałych czynnikach niezmienionych).

2.2.9. Zmienne dyskretne w analizie regresji

Zazwyczaj zmienne w modelach regresji mają ciągłe zakresy zmienności. Teoria ta nie nakłada jednak żadnych ograniczeń na charakter takich zmiennych. Dość często w analizie regresji zachodzi potrzeba uwzględnienia wpływu cech jakościowych i ich zależności od różnych czynników. W takim przypadku konieczne staje się wprowadzenie do modelu regresji zmiennych dyskretnych. Zmienne dyskretne mogą być niezależne lub zależne. Rozważmy te przypadki osobno. Rozważmy najpierw przypadek dyskretnych zmiennych niezależnych.

Zmienne fikcyjne w analizie regresji

Aby uwzględnić w regresji cechy jakościowe jako zmienne niezależne, należy je zdigitalizować. Jedną z metod ich ilościowego określenia jest użycie zmiennych fikcyjnych. Nazwa nie jest do końca trafna - nie są one fikcyjne, ale do tych celów wygodniej jest używać zmiennych, które przyjmują tylko dwie wartości - zero lub jeden. Dlatego nazwano je fikcyjnymi. Zazwyczaj zmienna jakościowa może przyjmować kilka poziomów wartości. Na przykład płeć – mężczyzna, kobieta; kwalifikacja – wysoka, średnia, niska; sezonowość - I, II, III, IV kwartał itp. Istnieje zasada, że ​​aby zdigitalizować takie zmienne, należy podać liczbę zmiennych fikcyjnych, o jeden mniejszą niż liczba poziomów modelowanego wskaźnika. Jest to konieczne, aby takie zmienne nie okazały się liniowo zależne.

W naszych przykładach: płeć to jedna zmienna, równa 1 dla mężczyzn i 0 dla kobiet. Kwalifikacja ma trzy poziomy, co oznacza, że ​​potrzebne są dwie zmienne fikcyjne: na przykład z 1 = 1 dla wysokiego poziomu, 0 dla pozostałych; z 2 = 1 dla poziomu średniego, 0 dla pozostałych. Trzeciej podobnej zmiennej nie można wprowadzić, bo w tym przypadku okazałyby się one liniowo zależne (z 1 + z 2 + z 3 = 1), wyznacznik macierzy (X T X) zwróciłby się do zera i nie byłoby możliwe jest znalezienie macierzy odwrotnej (X T X) -1 byłoby to możliwe. Jak wiadomo, oszacowania parametrów równania regresji wyznacza się z zależności: T X) -1 X T Y).

Współczynniki zmiennych fikcyjnych pokazują, jak bardzo różni się wartość zmiennej zależnej na analizowanym poziomie w porównaniu z poziomem brakującym. Przykładowo, gdyby modelować poziom wynagrodzenia w zależności od kilku cech i poziomu umiejętności, to współczynnik dla z 1 pokazałby, jak różni się wynagrodzenie specjalistów o wysokim poziomie kwalifikacji od wynagrodzenia specjalisty o niskim poziomie kwalifikacji, przy pozostałych czynnikach równych, a współczynnik dla z 2 – podobne znaczenie dla specjalistów o średnim poziomie kwalifikacji. W przypadku sezonowości należałoby wprowadzić trzy zmienne fikcyjne (jeśli uwzględnić dane kwartalne), a znajdujące się na nich współczynniki pokazywałyby, jak różni się wartość zmiennej zależnej dla odpowiedniego kwartału od poziomu zmiennej zależnej dla kwartału które nie zostały wprowadzone podczas ich digitalizacji.

Wprowadza się także zmienne fikcyjne w celu modelowania zmian strukturalnych w dynamice badanych wskaźników podczas analizy szeregów czasowych.

Przykład 4. Standaryzowane równanie regresji i zmienne fikcyjne

Rozważmy przykład wykorzystania standaryzowanych współczynników i zmiennych fikcyjnych na przykładzie analizy rynku mieszkań dwupokojowych w oparciu o równanie regresji wielokrotnej z następującym zestawem zmiennych:

CENA – cena;

TOTSP – powierzchnia całkowita;

LIVSP – przestrzeń życiowa;

KITSP – część kuchenna;

DIST – odległość do centrum miasta;

SPACER – równy 1, jeśli do stacji metra możesz dojść piechotą i równy 0, jeśli musisz skorzystać z komunikacji miejskiej;

CEGŁA – równa 1, jeśli dom jest murowany i równa 0, jeśli dom jest panelowy;

PIĘTRO – równa 1, jeśli mieszkanie nie znajduje się na pierwszym lub ostatnim piętrze i równa 0 w przeciwnym razie;

TEL – równa 1, jeśli w mieszkaniu znajduje się telefon i równa 1, jeśli w mieszkaniu nie ma;

BAL – wynosi 1, jeśli jest balkon i jest równy 0, jeśli nie ma balkonu.

Obliczenia przeprowadzono za pomocą programu STATISTICA (rysunek 2.23). Obecność współczynników  pozwala uporządkować zmienne według stopnia ich wpływu na zmienną zależną. Przeprowadźmy krótką analizę wyników obliczeń.

Na podstawie statystyki Fishera wnioskujemy o istotności równania regresji (poziom p< 0,05). Обработана информация о 6 286 квартирах (n–m–1 = 6 276, а m = 9). Все коэффициенты уравнения регрессии (кроме при переменной BAL) значимы (р-величины для них < 0,05), а наличие или отсутствие балкона в этом случае существенно не сказывается на цене квартиры.

Rysunek 2.24 – Raport dotyczący rynku mieszkań na podstawie STATISTICA PPP

Współczynnik determinacji wielokrotnej wynosi 52%, zatem zmienne uwzględnione w regresji determinują zmianę ceny w 52%, a pozostałe 48% zmiany ceny mieszkania zależy od czynników nieuwzględnionych. W tym od przypadkowych wahań cen.

Każdy ze współczynników zmiennej pokazuje, o ile zmieni się cena mieszkania (przy pozostałych czynnikach niezmienionych), jeśli ta zmienna zmieni się o jeden. Na przykład, gdy całkowita powierzchnia zmieni się o 1 m2. m, cena mieszkania zmieni się średnio o 0,791 USD, a jeśli mieszkanie przesunie się o 1 km od centrum miasta, cena mieszkania spadnie średnio o 0,596 USD. itp. Zmienne fikcyjne (ostatnie 5) pokazują, jak bardzo zmieni się średnia cena mieszkania, jeśli przejdziemy z jednego poziomu tej zmiennej na drugi. I tak na przykład, jeśli dom jest murowany, to mieszkanie w nim kosztuje średnio 3104 USD. Czyli drożej niż tyle samo w domu z paneli, a obecność telefonu w mieszkaniu podnosi jego cenę średnio o 1493 USD. tj. itp.

Na podstawie współczynników  można wyciągnąć następujące wnioski. Największy współczynnik , równy 0,514, jest współczynnikiem dla zmiennej „powierzchnia całkowita”, dlatego przede wszystkim cena mieszkania kształtuje się pod wpływem jego powierzchni całkowitej. Kolejnym czynnikiem wpływającym na zmianę ceny mieszkania jest odległość do centrum miasta, następnie materiał, z którego zbudowany jest dom, następnie powierzchnia kuchni itp.

Strona 1


Standaryzowane współczynniki regresji pokazują, o ile sigma zmieni się średni wynik, jeśli odpowiedni współczynnik x zmieni się o jednego sigma, przy średnim poziomie pozostałych czynników niezmienionym. Dzięki temu, że wszystkie zmienne są określone jako wycentrowane i znormalizowane, standaryzowane współczynniki religii D są ze sobą porównywalne. Porównując je ze sobą, można uszeregować czynniki według siły ich wpływu na wynik. Na tym właśnie polega główna zaleta standaryzowanych współczynników wyznania, w przeciwieństwie do współczynników czystej religii, które są nieporównywalne.

Zgodność korelacji cząstkowej i standaryzowanych współczynników regresji najlepiej widać z porównania ich wzorów w analizie dwuczynnikowej.

Spójność korelacji cząstkowej i standaryzowanych współczynników regresji najlepiej widać z porównania ich wzorów w analizie dwuwymiarowej.

Do określenia wartości szacunków przy standaryzowanych współczynnikach regresji a (najczęściej stosuje się następujące metody rozwiązywania układu równań normalnych: metodę wyznaczników, metodę pierwiastków kwadratowych i metodę macierzową. Ostatnio metoda macierzowa były szeroko stosowane do rozwiązywania problemów analizy regresji.Tutaj rozważymy rozwiązanie układu równań normalnych metodą wyznaczników.

Innymi słowy, w analizie dwuczynnikowej częściowe współczynniki korelacji są standaryzowanymi współczynnikami regresji pomnożonymi przez pierwiastek kwadratowy ze stosunku udziałów wariancji reszt stałego czynnika do czynnika i wyniku.

Istnieje inna możliwość oceny roli cech grupujących i ich znaczenia dla klasyfikacji: na podstawie standaryzowanych współczynników regresji lub współczynników odrębnego wyznaczania (patrz rozdz.

Jak widać z tabeli. 18 składniki badanej kompozycji rozdzielono według bezwzględnej wartości współczynników regresji (b5) z ich błędem kwadratowym (5br) w szeregu od tlenku węgla i kwasów organicznych do aldehydów i par oleju. Przy obliczaniu standaryzowanych współczynników regresji (p) okazało się, że biorąc pod uwagę zakres wahań stężeń, w powstawaniu toksyczności mieszaniny na ogół wychodzą na pierwszy plan ketony i tlenek węgla, podczas gdy kwasy organiczne pozostają na trzecim miejscu .

Warunkowe współczynniki regresji czystej bf są liczbami nazwanymi wyrażonymi w różnych jednostkach miary i dlatego nie są ze sobą porównywalne. Aby przeliczyć je na porównywalne wskaźniki względne, stosuje się tę samą transformację, co w celu uzyskania współczynnika korelacji parami. Wynikowa wartość nazywana jest standaryzowanym współczynnikiem lub współczynnikiem regresji.

Warunkowe czyste współczynniki regresji A; są liczbami nazwanymi wyrażonymi w różnych jednostkach miary i dlatego są ze sobą nieporównywalne. Aby przeliczyć je na porównywalne wskaźniki względne, stosuje się tę samą transformację, co w celu uzyskania współczynnika korelacji parami. Wynikowa wartość nazywana jest standaryzowanym współczynnikiem lub współczynnikiem regresji.

W procesie opracowywania standardów zatrudnienia zbierane są wstępne dane dotyczące liczby płac kadry kierowniczej oraz wartości czynników dla wybranych przedsiębiorstw bazowych. Następnie dla każdej funkcji dobierane są czynniki istotne na podstawie analizy korelacji, bazującej na wartościach współczynników korelacji. Wybierane są czynniki o największej wartości współczynnika korelacji pary z funkcją i standaryzowanym współczynnikiem regresji.

Wyniki powyższych obliczeń pozwalają na uporządkowanie malejące współczynników regresji odpowiadających badanej mieszaninie i tym samym ilościowe określenie stopnia ich zagrożenia. Uzyskany w ten sposób współczynnik regresji nie uwzględnia jednak zakresu możliwych wahań poszczególnych składników mieszaniny. W rezultacie produkty zniszczenia, które mają wysokie współczynniki regresji, ale wahają się w małym zakresie stężeń, mogą mieć mniejszy wpływ na ogólny efekt toksyczny niż składniki o stosunkowo małym b, których zawartość w mieszaninie zmienia się w szerszym zakresie. Dlatego celowe wydaje się wykonanie dodatkowej operacji – obliczenie tzw. standaryzowanych współczynników regresji p (J.

Strony:      1

Ćwiczenia.

  1. Dla danego zbioru danych zbuduj liniowy model regresji wielokrotnej. Ocenić dokładność i adekwatność skonstruowanego równania regresji.
  2. Podaj ekonomiczną interpretację parametrów modelu.
  3. Oblicz standaryzowane współczynniki modelu i zapisz równanie regresji w postaci standaryzowanej. Czy to prawda, że ​​cena dobra ma większy wpływ na wielkość podaży dobra niż płace pracowników?
  4. Dla otrzymanego modelu (w postaci naturalnej) sprawdź, czy reszty są homoskedastyczne, stosując test Goldfelda-Quandta.
  5. Przetestuj powstały model pod kątem autokorelacji reszt za pomocą testu Durbina-Watsona.
  6. Sprawdź, czy założenie o homogeniczności danych pierwotnych w sensie regresji jest adekwatne. Czy możliwe jest połączenie dwóch próbek (dla pierwszych 8 i pozostałych 8 obserwacji) w jedną i rozważenie pojedynczego modelu regresji Y na X?

1. Estymacja równania regresji. Wyznaczmy wektor oszacowań współczynników regresji za pomocą usługi równań regresji wielokrotnej. Według metody najmniejszych kwadratów wektor S otrzymany z wyrażenia: s = (X T X) -1 X T Y
Matryca X

1 182.94 1018
1 193.45 920
1 160.09 686
1 157.99 405
1 123.83 683
1 152.02 530
1 130.53 525
1 137.38 418
1 137.58 425
1 118.78 161
1 142.9 242
1 99.49 226
1 116.17 162
1 185.66 70

Matryca Y
4.07
4
2.98
2.2
2.83
3
2.35
2.04
1.97
1.02
1.44
1.22
1.11
0.82

Matryca X T
1 1 1 1 1 1 1 1 1 1 1 1 1 1
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

Pomnóż macierze, (X T X)
2.25 -0.0161 0.00037
-0.0161 0.000132 -7.0E-6
0.00037 -7.0E-61.0E-6

Wektor szacunków współczynnika regresji jest równy

Y(X) =
2,25 -0,0161 0,00037
-0,0161 0,000132 -7.0E-6
0,00037 -7.0E-61.0E-6
*
31,05
4737,044
18230,79
=
0,18
0,00297
0,00347

Równanie regresji (oszacowanie równania regresji)
Y = 0,18 + 0,00297X 1 + 0,00347X2

2. Macierz współczynników korelacji par R. Liczba obserwacji n = 14. Liczba zmiennych niezależnych w modelu wynosi 2, a liczba regresorów uwzględniających wektor jednostkowy jest równa liczbie nieznanych współczynników. Uwzględniając znak Y, wymiar macierzy staje się równy 4. Macierz zmiennych niezależnych X ma wymiar (14 x 4).
Macierz złożona z Y i X

1 4.07 182.94 1018
1 4 193.45 920
1 2.98 160.09 686
1 2.2 157.99 405
1 2.83 123.83 683
1 3 152.02 530
1 2.35 130.53 525
1 2.04 137.38 418
1 1.97 137.58 425
1 1.02 118.78 161
1 1.44 142.9 242
1 1.22 99.49 226
1 1.11 116.17 162
1 0.82 185.66 70

Transponowana macierz.

1 1 1 1 1 1 1 1 1 1 1 1 1 1
4.07 4 2.98 2.2 2.83 3 2.35 2.04 1.97 1.02 1.44 1.22 1.11 0.82
182.94 193.45 160.09 157.99 123.83 152.02 130.53 137.38 137.58 118.78 142.9 99.49 116.17 185.66
1018 920 686 405 683 530 525 418 425 161 242 226 162 70

Matryca ATA.

14 31.05 2038.81 6471
31.05 83.37 4737.04 18230.79
2038.81 4737.04 307155.61 995591.55
6471 18230.79 995591.55 4062413

Powstała macierz ma następującą zgodność:

∑n∑ r∑x 1∑x 2
∑ r∑y 2∑x 1 r∑x 2 lata
∑x 1∑yx 1∑x 1 2∑x 2 x 1
∑x 2∑yx 2∑x 1 x 2∑x 2 2

Znajdźmy współczynniki korelacji par.
Zawiera x i y∑(xi) ∑(yi) ∑(x i y ja )
Dla y i x 1 2038.81 145.629 31.05 2.218 4737.044 338.36
Dla y i x 2 6471 462.214 31.05 2.218 18230.79 1302.199
Dla x1 i x2 6471 462.214 2038.81 145.629 995591.55 71113.682
Zawiera x i y
Dla y i x 1 731.797 1.036 27.052 1.018
Dla y i x 2 76530.311 1.036 276.641 1.018
Dla x1 i x2 76530.311 731.797 276.641 27.052

Macierz współczynników korelacji par R:
- yx 1x 2
y 1 0.558 0.984
x 1 0.558 1 0.508
x 2 0.984 0.508 1

Aby wybrać najważniejsze czynniki x i, brane są pod uwagę następujące warunki:
- związek między charakterystyką wypadkową a współczynnikiem musi być wyższy niż związek międzyczynnikowy;
- związek między czynnikami nie powinien być większy niż 0,7. Jeśli macierz ma współczynnik korelacji międzyczynnikowej r xjxi > 0,7, wówczas w tym modelu regresji wielokrotnej występuje wieloliniowość;
- przy dużym powiązaniu międzyczynnikowym cechy wybierane są czynniki o niższym współczynniku korelacji między nimi.
W naszym przypadku wszystkie współczynniki korelacji parami |r| Model regresji w skali standardowej Model regresji w skali standardowej zakłada, że ​​wszystkie wartości badanych cech przelicza się na standardy (wartości standaryzowane) za pomocą wzorów:

gdzie x ji jest wartością zmiennej x ji w i-tej obserwacji.

Zatem pochodzenie każdej zmiennej standaryzowanej łączy się z jej wartością średnią, a jej odchylenie standardowe przyjmuje się jako jednostkę zmiany S.
Jeśli związek między zmiennymi w skali naturalnej jest liniowy, to zmiana pochodzenia i jednostki miary nie naruszy tej własności, więc zmienne standaryzowane również będą powiązane zależnością liniową:
t y = ∑β jot t xj
Aby oszacować współczynniki β, używamy OLS. W tym przypadku układ równań normalnych będzie miał postać:
r x1y =β 1 +r x1x2 β 2 + ... + r x1xm β m
r x2y =r x2x1 β 1 + β 2 + ... + r x2xm β m
...
r xmy =r xmx1 β 1 + r xmx2 β 2 + ... + β m
Dla naszych danych (bierzemy je z macierzy współczynników korelacji par):
0,558 = β 1 + 0,508 β 2
0,984 = 0,508β 1 + β 2
Rozwiązujemy ten układ równań liniowych metodą Gaussa: β 1 = 0,0789; β2 = 0,944;
Standaryzowana postać równania regresji to:
y 0 = 0,0789x 1 + 0,944x 2
Współczynniki β znalezione w tym układzie pozwalają wyznaczyć wartości współczynników regresji w skali naturalnej za pomocą wzorów:

Standaryzowane współczynniki regresji częściowej. Standaryzowane współczynniki regresji cząstkowej - współczynniki β (β j) pokazują, o jaką część odchylenia standardowego S(y) zmieni się wynik y ze zmianą odpowiedniego współczynnika x j o wartość jego odchylenia standardowego (S xj) przy stałym wpływie innych czynników (uwzględnionych w równaniu).
Przy maksymalnym β j można ocenić, który czynnik ma większy wpływ na wynik Y.
Współczynniki elastyczności i współczynniki β mogą prowadzić do przeciwnych wniosków. Powody tego są następujące: a) zmienność jednego czynnika jest bardzo duża; b) wielokierunkowy wpływ czynników na wynik.
Współczynnik β j można również interpretować jako wskaźnik bezpośredniego (natychmiastowego) wpływu J-ty współczynnik (x j) wyniku (y). W regresji wielokrotnej J Czynnik ten ma nie tylko bezpośredni, ale także pośredni (pośredni) wpływ na wynik (tj. wpływ poprzez inne czynniki modelu).
Wpływ pośredni mierzy się wartością: ∑β i r xj,xi , gdzie m jest liczbą czynników w modelu. Pełny wpływ j współczynnik na wynik równy sumie wpływów bezpośrednich i pośrednich mierzy współczynnik korelacji pary liniowej tego czynnika i wynik - r xj,y.
Zatem dla naszego przykładu bezpośredni wpływ współczynnika x 1 na wynik Y w równaniu regresji mierzony jest przez β j i wynosi 0,0789; pośredni (pośredni) wpływ tego czynnika na wynik definiuje się jako:
rx1x2 β 2 = 0,508 * 0,944 = 0,4796

W ekonometrii często stosuje się inne podejście do wyznaczania parametrów regresji wielokrotnej (2.13) przy wyłączonym współczynniku:

Podzielmy obie strony równania przez odchylenie standardowe wyjaśnianej zmiennej S Y i przedstaw go w postaci:

Podzielmy i pomnóżmy każdy wyraz przez odchylenie standardowe odpowiedniej zmiennej czynnikowej, aby uzyskać zmienne standardowe (wyśrodkowane i znormalizowane):

gdzie nowe zmienne są oznaczone jako

.

Wszystkie zmienne standaryzowane mają średnią wynoszącą zero i tę samą wariancję wynoszącą jeden.

Równanie regresji w postaci standardowej to:

Gdzie
- standaryzowane współczynniki regresji.

Standaryzowane współczynniki regresji różnią się od współczynników postać zwyczajną, naturalną w tym sensie, że ich wartość nie zależy od skali pomiaru zmiennych objaśnianych i objaśniających modelu. Ponadto istnieje między nimi prosta zależność:

, (3.2)

co daje inny sposób obliczania współczynników według znanych wartości , wygodniej w przypadku np. modelu regresji dwuczynnikowej.

5.2. Normalny układ równań najmniejszych kwadratów w standaryzacji

zmienne

Okazuje się, że do obliczenia standaryzowanych współczynników regresji wystarczy znać parami współczynniki korelacji liniowej. Aby pokazać, jak to się robi, wykluczmy niewiadomą z normalnego układu równań najmniejszych kwadratów korzystając z pierwszego równania. Mnożąc pierwsze równanie przez (
) i dodając go termin po wyrazie do drugiego równania, otrzymujemy:

Zastąpienie wyrażeń w nawiasach oznaczeniami wariancji i kowariancji

Przepiszmy drugie równanie w formie dogodnej do dalszego uproszczenia:

Podzielmy obie strony tego równania przez odchylenie standardowe zmiennych S Y I ` S X 1 i podziel każdy wyraz i pomnóż przez odchylenie standardowe zmiennej odpowiadającej numerowi wyrazu:

Przedstawiamy charakterystykę liniowej zależności statystycznej:

i standaryzowane współczynniki regresji

,

otrzymujemy:

Po podobnych przekształceniach wszystkich pozostałych równań normalny układ równań liniowych metodą najmniejszych kwadratów (2.12) przyjmuje następującą, prostszą postać:

(3.3)

5.3. Standaryzowane opcje regresji

Standaryzowane współczynniki regresji w szczególnym przypadku modelu z dwoma czynnikami wyznacza się z następującego układu równań:

(3.4)

Rozwiązując ten układ równań, znajdujemy:

, (3.5)

. (3.6)

Podstawiając znalezione wartości współczynników korelacji pary do równań (3.4) i (3.5), otrzymujemy I . Następnie, korzystając ze wzorów (3.2), łatwo jest obliczyć szacunki współczynników I , a następnie, jeśli to konieczne, obliczyć oszacowanie według formuły

6. Możliwości analizy ekonomicznej w oparciu o model wieloczynnikowy

6.1. Standaryzowane współczynniki regresji

Standaryzowane współczynniki regresji pokazują, ile odchyleń standardowych średnia zmienna objaśniana ulegnie zmianie Y, jeśli odpowiednia zmienna objaśniająca X I zmieni się o kwotę
jedno ze swoich odchyleń standardowych, przy zachowaniu niezmienionego średniego poziomu wszystkich pozostałych czynników.

Ze względu na fakt, że w regresji standardowej wszystkie zmienne są określone jako zmienne losowe wyśrodkowane i znormalizowane, współczynniki porównywalne ze sobą. Porównując je ze sobą, można uszeregować odpowiadające im czynniki X I poprzez siłę wpływu na zmienną objaśnianą Y. Jest to główna zaleta standaryzowanych współczynników regresji ze współczynników regresje w naturalnej postaci, które są nieporównywalne.

Ta cecha standaryzowanych współczynników regresji pozwala na wykorzystanie ich przy eliminacji czynników najmniej istotnych X I z wartościami ich przykładowych szacunków bliskimi zera . Decyzja o wyłączeniu ich z równania modelu regresji liniowej podejmowana jest po przetestowaniu hipotez statystycznych, że ich średnia wartość jest równa zeru.

Współczynnik beta równy 0,074 (tabela 3.2.1) pokazuje, że jeśli płace realne zmienią się o wartość ich odchylenia standardowego (σх1), to współczynnik przyrostu naturalnego zmieni się średnio o 0,074 σу. Współczynnik beta wynoszący 0,02 pokazuje, że jeśli surowy współczynnik małżeństw zmieni się o wartość odchylenia standardowego (o σх2), to tempo przyrostu naturalnego zmieni się średnio o 0,02 σу. Podobnie zmiana liczby przestępstw na 1000 mieszkańców o wartość jej odchylenia standardowego (o σх3) spowoduje zmianę uzyskanej charakterystyki średnio o 0,366 σу, a zmianę wsadu metrów kwadratowych mieszkań lokalu na osobę rocznie o wartość jego odchylenia standardowego (o σх4) prowadzi do zmiany efektywnej charakterystyki średnio o 1,32σу.

Współczynnik elastyczności pokazuje, o ile średnio procentowo zmienia się y przy zmianie atrybutu czynnika o 1%. Z analizy szeregów czasowych wiadomo, że wartość 1% wzrostu cechy efektywnej jest ujemna, gdyż we wszystkich jednostkach populacji występuje ubytek naturalny. Dlatego wzrost w rzeczywistości oznacza zmniejszenie strat. Oznacza to, że ujemne współczynniki elastyczności w tym przypadku odzwierciedlają fakt, że wraz ze wzrostem każdej z cech czynnika o 1% współczynnik strat naturalnych zmniejszy się o odpowiednią liczbę procent. Przy wzroście płac realnych o 1% stopa spadku naturalnego zmniejszy się o 0,219%, a przy wzroście współczynnika małżeństw ogółem o 1% obniży się o 0,156%. Wzrost liczby przestępstw na 1000 ludności o 1% charakteryzuje się zmniejszeniem przyrostu naturalnego o 0,564. Nie oznacza to oczywiście, że wzrost przestępczości może poprawić sytuację demograficzną. Uzyskane wyniki wskazują, że im więcej osób pozostaje w przeliczeniu na 1000 mieszkańców, tym odpowiednio więcej dochodzi do przestępstw na tysiąc. Zwiększanie nakładów mkw. mieszkań na osobę rocznie o 1% prowadzi do zmniejszenia strat naturalnych o 0,482%

Z analizy współczynników elastyczności i współczynników beta wynika, że ​​największy wpływ na dynamikę przyrostu naturalnego ma współczynnik oddania do użytkowania mkw. mieszkań na mieszkańca, gdyż odpowiada on największej wartości współczynnika beta (1,32). Nie oznacza to jednak, że największe możliwości zmiany tempa przyrostu naturalnego kojarzą się ze zmianami tego z rozpatrywanych czynników. Uzyskany wynik odzwierciedla fakt, że popyt na rynku mieszkaniowym odpowiada podaży, czyli im większy przyrost naturalny ludności, tym większe zapotrzebowanie tej ludności na mieszkania i im więcej się je buduje.

Drugi co do wielkości współczynnik beta (0,366) odpowiada liczbie przestępstw na 1000 mieszkańców. Nie oznacza to oczywiście, że poprzez wzrost przestępczości można poprawić sytuację demograficzną. Uzyskane wyniki wskazują, że im więcej osób pozostaje w przeliczeniu na 1000 mieszkańców, tym odpowiednio więcej dochodzi do przestępstw na tysiąc.

Największy z pozostałych wskaźników, współczynnik beta (0,074), odpowiada wskaźnikowi wynagrodzeń realnych. Największe możliwości zmiany tempa przyrostu naturalnego ludności wiążą się ze zmianami tego rozpatrywanego czynnika. Wskaźnik ogólnego wskaźnika małżeństw jest pod tym względem gorszy od płac realnych, ponieważ naturalny spadek liczby ludności w Rosji wynika przede wszystkim z wysokiej śmiertelności ludności, której tempo wzrostu można zmniejszyć raczej poprzez bezpieczeństwo materialne niż przez wzrost liczby małżeństw.

3.3 Łączne grupowanie regionów według płac realnych i ogólnego wskaźnika małżeństw

Grupowanie kombinowane lub wielowymiarowe to grupowanie oparte na dwóch lub większej liczbie cech. Wartość tego grupowania polega na tym, że pokazuje nie tylko wpływ każdego czynnika na wynik, ale także wpływ ich kombinacji.

Określmy wpływ wartości płac realnych i ogólnego wskaźnika małżeństw na współczynnik urodzeń na 1000 mieszkańców.

Zidentyfikujmy typowe grupy według zamierzonych cech. W tym celu skonstruujemy i przeanalizujemy szeregi rankingowe i interwałowe według atrybutu czynnika (wartości wynagrodzenia), określimy liczbę grup i wielkość przedziału; następnie w ramach każdej grupy skonstruujemy szeregi rankingowe i interwałowe w oparciu o drugie kryterium (wskaźnik zawierania małżeństw), a także ustalimy liczbę grup i przedział. Procedurę wykonania tej pracy przedstawiono w Rozdziale 2, dlatego pomijając obliczenia, przedstawiamy wyniki. Dla wartości wynagrodzeń realnych wyróżniono 3 typowe grupy, dla ogólnego wskaźnika małżeństw – 2 grupy.

Opracujemy układ tabeli kombinacji, w której zapewnimy podział populacji na grupy i podgrupy, a także kolumny do rejestrowania liczby regionów i współczynnika urodzeń na 1000 mieszkańców. Dla wybranych grup i podgrup obliczamy współczynniki urodzeń (tabela 3.3.1)

Tabela 3.3.1

Wpływ płac realnych i ogólnego wskaźnika małżeństw na współczynnik urodzeń.

Przeanalizujmy uzyskane dane na temat zależności współczynnika urodzeń od wynagrodzeń realnych i wskaźnika małżeństw. Ponieważ badana jest jedna cecha - współczynnik dzietności, dane na jej temat zapiszemy w tabeli kombinacji szachowych w następującej postaci (tabela 3.3.2)

Połączone grupowanie pozwala ocenić stopień wpływu każdego czynnika z osobna na współczynnik urodzeń i ich interakcję.

Tabela 3.3.2

Zależność liczby urodzeń od wynagrodzeń realnych i liczby zawieranych małżeństw

Przeanalizujmy najpierw wpływ na współczynnik urodzeń wartości płac realnych przy stałej wartości innej cechy grupującej – wskaźnika małżeństw. I tak, przy współczynniku zawierania małżeństw od 13,2 do 25,625, przeciętny współczynnik urodzeń wzrasta wraz ze wzrostem wynagrodzeń z 9,04 w 1. grupie do 9,16 w 2. grupie i 9,56 w 3. grupie; wzrost współczynnika urodzeń z wynagrodzeń w 3. grupie w porównaniu do 1. grupy wynosi: 9,56-9,04 = 0,52 osoby na 1000 ludności. Przy wskaźniku małżeństw wynoszącym 25,625-38,05 wzrost z tej samej płacy wynosi: 10,27-9,49 = 0,78 osoby na 1000 mieszkańców. Wzrost z interakcji czynników wynosi: 0,78-0,52 = 0,26 osoby na 1000 ludności. Wynika z tego zupełnie naturalny wniosek: wzrost dobrostanu motywuje, a raczej pozwala z ufnością na przyszłość urzeczywistnić pragnienie zawarcia małżeństwa i założenia rodziny z dziećmi. To pokazuje interakcję czynników.

W ten sam sposób oszacujemy wpływ na współczynnik dzietności współczynnika małżeństw przy stałym poziomie wynagrodzenia. W tym celu porównajmy współczynnik urodzeń dla grup „a” i „b” w obrębie każdej grupy według wartości płac realnych. Wzrost współczynnika urodzeń wraz ze wzrostem wskaźnika małżeństw do 25,625-38,05 na 1000 mieszkańców w porównaniu do grupy „a” wynosi: w 1 grupie z pensją 5707,9 – 6808,7 rubli. miesięcznie - 9,49-9,04 = 0,45 osoby na 1000 ludności, w grupie 2 - 10,01-9,16 = 0,85 osoby na 1000 ludności i w trzeciej grupie - 10,27-9,56 = 0,71 osoby na 1000 ludności. Jak widać decyzja o posiadaniu dziecka uzależniona jest od stanu cywilnego, tj. zachodzi interakcja czynników, dająca wzrost o 0,26 osoby na 1000 ludności.

Przy łącznym wzroście obu czynników współczynnik urodzeń wzrasta z 9,04 w podgrupie 1 „a” do 10,27 osób na 1000 ludności w podgrupie 3 „b”.

Przedstawiciele Europejskiej Komisji Gospodarczej ONZ ogłosili niedawno, że wiek zawierania pierwszego małżeństwa w krajach europejskich wzrósł o pięć lat. Chłopcy i dziewczęta wolą brać ślub po 30. roku życia. Rosjanie nie mają odwagi zawiązać węzła małżeńskiego przed 24.-26. rokiem życia. Wspólną dla Europy i Rosji tendencją jest także zmniejszanie się liczby zawieranych małżeństw. Młodzi ludzie coraz częściej preferują karierę i wolność osobistą. Krajowi eksperci dostrzegają w tych procesach oznaki głębokiego kryzysu tradycyjnej rodziny. Ich zdaniem dosłownie przeżywa swoje ostatnie dni. Socjolodzy twierdzą, że życie prywatne przechodzi obecnie okres restrukturyzacji. Rodzina w potocznym tego słowa znaczeniu, żyjąca według schematu „mama-ojciec-dzieci”, stopniowo odchodzi w przeszłość. W życiu prywatnym Rosjanie coraz częściej eksperymentują, wymyślając coraz to nowe formy rodziny, odpowiadające potrzebom czasu. „Teraz człowiek częściej zmienia pracę, zawód, zainteresowania, miejsce zamieszkania” – powiedział Novye Izwiestia Anatolij Wiszniewski, dyrektor Centrum Demografii i Ekologii Człowieka. „Często zmienia też małżonków, co 20 lat temu uznano za niedopuszczalne .”

Socjolodzy zauważają, że jedną z przyczyn wzrostu liczby rozwodów w Rosji jest niski poziom życia ludności. „Według statystyk w Rosji jest około 10–15% więcej rozwodów niż w Europie” – powiedział NI pan Gontmakher (dyrektor naukowy Centrum Badań i Innowacji Społecznych). – Ale przyczyny rozwodów są dla nas i dla nich inne. Nasz prymat podyktowany jest przede wszystkim faktem, że problemy gospodarcze w coraz większym stopniu wpływają na życie Rosjan. Małżonkowie kłócą się częściej, jeśli mają ciasne warunki życia. Młodym ludziom nie zawsze udaje się żyć samodzielnie. Ponadto w regionach wielu mężczyzn pije, nie pracuje i nie jest w stanie utrzymać rodziny. To też jest powód do rozwodu.”

Wniosek

W pracy przeprowadzono analizę statystyczną i ekonomiczną wpływu poziomu życia ludności na procesy naturalnego wzrostu.

Analiza dynamiki wykazała, że ​​w ciągu ostatnich 10 lat nastąpił wzrost wynagrodzeń realnych i kosztów życia. Ogólnie rzecz biorąc, w ciągu tych 10 lat efektywny atrybut – współczynnik przyrostu naturalnego – jest stały. Stabilność pojawiających się procesów zmian wybranych cech jest taka, że ​​prognozowanie możliwe jest jedynie dla wartości wynagrodzeń realnych i współczynnika umieralności. Zgodnie z narastającym trendem parabolicznym do 2010 roku prognozowana wartość przeciętnego wynagrodzenia realnego wyniesie 17 473,5 rubli, a współczynnik umieralności obniży się do 12,75 osób na 1000.

Grupowanie analityczne wykazało bezpośredni związek między wskaźnikami: wraz ze wzrostem płac poprawiają się wskaźniki naturalnego wzrostu.

Jednakże rodzina składająca się z dwóch pracowników o przeciętnej pensji może zapewnić minimalny poziom konsumpcji dla 2 dzieci - w najniższej typowej grupie, 3 dzieci - w środkowej i najwyższej typowej grupie. Biorąc pod uwagę, że dwójka dzieci „zastępuje” w przyszłości życie rodziców, nieznaczny wzrost liczby ludności jest możliwy jedynie w średnich i najwyższych grupach typowych, i to pod warunkiem niskiej śmiertelności w stosunku do liczby urodzeń. Potencjał dzietności związany z płacami w Rosji jest niski, co sprzyja poprawie sytuacji demograficznej w kraju. To właśnie ujawnia potrzebę wprowadzenia w Rosji projektu narodowo-demograficznego. Wzrost płac korzystniej wpływa na współczynnik umieralności niż na przyrost naturalny.

Konstrukcja modelu korelacyjno-regresyjnego ujawniła, że ​​przy średniej sile powiązania obserwuje się równoczesny wpływ cech czynników (płace, współczynniki małżeństw, przestępczość i oddanie mieszkań) na produktywność (przyrost naturalny). Zróżnicowanie tempa przyrostu naturalnego o 44,9% charakteryzuje się wpływem wybranych czynników, a 55,1% innymi przyczynami nieuwzględnionymi i losowymi. Największe możliwości zmiany tempa przyrostu naturalnego ludności wiążą się ze zmianami wartości płac realnych.

Połączona grupa potwierdziła, że ​​wzrost dobrostanu motywuje, a raczej pozwala z ufnością na przyszłość urzeczywistnić pragnienie zawarcia małżeństwa i założenia rodziny z dziećmi.

I wreszcie trzeba ocenić skuteczność rozwiązania problemu demograficznego w naszym kraju. Ogólnie rzecz biorąc, wykazano pozytywny i skuteczny wpływ bodźców materialnych na proces naturalnego przemieszczania się ludności. Inną sprawą jest to, że istnieje zespół problemów społeczno-psychologicznych (alkoholizm, przemoc, samobójstwa), które nieuchronnie zmniejszają naszą populację. Ich głównym powodem jest stosunek człowieka do siebie i innych. Jednak problemów tych nie rozwiąże samo państwo; społeczeństwo obywatelskie musi samo przyjść z pomocą w problemie wymierania, kształtując wartości moralne skupione na tworzeniu zamożnej rodziny.

A państwo może i powinno zrobić wszystko, aby poprawić poziom i jakość życia w kraju. Nie można powiedzieć, że nasze państwo zaniedbuje te obowiązki. Robi wszystko, co możliwe, szuka i próbuje różnych sposobów wyjścia z kryzysu demograficznego.

Wykaz używanej literatury

1) Borysow E.F. Teoria ekonomii: podręcznik - wyd. 2, poprawione. i dodatkowe – M.: TK Welby, Wydawnictwo Prospekt, 2005. – 544 s.

2) Belousova S. analiza poziomu ubóstwa.// Economist.-2006, nr 10.-s.67

3) Davydova L. A. Teoria statystyki. Instruktaż. Moskwa. Aleja. 2005. 155 s.;

4) Demografia: Podręcznik/Ogólne. wyd. NA. Wołgina. M.: Wydawnictwo RAGS, 2003 – 384 s.

5) Efimova E. P. Statystyki społeczne. Moskwa. Finanse i statystyka. 2003. 559 s.;

6)Efimova E.P., Ryabtsev V.M. Ogólna teoria statystyki. Wydanie edukacyjne. Moskwa. Finanse i statystyka. 1991. 304 s.;

7) Zinchenko A.P. Warsztaty z ogólnej teorii statystyki i statystyki rolniczej. Moskwa. Finanse i statystyka. 1988. 328 s.;

8) Kadomtseva S. Polityka społeczna i ludność.// Economist.-2006, nr 7.-s.49

9) Kozyrev V.M. Podstawy współczesnej ekonomii: Podręcznik. -wyd. 2, poprawione. i dodatkowe –M.: Finanse i statystyka, 2001.-432 s.

10) Konygina N. Brintseva G. Demograf Anatolij Wiszniewski o tym, co zmusza Rosjanina do wyboru między dziećmi a wygodą. // Rossiyskaya Gazeta - 2006, 7 listopada - nr 249 - s. 10. 7

11) Nazarova N.G. Kurs statystyki społecznej. Moskwa. Finstatinform. 2000. 770 s.;

13) Podstawy demografii: Podręcznik / N.V. Zvereva, I.N. Veselkova, V.V. Elizarov.-M.: Wyżej. Shk., 2004.-374 s.: il.

14) Orędzie Prezydenta Federacji Rosyjskiej do Zgromadzenia Federalnego Federacji Rosyjskiej z dnia 26 kwietnia 2007 r.

15) Raisberg B.A., Lozovsky L.Sh., Starodubtseva E.B. Nowoczesny słownik ekonomiczny. – wydanie czwarte, poprawione. i dodatkowe -M.:INFRA-M, 2005.-480 s.

16)Rudakova R.P., Bukin L.L., Gavrilov V.I. Warsztaty ze statystyki. -SPb.: Piotr, 2007.-288 s.

17) Strona internetowa Federalnej Służby Statystycznej www.gks.ru

18) Shaikin D.N. Prospektywna ocena populacji Rosji w średnim okresie // Pytania statystyczne - 2007, nr 4 – s. 47

SYSTEM WSKAŹNIKÓW (KLUCZ DO ŻETONÓW)

1-przeciętna miesięczna płaca nominalna w 2006 roku (w rublach)

Dwukonsumenckie wskaźniki cen wszystkich rodzajów towarów i usług płatnych w 2006 roku w procentach w porównaniu do grudnia ubiegłego roku

3 - przeciętne miesięczne wynagrodzenie realne w 2006 r. (w rublach)

4 – ludność na początku 2006 r

5 – ludność na koniec 2006 roku

6 – średnioroczna liczba ludności w 2006 roku

7 – liczba urodzeń w 2006 r., osoby

8 – liczba zgonów w 2006 r., osoby

9 – współczynnik urodzeń w 2006 r. na 1000 ludności

10 – współczynnik umieralności w 2006 roku na 1000 mieszkańców

11 – stopa przyrostu naturalnego w 2006 r. na 1000 ludności

12 – koszty utrzymania za rok 2006 (w rublach)

13 – liczba popełnionych przestępstw na 1000 mieszkańców

14 – oddanie do użytku m2 mieszkania na osobę rocznie

15 – ogólny wskaźnik zawieranych małżeństw na 1000 mieszkańców

Aneks 1

Tabela

Płace realne, rub.

Załącznik 2

Koszt życia, pocierać.

Dodatek 3

KATEGORIE

POPULARNE ARTYKUŁY

2023 „kingad.ru” - badanie ultrasonograficzne narządów ludzkich