En küçük kareler yöntemini kullanarak veri analizi. Excel'de En Küçük Kareler

en küçük kareler yöntemi

Konunun son dersinde en ünlü uygulama ile tanışacağız. FNPçeşitli bilim ve uygulama alanlarında en geniş uygulamayı bulan . Fizik, kimya, biyoloji, ekonomi, sosyoloji, psikoloji ve benzeri olabilir. Kaderin iradesiyle, sık sık ekonomiyle uğraşmak zorunda kalıyorum ve bu nedenle bugün sizin için inanılmaz bir ülkeye bir bilet ayarlayacağım. Ekonometri=)… Bunu nasıl istemezsin?! Orası çok iyi - sadece karar vermelisin! …Ama muhtemelen kesinlikle istediğiniz şey, sorunları nasıl çözeceğinizi öğrenmektir. en küçük kareler. Ve özellikle gayretli okuyucular onları sadece doğru bir şekilde değil, aynı zamanda ÇOK HIZLI çözmeyi öğreneceklerdir ;-) Ama önce sorunun genel ifadesi+ ilgili örnek:

Nicel bir ifadeye sahip bazı konu alanlarında göstergeler çalışılsın. Aynı zamanda, göstergenin göstergeye bağlı olduğuna inanmak için her türlü neden vardır. Bu varsayım hem bilimsel bir hipotez olabilir hem de temel sağduyuya dayalı olabilir. Ancak bilimi bir kenara bırakalım ve daha iştah açıcı alanları, yani marketleri keşfedelim. Şuna göre belirtin:

– bir marketin perakende alanı, metrekare,
- bir bakkalın yıllık cirosu, milyon ruble.

Mağazanın alanı ne kadar büyük olursa, çoğu durumda cirosunun o kadar büyük olduğu oldukça açıktır.

Bir tef ile gözlemler / deneyler / hesaplamalar / dans ettikten sonra elimizde sayısal veriler olduğunu varsayalım:

Bakkallarda bence her şey açık: - 1. mağazanın alanı, - yıllık cirosu, - 2. mağazanın alanı, - yıllık cirosu vb. Bu arada, sınıflandırılmış materyallere erişime sahip olmak hiç gerekli değildir - kullanılarak cironun oldukça doğru bir değerlendirmesi yapılabilir. matematiksel istatistik. Ancak dikkatiniz dağılmasın, ticari casusluğun seyri zaten ödenmiştir =)

Tablo verileri ayrıca nokta şeklinde yazılabilir ve bizim için olağan şekilde tasvir edilebilir. kartezyen sistem .

Önemli bir soruya cevap verelim: nitel bir çalışma için kaç puan gereklidir?

Daha büyük daha iyi. Kabul edilebilir minimum set 5-6 puandan oluşur. Ayrıca az miktarda veri ile “anormal” sonuçlar örnekleme dahil edilmemelidir. Bu nedenle, örneğin, küçük bir elit mağaza, “meslektaşlarından” daha fazla büyüklükte siparişlere yardımcı olabilir, böylece bulunması gereken genel kalıbı bozabilir!



Oldukça basitse, bir fonksiyon seçmemiz gerekiyor, takvim noktalara mümkün olduğunca yakın geçen . Böyle bir fonksiyon denir yaklaşma (yaklaştırma - yaklaştırma) veya teorik fonksiyon . Genel olarak konuşursak, burada hemen bariz bir "taklitçi" ortaya çıkıyor - grafiği TÜM noktalardan geçen yüksek dereceli bir polinom. Ancak bu seçenek karmaşıktır ve genellikle yanlıştır. (çünkü grafik her zaman “rüzgar” olacak ve ana eğilimi zayıf bir şekilde yansıtacaktır).

Bu nedenle, istenen işlev yeterince basit olmalı ve aynı zamanda bağımlılığı yeterince yansıtmalıdır. Tahmin edebileceğiniz gibi, bu tür işlevleri bulma yöntemlerinden biri denir. en küçük kareler. İlk olarak, özünü genel bir şekilde analiz edelim. Bazı fonksiyonların deneysel verilere yaklaşmasına izin verin:


Bu yaklaşımın doğruluğu nasıl değerlendirilir? Deneysel ve fonksiyonel değerler arasındaki farkları (sapmaları) da hesaplayalım. (çizim üzerinde çalışıyoruz). Akla gelen ilk düşünce, toplamın ne kadar büyük olduğunu tahmin etmektir, ancak sorun şu ki, farklılıklar olumsuz olabilir. (örneğin, ) ve böyle bir toplamın sonucu olan sapmalar birbirini yok edecektir. Bu nedenle, yaklaşımın doğruluğunun bir tahmini olarak, toplamı almayı önerir. modüller sapmalar:

veya katlanmış biçimde: (bilmeyenler için: toplam simgesidir ve - yardımcı değişken - 1'den 1'e kadar değerler alan "sayaç" ) .

Deneysel noktaları farklı fonksiyonlarla yaklaştırarak farklı değerler elde edeceğiz ve bu toplamın nerede daha az olduğu açıktır - bu fonksiyon daha doğrudur.

Böyle bir yöntem var ve denir en küçük modül yöntemi. Ancak pratikte çok daha yaygın hale geldi. en küçük kareler yöntemi olası negatif değerlerin modül tarafından değil, sapmaların karesi alınarak ortadan kaldırıldığı:



, bundan sonra çabalar öyle bir fonksiyonun seçimine yönlendirilir ki, sapmaların karelerinin toplamı olabildiğince küçüktü. Aslında, bu nedenle yöntemin adı.

Ve şimdi başka bir önemli noktaya dönüyoruz: yukarıda belirtildiği gibi, seçilen işlev oldukça basit olmalıdır - ancak bunun gibi birçok işlev de vardır: doğrusal , hiperbolik , üstel , logaritmik , ikinci dereceden vb. Ve elbette, burada hemen "faaliyet alanını azaltmak" istiyorum. Araştırma için hangi işlev sınıfını seçmeli? İlkel ama etkili teknik:

- Puan çekmenin en kolay yolu çizim üzerinde ve konumlarını analiz edin. Düz bir çizgide olma eğilimindeyseler, düz çizgi denklemi optimal değerlerle ve . Başka bir deyişle, görev SUCH katsayılarını bulmaktır - böylece kare sapmaların toplamı en küçük olur.

Noktalar, örneğin, birlikte yer alıyorsa abartma, o zaman lineer fonksiyonun zayıf bir yaklaşıklık vereceği açıktır. Bu durumda, hiperbol denklemi için en "uygun" katsayıları arıyoruz - minimum kareler toplamını verenler .

Şimdi her iki durumda da bahsettiğimize dikkat edin iki değişkenli fonksiyonlar, kimin argümanları aranan bağımlılık seçenekleri:

Ve özünde, standart bir sorunu çözmemiz gerekiyor - bulmak için iki değişkenli bir fonksiyonun minimumu.

Örneğimizi hatırlayın: "mağaza" noktalarının düz bir çizgide yer alma eğiliminde olduğunu ve varlığına inanmak için her türlü neden olduğunu varsayalım. doğrusal bağımlılık ticaret alanından ciro. SÖZ "a" ve "be" katsayılarını bulalım, böylece kare sapmaların toplamı en küçüğüydü. Her şey her zamanki gibi - ilk 1. dereceden kısmi türevler. Göre doğrusallık kuralı toplam simgesinin hemen altında ayırt edebilirsiniz:

Bu bilgiyi bir makale veya kurs için kullanmak istiyorsanız, kaynak listesindeki bağlantı için çok minnettar olacağım, bu kadar ayrıntılı hesaplamaları hiçbir yerde bulamazsınız:

Standart bir sistem yapalım:

Her denklemi "iki" azaltıyoruz ve ayrıca toplamları "parçalıyoruz":

Not : bağımsız olarak neden "a" ve "ol" un toplam simgesinden çıkarılabileceğini analiz edin. Bu arada, resmi olarak bu toplam ile yapılabilir.

Sistemi "uygulanmış" bir biçimde yeniden yazalım:

bundan sonra problemimizi çözme algoritması çizilmeye başlar:

Noktaların koordinatlarını biliyor muyuz? Biliyoruz. toplamlar bulabilir miyiz? Kolayca. En basitini oluşturuyoruz iki bilinmeyenli iki lineer denklem sistemi("a" ve "beh"). Sistemi çözüyoruz, örneğin, Cramer yöntemi, durağan bir nokta ile sonuçlanır . Kontrol etme bir ekstremum için yeterli koşul, bu noktada işlevi doğrulayabiliriz. tam olarak ulaşır asgari. Doğrulama, ek hesaplamalarla ilişkilidir ve bu nedenle onu perde arkasında bırakacağız. (gerekirse eksik çerçeve görüntülenebilirburada ) . Son sonucu çıkarıyoruz:

İşlev en iyi yol (en azından herhangi bir diğer doğrusal fonksiyonla karşılaştırıldığında) deneysel noktaları yakınlaştırır . Kabaca söylemek gerekirse, grafiği bu noktalara mümkün olduğunca yakın geçer. gelenekte Ekonometri elde edilen yaklaşıklık işlevi de denir eşleştirilmiş doğrusal regresyon denklemi .

Ele alınan problem büyük pratik öneme sahiptir. Örneğimizdeki durumda, denklem ne tür bir ciro tahmin etmenizi sağlar ("yig") satış alanının bir veya daha fazla değeriyle mağazada olacak ("x" in şu veya bu anlamı). Evet, ortaya çıkan tahmin yalnızca bir tahmin olacaktır, ancak çoğu durumda oldukça doğru olduğu ortaya çıkacaktır.

"Gerçek" sayılarla sadece bir problemi analiz edeceğim, çünkü içinde hiçbir zorluk yok - tüm hesaplamalar 7-8. sınıflarda okul müfredatı düzeyinde. Vakaların yüzde 95'inde sizden sadece doğrusal bir fonksiyon bulmanız istenecek, ancak makalenin en sonunda optimal hiperbol, üs ve diğer bazı fonksiyonlar için denklemleri bulmanın artık zor olmadığını göstereceğim.

Aslında, vaat edilen güzellikleri dağıtmaya devam ediyor - bu tür örnekleri sadece doğru bir şekilde değil, aynı zamanda hızlı bir şekilde nasıl çözeceğinizi de öğreniyorsunuz. Standardı dikkatlice inceliyoruz:

Bir görev

İki gösterge arasındaki ilişkiyi incelemenin bir sonucu olarak, aşağıdaki sayı çiftleri elde edildi:

En küçük kareler yöntemini kullanarak ampirik sonuca en iyi yaklaşan doğrusal fonksiyonu bulun. (Tecrübeli) veri. Kartezyen dikdörtgen koordinat sisteminde deneysel noktaları ve yaklaşık fonksiyonun grafiğini çizen bir çizim yapın. . Ampirik ve teorik değerler arasındaki sapmaların karelerinin toplamını bulun. İşlevin daha iyi olup olmadığını öğrenin (en küçük kareler yöntemi açısından) yaklaşık deneysel noktalar.

"X" değerlerinin doğal değerler olduğuna ve bunun biraz sonra bahsedeceğim karakteristik anlamlı bir anlamı olduğuna dikkat edin; ama tabii ki kesirli olabilirler. Ayrıca belirli bir görevin içeriğine bağlı olarak hem "X" hem de "G" değerleri tamamen veya kısmen negatif olabilir. Eh, bize “yüzsüz” bir görev verildi ve biz onu başlatıyoruz. çözüm:

Sisteme bir çözüm olarak optimal fonksiyonun katsayılarını buluyoruz:

Daha kompakt bir gösterim amacıyla, toplamanın 1'den .

Gerekli miktarları tablo şeklinde hesaplamak daha uygundur:


Hesaplamalar bir mikro hesap makinesinde yapılabilir, ancak Excel'i kullanmak çok daha iyidir - hem daha hızlı hem de hatasız; kısa bir video izleyin:

Böylece, aşağıdakileri elde ederiz sistem:

Burada ikinci denklemi 3 ile çarpabilir ve 1. denklemden 2. terimi terim terimle çıkar. Ancak bu şanstır - pratikte, sistemler genellikle yetenekli değildir ve bu gibi durumlarda tasarruf sağlar Cramer yöntemi:
, bu nedenle sistemin benzersiz bir çözümü var.

Bir kontrol yapalım. İstemediğimi anlıyorum, ama neden kesinlikle kaçırmayacağınız hataları atlayasınız ki? Bulunan çözümü sistemin her bir denkleminin sol tarafına koyun:

Karşılık gelen denklemlerin doğru kısımları elde edilir, bu da sistemin doğru şekilde çözüldüğü anlamına gelir.

Böylece, istenen yaklaşıklık fonksiyonu: – tüm doğrusal fonksiyonlar deneysel veriler en iyi onun tarafından tahmin edilir.

Farklı dümdüz mağazanın cirosunun alanına bağımlılığı, bulunan bağımlılık tersi ("daha fazla - daha az" ilkesi) ve bu gerçek olumsuz tarafından hemen ortaya çıkar. açısal katsayı. İşlev belirli bir göstergede 1 birimlik bir artışla bağımlı göstergenin değerinin azaldığını bize bildirir. ortalama 0,65 birim ile. Dedikleri gibi, karabuğdayın fiyatı ne kadar yüksekse, o kadar az satılır.

Yaklaştırma fonksiyonunu çizmek için iki değerini buluruz:

ve çizimi yürütün:

Oluşturulan hat denir eğilim çizgisi (yani, doğrusal bir trend çizgisi, yani genel durumda bir trendin mutlaka düz bir çizgi olması gerekmez). "Trend olmak" tabirini herkes bilir ve bence bu terimin fazladan yoruma ihtiyacı yok.

Kare sapmaların toplamını hesaplayın ampirik ve teorik değerler arasında Geometrik olarak, bu "kızıl" bölümlerin uzunluklarının karelerinin toplamıdır. (iki tanesi o kadar küçük ki onları göremiyorsunuz bile).

Hesaplamaları bir tabloda özetleyelim:


Yine manuel olarak yapılabilirler, her ihtimale karşı 1. madde için bir örnek vermem gerekirse:

ancak zaten bilinen yolu yapmak çok daha verimlidir:

Tekrar edelim: sonucun anlamı nedir?İtibaren tüm doğrusal fonksiyonlar işlev üs en küçüğüdür, yani ailesindeki en iyi yaklaşımdır. Ve burada, bu arada, sorunun son sorusu tesadüfi değil: ya önerilen üstel fonksiyon deneysel noktalara daha iyi yaklaşırsa?

Karşılık gelen kare sapmaların toplamını bulalım - onları ayırt etmek için onları "epsilon" harfiyle belirteceğim. Teknik tamamen aynı:

Ve yine 1. nokta için her yangın hesaplaması için:

Excel'de standart işlevi kullanıyoruz tecrübe (Sözdizimi Excel Yardımında bulunabilir).

Çözüm: , bu nedenle üstel fonksiyon deneysel noktalara düz çizgiden daha kötü yaklaşır .

Ancak burada "daha kötü"nün henüz anlamı yok, Yanlış olan ne. Şimdi bu üstel fonksiyonun bir grafiğini oluşturdum - ve aynı zamanda noktalara yakın geçiyor - o kadar ki, analitik bir çalışma olmadan hangi fonksiyonun daha doğru olduğunu söylemek zor.

Bu, çözümü tamamlar ve argümanın doğal değerleri sorusuna geri dönüyorum. Çeşitli çalışmalarda, kural olarak, ekonomik veya sosyolojik, aylar, yıllar veya diğer eşit zaman aralıkları doğal "X" ile numaralandırılır. Örneğin, aşağıdaki sorunu düşünün:

Yılın ilk yarısı için mağazanın perakende cirosu hakkında aşağıdaki verilere sahibiz:

Düz çizgi analitik hizalamayı kullanarak Temmuz ayı satış hacmini bulun.

Evet, sorun değil: 1, 2, 3, 4, 5, 6 aylarını numaralandırıyoruz ve normal algoritmayı kullanıyoruz, bunun sonucunda bir denklem elde ediyoruz - zamanı geldiğinde genellikle “te” harfi ” (kritik olmasa da). Ortaya çıkan denklem, yılın ilk yarısında cironun ortalama 27,74 PB arttığını göstermektedir. her ay. Temmuz için bir tahmin alın (ay #7): AB.

Ve benzer görevler - karanlık karanlıktır. Dileyen ek bir hizmetten yararlanabilir, yani benim Excel hesap makinesi (demo versiyonu), hangisi sorunu neredeyse anında çözer! Programın çalışan versiyonu mevcuttur karşılığında yada ... için sembolik ödeme.

Dersin sonunda, diğer bazı türlerin bağımlılıklarını bulma hakkında kısa bir bilgi. Aslında, temel yaklaşım ve çözüm algoritması aynı kaldığı için söylenecek özel bir şey yok.

Deneysel noktaların konumunun bir hiperbole benzediğini varsayalım. Ardından, en iyi hiperbolün katsayılarını bulmak için, fonksiyonun minimumunu bulmanız gerekir - isteyenler ayrıntılı hesaplamalar yapabilir ve benzer bir sisteme gelebilir:

Resmi bir teknik açıdan, "doğrusal" sistemden elde edilir. (yıldızla işaretleyelim)"x" yerine . Peki, miktarlar hesaplayın, bundan sonra "a" ve "be" optimal katsayılarına elde.

Puanların olduğuna inanmak için her neden varsa logaritmik bir eğri boyunca düzenlenir, daha sonra optimal değerleri aramak ve fonksiyonun minimumunu bulmak için . Resmi olarak, sistemde (*) şu şekilde değiştirilmelidir:

Excel'de hesaplarken, işlevi kullanın LN. Söz konusu vakaların her biri için hesap makineleri oluşturmanın benim için zor olmayacağını itiraf ediyorum, ancak hesaplamaları kendiniz "programlarsanız" yine de daha iyi olacaktır. Yardımcı olacak video eğitimleri.

Üstel bağımlılık ile durum biraz daha karmaşıktır. Konuyu doğrusal duruma indirgemek için fonksiyonun logaritmasını alıyoruz ve kullanıyoruz logaritmanın özellikleri:

Şimdi, elde edilen fonksiyonu lineer fonksiyonla karşılaştırarak, sistemde (*) , ve - ile değiştirilmesi gerektiği sonucuna varıyoruz. Kolaylık sağlamak için şunları belirtiyoruz:

Sistemin ve ile ilgili olarak çözüldüğünü lütfen unutmayın ve bu nedenle kökleri bulduktan sonra katsayının kendisini bulmayı unutmamalısınız.

Deneysel noktalara yaklaşmak için optimal parabol , bulunmalı üç değişkenli bir fonksiyonun minimumu. Standart eylemleri gerçekleştirdikten sonra, aşağıdaki "çalışıyor" ifadesini alıyoruz. sistem:

Evet, elbette, burada daha fazla miktar var, ancak favori uygulamanızı kullanırken hiç zorluk yok. Son olarak, Excel'i kullanarak nasıl hızlı bir şekilde kontrol edeceğinizi ve istediğiniz trend çizgisini nasıl oluşturacağınızı anlatacağım: bir dağılım grafiği oluşturun, fare ile noktalardan herhangi birini seçin ve sağ tıklayın seçeneği seçin "Trend çizgisi ekle". Ardından, grafik türünü seçin ve sekmede "Seçenekler" seçeneği etkinleştir "Denklemi grafikte göster". TAMAM

Her zaman olduğu gibi, makaleyi güzel bir cümle ile bitirmek istiyorum ve neredeyse “Trend ol!” yazdım. Ama zamanla fikrini değiştirdi. Ve formüle edici olduğu için değil. Kimse nasıl olur bilmiyorum ama Amerika ve özellikle Avrupa'nın yükselen trendini hiç takip etmek istemiyorum =) Bu yüzden her birinizin kendi çizginize bağlı kalmasını diliyorum!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

En küçük kareler yöntemi, sahip olduğu özellikler nedeniyle en yaygın ve en gelişmiş yöntemlerden biridir. doğrusal ekonometrik modellerin parametrelerini tahmin etmek için yöntemlerin basitliği ve verimliliği. Aynı zamanda, onu kullanırken biraz dikkatli olunmalıdır, çünkü onu kullanarak oluşturulan modeller parametrelerinin kalitesi için bir takım gereksinimleri karşılamayabilir ve sonuç olarak süreç geliştirme modellerini “iyi” yansıtmayabilir.

En küçük kareler yöntemini kullanarak doğrusal bir ekonometrik modelin parametrelerini tahmin etme prosedürünü daha ayrıntılı olarak ele alalım. Genel formdaki böyle bir model, denklem (1.2) ile temsil edilebilir:

y t = bir 0 + bir 1 x 1t +...+ bir n x nt + ε t .

a 0 , 1 ,..., a n parametrelerini tahmin ederken ilk veriler, bağımlı değişkenin değerlerinin vektörüdür y= (y 1 , y 2 , ... , y T)" ve bağımsız değişkenlerin değerlerinin matrisi

bunlardan oluşan ilk sütun, modelin katsayısına karşılık gelir.

En küçük kareler yöntemi adını, temelde elde edilen parametre tahminlerinin aşağıdakileri karşılaması gerektiği temel ilkesine dayanarak almıştır: model hatasının karelerinin toplamı minimum olmalıdır.

En küçük kareler yöntemiyle problem çözme örnekleri

Örnek 2.1. Ticaret işletmesi, faaliyetleri hakkında bilgiler Tablo'da sunulan 12 mağazadan oluşan bir ağa sahiptir. 2.1.

Şirketin yönetimi, yıllık cironun büyüklüğünün mağazanın perakende alanına nasıl bağlı olduğunu bilmek istiyor.

Tablo 2.1

Mağaza numarası Yıllık ciro, milyon ruble Ticaret alanı, bin m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

En küçük kareler çözümü. Belirleyelim - -inci mağazanın yıllık cirosu, milyon ruble; - inci mağazanın satış alanı, bin m2.

Şekil 2.1. Örnek 2.1 için dağılım grafiği

Değişkenler arasındaki fonksiyonel ilişkinin biçimini belirlemek ve bir dağılım grafiği oluşturmak (Şekil 2.1).

Dağılım diyagramına dayanarak, yıllık cironun satış alanına pozitif olarak bağlı olduğu sonucuna varabiliriz (yani, y'nin büyümesiyle y artacaktır). İşlevsel bağlantının en uygun biçimi, doğrusal.

Daha fazla hesaplama için bilgiler Tablo'da sunulmuştur. 2.2. En küçük kareler yöntemini kullanarak doğrusal tek faktörlü ekonometrik modelin parametrelerini tahmin ediyoruz.

Tablo 2.2

t YT x 1t y t 2 x1t2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Ortalama 68,29 0,89

Böylece,

Bu nedenle, ticaret alanında 1 bin m2'lik bir artışla, diğer şeyler eşit olduğunda, yıllık ortalama ciro 67.8871 milyon ruble artıyor.

Örnek 2.2.İşletmenin yönetimi, yıllık cironun yalnızca mağazanın satış alanına (örnek 2.1'e bakın) değil, aynı zamanda ortalama ziyaretçi sayısına da bağlı olduğunu fark etti. İlgili bilgiler tabloda sunulmaktadır. 2.3.

Tablo 2.3

Çözüm. Belirtin - günde -inci mağazaya ortalama ziyaretçi sayısı, bin kişi.

Değişkenler arasındaki fonksiyonel ilişkinin biçimini belirlemek ve bir dağılım grafiği oluşturmak (Şekil 2.2).

Dağılım diyagramına dayanarak, yıllık cironun günlük ortalama ziyaretçi sayısıyla pozitif ilişkili olduğu sonucuna varabiliriz (yani, y'nin büyümesiyle y artacaktır). Fonksiyonel bağımlılığın formu doğrusaldır.

Pirinç. 2.2. Dağılım grafiği örneğin 2.2

Tablo 2.4

t x 2t x 2t 2 yt x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Ortalama 10,65

Genel olarak iki faktörlü ekonometrik modelin parametrelerinin belirlenmesi gerekmektedir.

y t \u003d 0 + 1 x 1t + 2 x 2t + ε t

Daha fazla hesaplama için gerekli bilgiler Tablo'da sunulmuştur. 2.4.

En küçük kareler yöntemini kullanarak doğrusal iki faktörlü ekonometrik modelin parametrelerini tahmin edelim.

Böylece,

Katsayı = 61.6583'ün değerlendirilmesi, diğer her şey eşit olduğunda, satış alanında 1 bin m2'lik bir artışla, yıllık cironun ortalama 61.6583 milyon ruble artacağını gösteriyor.

Katsayının tahmini = 2.2748, diğer şeylerin eşit olması durumunda, 1 bin kişi başına ortalama ziyaretçi sayısında bir artış olduğunu göstermektedir. günde, yıllık ciro ortalama 2.2748 milyon ruble artacak.

Örnek 2.3. Tabloda sunulan bilgileri kullanma. 2.2 ve 2.4, tek faktörlü ekonometrik modelin parametresini tahmin edin

-th mağazanın yıllık cirosunun merkez değeri nerede, milyon ruble; - t-th mağazasına günlük ortalama ziyaretçi sayısının, bin kişinin merkezli değeri. (bkz. örnekler 2.1-2.2).

Çözüm. Hesaplamalar için gerekli ek bilgiler Tablo'da sunulmuştur. 2.5.

Tablo 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
toplam 48,4344 431,0566

(2.35) formülünü kullanarak, şunu elde ederiz:

Böylece,

http://www.cleverstudents.ru/articles/mnk.html

Örnek.

Değişkenlerin değerlerine ilişkin deneysel veriler X ve de tabloda verilmektedir.

Hizalamalarının bir sonucu olarak, fonksiyon

kullanma en küçük kareler yöntemi, bu verilere doğrusal bir bağımlılıkla yaklaşın y=ax+b(seçenekleri bul a ve b). İki çizgiden hangisinin daha iyi olduğunu bulun (en küçük kareler yöntemi anlamında) deneysel verileri hizalar. Çizim yapmak.

Çözüm.

Örneğimizde n=5. Gerekli katsayıların formüllerinde yer alan tutarların hesaplanmasında kolaylık olması için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, her sayı için 2. satırın değerleri ile 3. satırın değerlerinin çarpılmasıyla elde edilir. i.

Tablonun beşinci satırındaki değerler, her sayı için 2. sıradaki değerlerin karesi alınarak elde edilir. i.

Tablonun son sütununun değerleri, satırlar arasındaki değerlerin toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanırız. a ve b. Tablonun son sütunundaki karşılık gelen değerleri içlerinde değiştiriyoruz:

Sonuç olarak, y=0.165x+2.184 istenen yaklaşık düz çizgidir.

Hangi satırları bulmak için kalır y=0.165x+2.184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahminde bulunur.

Kanıt.

Böylece bulunduğunda a ve b fonksiyon en küçük değeri alır, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. pozitif kesindi. Hadi gösterelim.

İkinci mertebeden diferansiyel şu şekildedir:

Yani

Bu nedenle, ikinci dereceden formun matrisi forma sahiptir.

ve öğelerin değerleri bağlı değildir a ve b.

Matrisin pozitif tanımlı olduğunu gösterelim. Bu, açı minörlerinin pozitif olmasını gerektirir.

Birinci dereceden açısal minör . Eşitsizlik katıdır, çünkü noktalar

  • öğretici

giriiş

Ben bir bilgisayar programcısıyım. Kariyerimdeki en büyük adımı demeyi öğrendiğimde yaptım: "Hiç birşey anlamıyorum!"Şimdi, bilim aydınına bana bir konferans verdiğini, onun, aydının benimle ne hakkında konuştuğunu anlamadığımı söylemekten utanmıyorum. Ve bu çok zor. Evet, bilmediğinizi kabul etmek zor ve utanç verici. Kim bir şeyin temellerini bilmediğini kabul etmekten hoşlanır - orada. Mesleğim gereği çok sayıda sunuma ve konferansa katılmak zorundayım, itiraf etmeliyim ki çoğu durumda hiçbir şey anlamadığım için uykum geliyor. Ve anlamıyorum çünkü bilimdeki mevcut durumun en büyük sorunu matematikte yatıyor. Tüm öğrencilerin kesinlikle matematiğin tüm alanlarına aşina olduğunu varsayar (bu saçmadır). Bir türevin ne olduğunu bilmediğinizi (bunun biraz sonra olduğunu) kabul etmek bir utançtır.

Ama çarpmanın ne olduğunu bilmediğimi söylemeyi öğrendim. Evet, bir Lie cebiri üzerinde bir alt cebirin ne olduğunu bilmiyorum. Evet, hayatta ikinci dereceden denklemlere neden ihtiyaç duyulduğunu bilmiyorum. Bu arada, bildiğinizden eminseniz konuşacak bir şeyimiz var! Matematik bir dizi hiledir. Matematikçiler halkın kafasını karıştırmaya ve korkutmaya çalışırlar; kafa karışıklığının, itibarın, otoritenin olmadığı yerde. Evet, mümkün olan en soyut dilde konuşmak prestijdir, ki bu başlı başına saçmalıktır.

Bir türevin ne olduğunu biliyor musun? Büyük olasılıkla bana fark ilişkisinin sınırını anlatacaksınız. St. Petersburg Devlet Üniversitesi'ndeki matematiğin ilk yılında, Viktor Petrovich Khavin me tanımlanmış Taylor serisinin birinci terim noktasındaki fonksiyonun katsayısı olarak türev (Taylor serisini türevsiz belirlemek ayrı bir cimnastik oldu). Sonunda ne hakkında olduğunu anlayana kadar bu tanıma uzun süre güldüm. Türev, türevini aldığımız fonksiyonun y=x, y=x^2, y=x^3 fonksiyonuna ne kadar benzediğinin bir ölçüsünden başka bir şey değildir.

Artık öğrencilere ders verme onuruna sahibim. korku matematik. Matematikten korkuyorsanız - yoldayız. Bir metni okumaya çalıştığınızda ve size bunun aşırı karmaşık olduğunu düşündüğünüzde, kötü yazılmış olduğunu bilin. Doğruluğunu kaybetmeden "parmaklarda" konuşulamayacak tek bir matematik alanı olmadığını savunuyorum.

Yakın geleceğin zorluğu: Öğrencilerime doğrusal-kuadratik denetleyicinin ne olduğunu anlamalarını söyledim. Utanmayın, hayatınızın üç dakikasını boşa harcayın, bağlantıyı takip edin. Hiçbir şey anlamadıysanız, o zaman yoldayız. Ben (profesyonel bir matematikçi-programcı) da hiçbir şey anlamadım. Ve sizi temin ederim, bu "parmaklarda" çözülebilir. Şu anda ne olduğunu bilmiyorum ama sizi temin ederim ki biz bunu çözebiliriz.

Bu yüzden, öğrencilerime, lineer-kuadratik bir denetleyicinin hayatınızda asla ustalaşamayacağınız korkunç bir böcek olduğu sözleriyle korku içinde bana geldikten sonra vereceğim ilk ders, en küçük kareler yöntemleri. Lineer denklemleri çözebilir misiniz? Bu metni okuyorsanız, büyük olasılıkla değil.

Dolayısıyla, (x0, y0), (x1, y1), örneğin (1,1) ve (3,2) gibi iki nokta verildiğinde, görev bu iki noktadan geçen düz bir çizginin denklemini bulmaktır:

illüstrasyon

Bu düz çizgi aşağıdaki gibi bir denkleme sahip olmalıdır:

Burada alfa ve beta bizim için bilinmiyor, ancak bu çizginin iki noktası biliniyor:

Bu denklemi matris formunda yazabilirsiniz:

Burada lirik bir arasöz yapmalıyız: matris nedir? Bir matris, iki boyutlu bir diziden başka bir şey değildir. Bu, verileri saklamanın bir yoludur, ona daha fazla değer verilmemelidir. Belirli bir matrisi tam olarak nasıl yorumlayacağımız bize bağlıdır. Periyodik olarak, onu lineer bir haritalama, periyodik olarak ikinci dereceden bir form ve bazen de sadece bir vektör seti olarak yorumlayacağım. Bunların hepsi bağlam içinde açıklığa kavuşturulacaktır.

Belirli matrisleri sembolik temsilleriyle değiştirelim:

Sonra (alfa, beta) kolayca bulunabilir:

Daha spesifik olarak önceki verilerimiz için:

Bu, (1,1) ve (3,2) noktalarından geçen düz bir çizginin aşağıdaki denklemine yol açar:

Tamam, burada her şey açık. Ve içinden geçen bir doğrunun denklemini bulalım. üç noktalar: (x0,y0), (x1,y1) ve (x2,y2):

Oh-oh-oh, ama iki bilinmeyen için üç denklemimiz var! Standart matematikçi çözüm olmadığını söyleyecektir. Programcı ne diyecek? Ve önce önceki denklem sistemini aşağıdaki biçimde yeniden yazacaktır:

Bizim durumumuzda, i, j, b vektörleri üç boyutludur, bu nedenle (genel durumda) bu sistemin bir çözümü yoktur. Herhangi bir vektör (alpha\*i + beta\*j), vektörler (i, j) tarafından yayılan düzlemde bulunur. Eğer b bu düzleme ait değilse çözüm yoktur (denklemde eşitlik sağlanamaz). Ne yapalım? Bir uzlaşma arayalım. ile belirtelim e(alfa, beta) tam olarak nasıl eşitliği sağlayamadık:

Ve bu hatayı en aza indirmeye çalışacağız:

Neden bir kare?

Sadece normun minimumunu değil, normun karesinin minimumunu da arıyoruz. Neden? Niye? Minimum noktanın kendisi çakışır ve kare düzgün bir işlev (argümanların (alfa,beta) ikinci dereceden bir işlevi) verirken, yalnızca uzunluk minimum noktada türevlenemeyen bir koni biçiminde bir işlev verir. Br. Kare daha uygun.

Açıkçası, vektör olduğunda hata en aza indirilir. e vektörler tarafından yayılan düzleme dik i ve j.

illüstrasyon

Başka bir deyişle, tüm noktalardan bu doğruya olan uzaklıkların karelerinin toplamı minimum olacak şekilde bir doğru arıyoruz:

GÜNCELLEME: burada bir pervazım var, çizgiye olan mesafe ortografik projeksiyon değil dikey olarak ölçülmelidir. Bu yorumcu haklı.

illüstrasyon

Tamamen farklı kelimelerle (dikkatlice, kötü biçimlendirilmiş, ancak parmaklarda net olmalıdır): tüm nokta çiftleri arasındaki olası tüm çizgileri alır ve tümü arasındaki ortalama çizgiyi ararız:

illüstrasyon

Parmaklarla ilgili başka bir açıklama: tüm veri noktaları (burada üç tane var) ile aradığımız çizgi arasına bir yay ekliyoruz ve denge durumunun çizgisi tam olarak aradığımız şey.

İkinci dereceden form minimum

Yani, verilen vektör b ve matrisin sütun-vektörlerinin kapsadığı düzlem A(bu durumda (x0,x1,x2) ve (1,1,1)), bir vektör arıyoruz e minimum kare uzunluk ile. Açıkçası, minimum sadece vektör için ulaşılabilir e, matrisin sütun-vektörlerinin kapsadığı düzleme dik A:

Başka bir deyişle, x=(alpha, beta) vektörünü şu şekilde arıyoruz:

Bu x=(alpha, beta) vektörünün ikinci dereceden ||e(alpha, beta)||^2 fonksiyonunun minimumu olduğunu hatırlatırım:

Burada matrisin ikinci dereceden formun yanı sıra yorumlanabileceğini hatırlamakta fayda var, örneğin, birim matrisi ((1,0),(0,1)) x^2 + y'nin bir fonksiyonu olarak yorumlanabilir. ^2:

ikinci dereceden biçim

Bütün bu jimnastik lineer regresyon olarak bilinir.

Dirichlet sınır koşulu ile Laplace denklemi

Şimdi en basit gerçek sorun: belirli bir üçgen yüzey var, onu düzeltmek gerekiyor. Örneğin, yüz modelimi yükleyelim:

Orijinal taahhüt mevcuttur. Dış bağımlılıkları en aza indirmek için, zaten Habré'de bulunan yazılım oluşturucumun kodunu aldım. Lineer sistemi çözmek için OpenNL kullanıyorum, harika bir çözücü ama kurulumu çok zor: proje klasörünüze iki dosya (.h + .c) kopyalamanız gerekiyor. Tüm yumuşatma aşağıdaki kodla yapılır:

(int d=0; d için<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&face = yüzler[i]; for (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y ve Z koordinatları ayrılabilir, ayrı ayrı düzeltiyorum. Yani, her biri modelimdeki köşe sayısıyla aynı sayıda değişkene sahip üç lineer denklem sistemi çözüyorum. A matrisinin ilk n satırı, satır başına yalnızca bir 1'e sahiptir ve b vektörünün ilk n satırı orijinal model koordinatlarına sahiptir. Yani, yeni köşe konumu ile eski köşe konumu arasında yaylı bağlantı yapıyorum - yeniler eskilerinden çok uzakta olmamalıdır.

A matrisinin müteakip tüm satırları (faces.size()*3 = ızgaradaki tüm üçgenlerin kenar sayısı) bir oluşum 1'e ve bir oluşum -1'e sahipken, b vektörünün karşısında sıfır bileşene sahiptir. Bu, üçgen ağımızın her bir kenarına bir yay koyduğum anlamına gelir: tüm kenarlar, başlangıç ​​ve bitiş noktalarıyla aynı tepe noktasını elde etmeye çalışır.

Bir kez daha: tüm köşeler değişkendir ve orijinal konumlarından çok fazla sapamazlar, ancak aynı zamanda birbirine benzemeye çalışırlar.

İşte sonuç:

Her şey güzel olurdu, model gerçekten yumuşatılmış, ancak orijinal kenarından uzaklaştı. Kodu biraz değiştirelim:

(int i=0; i için<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

A matrisimizde, kenardaki köşeler için v_i = verts[i][d] kategorisinden bir satır değil, 1000*v_i = 1000*verts[i][d] kategorisinden bir satır ekliyorum. Neyi değiştirir? Bu da hatanın ikinci dereceden biçimini değiştirir. Şimdi kenardaki tepeden tek bir sapma, eskisi gibi bir birime değil, 1000 * 1000 birime mal olacak. Yani, aşırı köşelere daha güçlü bir yay astık, çözüm diğerlerini daha güçlü bir şekilde germeyi tercih ediyor. İşte sonuç:

Köşeler arasındaki yayların gücünü ikiye katlayalım:
nlKatsayı(yüz[ j ], 2); nlKatsayı(yüz[(j+1)%3], -2);

Yüzeyin daha pürüzsüz hale gelmesi mantıklı:

Ve şimdi yüz kat daha güçlü:

Bu nedir? Bir tel halkayı sabunlu suya batırdığımızı hayal edin. Sonuç olarak, elde edilen sabun filmi, aynı sınıra - tel halkamıza - dokunarak mümkün olduğunca az eğriliğe sahip olmaya çalışacaktır. Kenarı düzeltip içeride pürüzsüz bir yüzey isteyerek elde ettiğimiz şey tam olarak bu. Tebrikler, Laplace denklemini Dirichlet sınır koşullarıyla çözdük. Kulağa hoş geliyor mu? Ama aslında, çözülmesi gereken tek bir lineer denklem sistemi.

Poisson denklemi

Başka bir güzel isim bulalım.

Diyelim ki şöyle bir resmim var:

Herkes iyi ama ben sandalyeyi sevmiyorum.

Resmi ikiye böldüm:



Ve ellerimle bir sandalye seçeceğim:

Sonra maskede beyaz olan her şeyi resmin sol tarafına sürükleyeceğim ve aynı zamanda tüm resim boyunca iki komşu piksel arasındaki farkın, iki komşu piksel arasındaki farka eşit olması gerektiğini söyleyeceğim. sağ resim:

(int i=0; i için

İşte sonuç:

Kod ve resimler mevcuttur

En küçük kareler yöntemi (OLS, eng. Sıradan En Küçük Kareler, OLS)- bazı fonksiyonların istenen değişkenlerden sapmalarının karelerinin toplamını en aza indirmeye dayalı, çeşitli problemleri çözmek için kullanılan matematiksel bir yöntem. Aşırı belirlenmiş denklem sistemlerini "çözmek" için (denklem sayısı bilinmeyenlerin sayısını aştığında), sıradan (aşırı belirlenmemiş) doğrusal olmayan denklem sistemleri durumunda bir çözüm bulmak, nokta değerlerine yaklaşmak için kullanılabilir. bazı işlevlerden. OLS, örnek verilerden regresyon modellerinin bilinmeyen parametrelerini tahmin etmek için temel regresyon analizi yöntemlerinden biridir.

Ansiklopedik YouTube

    1 / 5

    ✪ En küçük kareler yöntemi. Başlık

    ✪ Mitin I. V. - Fiziksel sonuçların işlenmesi. deney - En küçük kareler yöntemi (Ders 4)

    ✪ En küçük kareler, ders 1/2. Doğrusal fonksiyon

    ✪ Ekonometri. Ders 5. En küçük kareler yöntemi

    ✪ En küçük kareler yöntemi. Yanıtlar

    Altyazılar

Hikaye

XIX yüzyılın başına kadar. bilim adamlarının bilinmeyenlerin sayısının denklem sayısından az olduğu bir denklem sistemini çözmek için belirli kuralları yoktu; O zamana kadar, denklemlerin türüne ve hesap makinelerinin yaratıcılığına bağlı olarak belirli yöntemler kullanılıyordu ve bu nedenle, aynı gözlemsel verilerden başlayarak farklı hesaplayıcılar farklı sonuçlara vardı. Gauss (1795), yöntemin ilk uygulamasıyla tanınır ve Legendre (1805) bağımsız olarak onu modern adı altında keşfetti ve yayınladı (fr. Methode des moindres kavgaları) . Laplace, yöntemi olasılıklar teorisiyle ilişkilendirdi ve Amerikalı matematikçi Adrain (1808) onun olasılıksal uygulamalarını değerlendirdi. Yöntem, Encke, Bessel, Hansen ve diğerleri tarafından daha fazla araştırma yapılarak yaygınlaştırılmış ve geliştirilmiştir.

En küçük kareler yönteminin özü

İzin vermek x (\görüntüleme stili x)- takım n (\görüntüleme stili n) bilinmeyen değişkenler (parametreler), f ben (x) (\displaystyle f_(i)(x)), , m > n (\displaystyle m>n)- bu değişkenler kümesinden bir dizi fonksiyon. Sorun, bu tür değerleri seçmektir. x (\görüntüleme stili x) böylece bu fonksiyonların değerleri bazı değerlere mümkün olduğunca yakın olur y ben (\displaystyle y_(i)). Özünde, aşırı belirlenmiş denklem sisteminin “çözümünden” bahsediyoruz. f ben (x) = y ben (\displaystyle f_(i)(x)=y_(i)), i = 1 , … , m (\displaystyle i=1,\ldots ,m) belirtilen anlamda, sistemin sol ve sağ bölümlerinin maksimum yakınlığı. LSM'nin özü, sol ve sağ parçaların kare sapmalarının toplamını "yakınlık ölçüsü" olarak seçmektir. | f ben (x) - y ben | (\displaystyle |f_(i)(x)-y_(i)|). Böylece, LSM'nin özü aşağıdaki gibi ifade edilebilir:

∑ ben e ben 2 = ∑ ben (y ben − f ben (x)) 2 → min x (\displaystyle \sum _(i)e_(i)^(2)=\sum _(i)(y_(i)-f_( i)(x))^(2)\sağ ok \dak _(x)).

Denklem sisteminin bir çözümü varsa, o zaman minimum kareler toplamı sıfıra eşit olacaktır ve denklem sisteminin kesin çözümleri analitik olarak veya örneğin çeşitli sayısal optimizasyon yöntemleriyle bulunabilir. Sistem üstbelirlenmişse, yani genel olarak konuşursak, bağımsız denklemlerin sayısı bilinmeyen değişkenlerin sayısından fazlaysa, sistemin kesin bir çözümü yoktur ve en küçük kareler yöntemi bazı "optimal" vektörleri bulmamıza izin verir. x (\görüntüleme stili x) vektörlerin maksimum yakınlığı anlamında y (\görüntüleme stili y) ve f (x) (\displaystyle f(x)) veya sapma vektörünün maksimum yakınlığı e (\görüntüleme stili e) sıfıra (yakınlık Öklid mesafesi anlamında anlaşılır).

Örnek - lineer denklem sistemi

Özellikle, en küçük kareler yöntemi, doğrusal denklem sistemini "çözmek" için kullanılabilir.

A x = b (\displaystyle Ax=b),

nerede A (\görüntüleme stili A) dikdörtgen boyutlu matris m × n , m > n (\displaystyle m\times n,m>n)(yani, A matrisinin satır sayısı, gerekli değişkenlerin sayısından fazladır).

Böyle bir denklem sisteminin genellikle çözümü yoktur. Bu nedenle, bu sistem ancak böyle bir vektörün seçilmesi anlamında "çözülebilir". x (\görüntüleme stili x) vektörler arasındaki "mesafeyi" en aza indirmek için A x (\displaystyle Balta) ve b (\görüntüleme stili b). Bunu yapmak için, sistemin denklemlerinin sol ve sağ kısımlarının kare farklarının toplamını en aza indirme kriterini uygulayabilirsiniz, yani (A x − b) T (A x − b) → min (\displaystyle (Ax-b)^(T)(Ax-b)\rightarrow \min ). Bu minimizasyon probleminin çözümünün aşağıdaki denklem sisteminin çözümüne yol açtığını göstermek kolaydır.

A T A x = A T b ⇒ x = (A T A) − 1 A T b (\displaystyle A^(T)Ax=A^(T)b\Rightarrow x=(A^(T)A)^(-1)A^ (T)b).

Regresyon analizinde OLS (veri yaklaşımı)

Olsun n (\görüntüleme stili n) bazı değişkenlerin değerleri y (\görüntüleme stili y)(bu, gözlemlerin, deneylerin vb. sonuçları olabilir) ve ilgili değişkenler x (\görüntüleme stili x). Buradaki zorluk, aralarındaki ilişkiyi kurmaktır. y (\görüntüleme stili y) ve x (\görüntüleme stili x) bazı bilinmeyen parametrelere kadar bilinen bazı fonksiyonlarla yaklaşık b (\görüntüleme stili b), yani aslında parametrelerin en iyi değerlerini bulun b (\görüntüleme stili b), maksimum değerlere yaklaşma f (x , b) (\displaystyle f(x,b)) gerçek değerlere y (\görüntüleme stili y). Aslında bu, bir üstbelirlenmiş denklem sisteminin "çözüm" durumuna indirgenir. b (\görüntüleme stili b):

F (x t , b) = y t , t = 1 , … , n (\displaystyle f(x_(t),b)=y_(t),t=1,\ldots ,n).

Regresyon analizinde ve özellikle ekonometride, değişkenler arasındaki ilişkinin olasılıksal modelleri kullanılır.

Y t = f (x t , b) + ε t (\displaystyle y_(t)=f(x_(t),b)+\varepsilon _(t)),

nerede ε t (\displaystyle \varepsilon _(t))- Lafta rastgele hatalar modeller.

Buna göre, gözlenen değerlerin sapmaları y (\görüntüleme stili y) modelden f (x , b) (\displaystyle f(x,b)) zaten modelin kendisinde varsayılmıştır. LSM'nin (sıradan, klasik) özü bu tür parametreleri bulmaktır. b (\görüntüleme stili b), kare sapmaların toplamı (hatalar, regresyon modelleri için genellikle regresyon artıkları olarak adlandırılırlar) e t (\displaystyle e_(t)) minimum olacaktır:

b ^ O L S = arg ⁡ min b R S S (b) (\displaystyle (\hat (b))_(OLS)=\arg \min _(b)RSS(b)),

nerede R S S (\displaystyle RSS)- İngilizce. Artık Kareler Toplamı şu şekilde tanımlanır:

R S S (b) = e T e = ∑ t = 1 n e t 2 = ∑ t = 1 n (y t − f (x t , b)) 2 (\displaystyle RSS(b)=e^(T)e=\sum _ (t=1)^(n)e_(t)^(2)=\toplam _(t=1)^(n)(y_(t)-f(x_(t),b))^(2) ).

Genel durumda, bu problem sayısal optimizasyon yöntemleri (minimizasyon) ile çözülebilir. Bu durumda biri bahseder doğrusal olmayan en küçük kareler(NLS veya NLLS - eng. Doğrusal Olmayan En Küçük Kareler). Çoğu durumda, analitik bir çözüm elde edilebilir. Minimizasyon problemini çözmek için fonksiyonun durağan noktalarını bulmak gerekir. R S S (b) (\displaystyle RSS(b)) bilinmeyen parametrelere göre farklılaştırarak b (\görüntüleme stili b), türevleri sıfıra eşitleyerek ve elde edilen denklem sistemini çözerek:

∑ t = 1 n (y t − f (x t , b)) ∂ f (x t , b) ∂ b = 0 (\displaystyle \sum _(t=1)^(n)(y_(t)-f(x_) (t),b))(\frac (\kısmi f(x_(t),b))(\kısmi b))=0).

Doğrusal  regresyon durumunda LSM

Regresyon bağımlılığının doğrusal olmasına izin verin:

y t = ∑ j = 1 k b j x t j + ε = x t T b + ε t (\displaystyle y_(t)=\sum _(j=1)^(k)b_(j)x_(tj)+\varepsilon =x_( t)^(T)b+\varepsilon _(t)).

İzin vermek y açıklanan değişkenin gözlemlerinin sütun vektörüdür ve X (\görüntüleme stili X)- bu (n × k) (\displaystyle ((n\times k)))- faktörlerin gözlemlerinin matrisi (matrisin satırları - bu gözlemdeki faktörlerin değerlerinin vektörleri, sütunlarla - tüm gözlemlerde bu faktörün değerlerinin vektörü). Lineer modelin matris temsili şu şekildedir:

y = Xb + ε (\displaystyle y=Xb+\varepsilon ).

Daha sonra açıklanan değişkenin tahmin vektörü ve regresyon artıklarının vektörü eşit olacaktır.

y ^ = X b , e = y − y ^ = y − X b (\displaystyle (\hat (y))=Xb,\quad e=y-(\hat (y))=y-Xb).

buna göre, regresyon artıklarının karelerinin toplamı şuna eşit olacaktır:

R S S = e T e = (y − X b) T (y − X b) (\displaystyle RSS=e^(T)e=(y-Xb)^(T)(y-Xb)).

Bu fonksiyonu parametre vektörüne göre ayırt etme b (\görüntüleme stili b) ve türevleri sıfıra eşitleyerek bir denklem sistemi elde ederiz (matris formunda):

(X T X) b = X T y (\displaystyle (X^(T)X)b=X^(T)y).

Şifresi çözülmüş matris formunda, bu denklem sistemi şöyle görünür:

(∑ x t 1 2 ∑ x t 1 x t 2 ∑ x t 1 x t 3 … ∑ x t 1 x t k ∑ x t 2 x t 1 ∑ x t 2 2 ∑ x t 2 x t 3 … ∑ x t 2 x t k ∑ x t 3 x t 1 ∑ 2 … t x t 3 ∑ x t 3 x t k ⋮ ⋮ ⋮ ⋱ ⋮ ∑ x t k x t 1 ∑ x t k x t 2 ∑ x t k x t 3 … ∑ x t k 2) (b 1 b 2 b 3 ⋮ b k) = (∑ x t 1 y x t ∑ 3 ∑y x t ⋮ tarzı) (\begin(pmatrix)\toplam x_(t1)^(2)&\toplam x_(t1)x_(t2)&\toplam x_(t1)x_(t3)&\ldots &\toplam x_(t1)x_( tk)\\\toplam x_(t2)x_(t1)&\toplam x_(t2)^(2)&\toplam x_(t2)x_(t3)&\ldots &\ toplam x_(t2)x_(tk) \\\toplam x_(t3)x_(t1)&\toplam x_(t3)x_(t2)&\toplam x_(t3)^(2)&\ldots &\toplam x_ (t3)x_(tk)\\ \vdots &\vdots &\vdots &\ddots &\vdots \\\sum x_(tk)x_(t1)&\sum x_(tk)x_(t2)&\sum x_ (tk)x_(t3)&\ ldots &\sum x_(tk)^(2)\\\end(pmatrix))(\begin(pmatrix)b_(1)\\b_(2)\\b_(3 )\\\vdots \\b_( k)\\\end(pmatrix))=(\begin(pmatrix)\toplam x_(t1)y_(t)\\\toplam x_(t2)y_(t)\\ \toplam x_(t3)y_(t) )\\\vnoktalar \\\sum x_(tk)y_(t)\\\end(pmatrix))) tüm meblağların tüm kabul edilebilir değerler üzerinden alındığı yer t (\görüntüleme stili t).

Modele bir sabit dahil edilirse (her zamanki gibi), o zaman x t 1 = 1 (\displaystyle x_(t1)=1) hepsi için t (\görüntüleme stili t), bu nedenle, denklem sisteminin matrisinin sol üst köşesinde gözlem sayısıdır. n (\görüntüleme stili n), ve ilk satırın ve ilk sütunun kalan öğelerinde - sadece değişkenlerin değerlerinin toplamı: ∑ x t j (\displaystyle \sum x_(tj)) ve sistemin sağ tarafındaki ilk eleman - ∑ y t (\displaystyle \sum y_(t)).

Bu denklem sisteminin çözümü, lineer model için en küçük kareler tahminleri için genel formülü verir:

b ^ O L S = (X T X) − 1 X T y = (1 n X T X) − 1 1 n X T y = V x − 1 C x y (\displaystyle (\hat (b))_(OLS)=(X^(T) )X)^(-1)X^(T)y=\sol((\frac (1)(n))X^(T)X\sağ)^(-1)(\frac (1)(n) ))X^(T)y=V_(x)^(-1)C_(xy)).

Analitik amaçlar için, bu formülün son temsilinin yararlı olduğu ortaya çıkıyor (denklem sisteminde n'ye bölündüğünde, toplamlar yerine aritmetik araçlar ortaya çıkıyor). Regresyon modelindeki veriler ise merkezli, daha sonra bu gösterimde birinci matris, faktörlerin örnek kovaryans matrisi anlamına gelir ve ikincisi, bağımlı değişkenli faktörlerin kovaryanslarının vektörüdür. Ek olarak, veriler aynı zamanda normalleştirilmiş SKO'da (yani, nihayetinde standartlaştırılmış), o zaman ilk matris, faktörlerin örnek korelasyon matrisi anlamına gelir, ikinci vektör - faktörlerin bağımlı değişkenle örnek korelasyonlarının vektörü.

Modeller için LLS tahminlerinin önemli bir özelliği sabit ile- oluşturulan regresyon çizgisi, örnek verilerin ağırlık merkezinden geçer, yani eşitlik sağlanır:

y ¯ = b 1 ^ + ∑ j = 2 k b ^ j x ¯ j (\displaystyle (\bar (y))=(\hat (b_(1)))+\sum _(j=2)^(k) (\hat (b))_(j)(\bar (x))_(j)).

Özellikle, uç durumda, tek regresör sabit olduğunda, tek bir parametrenin (sabitin kendisi) OLS tahmininin açıklanan değişkenin ortalama değerine eşit olduğunu buluruz. Yani, büyük sayılar yasalarından iyi özellikleriyle bilinen aritmetik ortalama aynı zamanda bir en küçük kareler tahminidir - ondan sapmaların minimum kareleri toplamı için kriteri karşılar.

En basit özel durumlar

İkili doğrusal regresyon durumunda y t = a + b x t + ε t (\displaystyle y_(t)=a+bx_(t)+\varepsilon _(t)), bir değişkenin diğerine doğrusal bağımlılığı tahmin edildiğinde, hesaplama formülleri basitleştirilir (matris cebiri olmadan yapabilirsiniz). Denklem sistemi şu şekildedir:

(1 x ¯ x ¯ x 2 ¯) (a b) = (y ¯ x y ¯) (\displaystyle (\begin(pmatrix)1&(\bar (x))\\(\bar (x))&(\bar) (x^(2)))\\\end(pmatrix))(\begin(pmatrix)a\\b\\\end(pmatrix))=(\begin(pmatrix)(\bar (y))\\ (\overline(xy))\\\end(pmatrix))).

Buradan katsayılar için tahminler bulmak kolaydır:

( b ^ = Cov ⁡ (x , y) Var ⁡ (x) = x y ¯ − x ¯ y ¯ x 2 ¯ − x ¯ 2 , a ^ = y ¯ − b x ¯ . (\displaystyle (\begin(cases) (\hat (b))=(\frac (\mathop (\textrm (Cov)) (x,y))(\mathop (\textrm (Var)) (x)))=(\frac ((\overline) (xy))-(\bar (x))(\bar (y)))((\overline (x^(2)))-(\overline (x))^(2)),\\( \hat (a))=(\bar (y))-b(\bar (x))).\end(durumlar)))

Genel olarak sabitli modeller tercih edilmesine rağmen, bazı durumlarda teorik değerlendirmelerden sabitin olduğu bilinmektedir. a (\görüntüleme stili a) sıfıra eşit olmalıdır. Örneğin, fizikte voltaj ve akım arasındaki ilişki şu şekildedir: U = I ⋅ R (\displaystyle U=I\cdot R); gerilim ve akımı ölçmek için direnci tahmin etmek gerekir. Bu durumda, bir modelden bahsediyoruz y = b x (\displaystyle y=bx). Bu durumda, bir denklem sistemi yerine tek bir denklemimiz olur.

(∑ x t 2) b = ∑ x t y t (\displaystyle \left(\toplam x_(t)^(2)\sağ)b=\toplam x_(t)y_(t)).

Bu nedenle, tek bir katsayıyı tahmin etme formülü şu şekildedir:

B ^ = ∑ t = 1 n x t y t ∑ t = 1 n x t 2 = x y ¯ x 2 ¯ (\displaystyle (\hat (b))=(\frac (\sum _(t=1)^(n)x_(t) )y_(t))(\sum _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))).

Bir polinom modelinin durumu

Veriler, bir değişkenin polinom regresyon fonksiyonu ile donatılmışsa f (x) = b 0 + ∑ ben = 1 k b ben x ben (\displaystyle f(x)=b_(0)+\sum \limits _(i=1)^(k)b_(i)x^(i)), o zaman, dereceleri algılamak x ben (\displaystyle x^(i)) her biri için bağımsız faktörler olarak ben (\displaystyle i) doğrusal modelin parametrelerini tahmin etmek için genel formüle dayalı olarak modelin parametrelerini tahmin etmek mümkündür. Bunu yapmak için, genel formülde böyle bir yorumun dikkate alınması yeterlidir. x t ben x t j = x t ben x t j = x t ben + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j)) ve x t j y t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). Bu nedenle, bu durumda matris denklemleri şu şekilde olacaktır:

(n ∑ n x t ... ∑ n x t k ∑ n x t ∑ n x ben 2 ... ∑ m x ben k + 1 ⋮ ⋱ ⋮ ∑ ∑ n x t k ∑ n x t k + 1 ... ∑ n x t 2 k) [b 0 b 1 ⋮ b k] n y t ∑ nx t y t ⋮ nx t k y t k y t ] . (\displaystyle (\begin(pmatrix)n&\sum \limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\sum \limits _( n)x_(t)&\sum \limits _(n)x_(i)^(2)&\ldots &\sum \limits _(m)x_(i)^(k+1)\\\vdots & \vdots &\ddots &\vdots \\\sum \limits _(n)x_(t)^(k)&\sum \limits _(n)x_(t)^(k+1)&\ldots &\ toplam \limits _(n)x_(t)^(2k)\end(pmatrix))(\begin(bmatrix)b_(0)\\b_(1)\\\vdots \\b_(k)\end( bmatrix))=(\begin(bmatrix)\sum \limits _(n)y_(t)\\\sum \limits _(n)x_(t)y_(t)\\\vdots \\\sum \limits _(n)x_(t)^(k)y_(t)\end(bmatris)))

OLS Tahminlerinin İstatistiksel Özellikleri

Her şeyden önce, lineer modeller için en küçük kareler tahminlerinin, yukarıdaki formülden aşağıdaki gibi lineer tahminler olduğunu not ediyoruz. En küçük kareler tahminlerinin yansızlığı için, regresyon analizinin en önemli koşulunu yerine getirmek gerekli ve yeterlidir: Faktörlere bağlı rastgele bir hatanın matematiksel beklentisi sıfıra eşit olmalıdır. Bu koşul, özellikle aşağıdaki durumlarda sağlanır:

  1. rastgele hataların matematiksel beklentisi sıfırdır ve
  2. faktörler ve rastgele hatalar bağımsız (rastgele) değerlerdir.

İkinci koşul - dışsal faktörlerin koşulu - temeldir. Bu özellik sağlanmazsa, hemen hemen tüm tahminlerin son derece yetersiz olacağını varsayabiliriz: tutarlı bile olmayacaklar (yani, çok büyük miktarda veri bile bu durumda nitel tahminler elde etmeye izin vermiyor). Klasik durumda, otomatik olarak dışsal koşulun karşılandığı anlamına gelen rastgele bir hatanın aksine, faktörlerin determinizmi hakkında daha güçlü bir varsayım yapılır. Genel durumda, tahminlerin tutarlılığı için matrisin yakınsaklığı ile birlikte dışsallık koşulunun sağlanması yeterlidir. V x (\görüntüleme stili V_(x))örnek boyutu sonsuza kadar arttıkça bazı dejenere olmayan matrislere dönüştürülür.

Tutarlılık ve yansızlığa ek olarak, (sıradan) en küçük kareler tahminlerinin de etkili olması için (doğrusal yansız tahminler sınıfının en iyisi), rastgele bir hatanın ek özelliklerinin karşılanması gerekir:

Bu varsayımlar, rastgele hata vektörünün kovaryans  matrisi için formüle edilebilir. V (ε) = σ 2 I (\displaystyle V(\varepsilon)=\sigma ^(2)I).

Bu koşulları sağlayan doğrusal bir modele denir. klasik. Klasik lineer regresyon için OLS tahminleri, tüm lineer yansız tahminler sınıfındaki yansız, tutarlı ve en verimli tahminlerdir (İngilizce literatürde bazen kısaltma kullanılır mavi (En İyi Doğrusal Yansız Tahmin Edici) en iyi doğrusal yansız tahmindir; yerli literatürde, Gauss - Markov teoremi daha sık alıntılanır). Gösterilmesi kolay olduğu gibi, katsayı tahmin vektörünün kovaryans matrisi şuna eşit olacaktır:

V (b ^ O L S) = σ 2 (X T X) − 1 (\displaystyle V((\hat (b))_(OLS))=\sigma ^(2)(X^(T)X)^(-1 )).

Verimlilik, bu kovaryans matrisinin "minimal" olduğu anlamına gelir (katsayıların herhangi bir doğrusal kombinasyonu ve özellikle katsayıların kendileri minimum varyansa sahiptir), yani doğrusal tarafsız tahminler sınıfında OLS tahminleri en iyisidir. Bu matrisin köşegen elemanları - katsayı tahminlerinin varyansları - elde edilen tahminlerin kalitesinin önemli parametreleridir. Ancak, rastgele hata varyansı bilinmediğinden kovaryans matrisini hesaplamak mümkün değildir. Rastgele hataların varyansının tarafsız ve tutarlı (klasik doğrusal model için) tahmininin şu değer olduğu kanıtlanabilir:

S 2 = R S S / (n − k) (\displaystyle s^(2)=RSS/(n-k)).

Bu değeri kovaryans matrisi formülünde yerine koyarak, kovaryans matrisinin bir tahminini elde ederiz. Ortaya çıkan tahminler de tarafsız ve tutarlıdır. Hata varyansı tahmininin (ve dolayısıyla katsayıların varyanslarının) ve model parametrelerinin tahminlerinin, model katsayıları hakkındaki hipotezleri test etmek için test istatistiklerini elde etmeyi mümkün kılan bağımsız rastgele değişkenler olması da önemlidir.

Klasik varsayımlar karşılanmazsa, en küçük kareler parametre tahminlerinin en verimli olmadığı ve nerede W (\görüntüleme stili W) simetrik pozitif belirli bir ağırlık matrisidir. Sıradan en küçük kareler, ağırlık matrisi birim matrisiyle orantılı olduğunda bu yaklaşımın özel bir durumudur. Bilindiği gibi simetrik matrisler (veya operatörler) için bir ayrıştırma vardır. W = P T P (\displaystyle W=P^(T)P). Bu nedenle, bu fonksiyonel aşağıdaki gibi temsil edilebilir. e T P T P e = (P e) T P e = e ∗ T e ∗ (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)), yani bu işlevsel, dönüştürülmüş bazı "artıkların" karelerinin toplamı olarak temsil edilebilir. Böylece, en küçük kareler yöntemlerinin bir sınıfını ayırt edebiliriz - LS yöntemleri (En Küçük Kareler).

(Aitken teoremi) genelleştirilmiş bir doğrusal regresyon modeli için (rastgele hataların kovaryans matrisine hiçbir kısıtlama uygulanmaz), en etkili olanın (doğrusal yansız tahminler sınıfında) sözde tahminler olduğu kanıtlanmıştır. genelleştirilmiş OLS (OMNK, GLS - Genelleştirilmiş En Küçük Kareler)- Rastgele hataların ters kovaryans matrisine eşit bir ağırlık matrisine sahip LS yöntemi: W = V ε − 1 (\displaystyle W=V_(\varepsilon )^(-1)).

Doğrusal modelin parametrelerinin GLS tahminleri için formülün şu şekilde olduğu gösterilebilir:

B ^ G L S = (X T V − 1 X) − 1 X T V − 1 y (\displaystyle (\hat (b))_(GLS)=(X^(T)V^(-1)X)^(-1) X^(T)V^(-1)y).

Bu tahminlerin kovaryans matrisi sırasıyla şuna eşit olacaktır:

V (b ^ G L S) = (X T V − 1 X) − 1 (\displaystyle V((\hat (b))_(GLS))=(X^(T)V^(-1)X)^(- bir)).

Aslında, OLS'nin özü, orijinal verilerin belirli bir (doğrusal) dönüşümünde (P) ve dönüştürülmüş verilere olağan en küçük karelerin uygulanmasında yatar. Bu dönüşümün amacı, dönüştürülen veriler için rastgele hataların zaten klasik varsayımları karşılamasıdır.

Ağırlıklı en küçük kareler

Çapraz ağırlık matrisi durumunda (ve dolayısıyla rastgele hataların kovaryans matrisi), ağırlıklı en küçük kareler (WLS - Ağırlıklı En Küçük Kareler) olarak adlandırılırız. Bu durumda, modelin artıklarının ağırlıklı kareleri toplamı en aza indirilir, yani her gözlem, bu gözlemdeki rastgele hatanın varyansıyla ters orantılı bir "ağırlık" alır: e T W e = ∑ t = 1 n e t 2 σ t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ sigma _(t)^(2)))). Aslında veriler, gözlemlerin ağırlıklandırılmasıyla (rastgele hataların varsayılan standart sapması ile orantılı bir miktara bölünerek) dönüştürülür ve ağırlıklı verilere normal en küçük kareler uygulanır.

ISBN 978-5-7749-0473-0.

  • Ekonometri. Ders Kitabı / Ed. Eliseeva I.I. - 2. baskı. - M. : Finans ve istatistik, 2006. - 576 s. - ISBN 5-279-02786-3.
  • Alexandrova N.V. Matematiksel terimlerin, kavramların, tanımların tarihi: bir sözlük referans kitabı. - 3. baskı - M. : LKI, 2008. - 248 s. - ISBN 978-5-382-00839-4. I.V. Mitin, Rusakov V.S. Deneysel verilerin analizi ve işlenmesi - 5. baskı - 24p.
  • Fonksiyonu 2. dereceden bir polinom ile tahmin ediyoruz. Bunu yapmak için normal denklem sisteminin katsayılarını hesaplıyoruz:

    , ,

    Aşağıdaki forma sahip normal bir en küçük kareler sistemi oluşturalım:

    Sistemin çözümünü bulmak kolaydır:, , .

    Böylece, 2. derecenin polinomu bulunur: .

    Teorik arka plan

    sayfaya dön<Введение в вычислительную математику. Примеры>

    Örnek 2. Bir polinomun optimal derecesini bulma.

    sayfaya dön<Введение в вычислительную математику. Примеры>

    Örnek 3. Ampirik bağımlılığın parametrelerini bulmak için normal bir denklem sisteminin türetilmesi.

    Katsayıları ve fonksiyonları belirlemek için bir denklem sistemi türetelim. , verilen fonksiyonun noktalara göre ortalama karekök yaklaşımını gerçekleştiren . Bir işlev oluştur ve bunun için gerekli ekstremum koşulunu yazın:

    O zaman normal sistem şu şekli alacaktır:

    Bilinmeyen parametreler için kolayca çözülebilen doğrusal bir denklem sistemi elde ettik.

    Teorik arka plan

    sayfaya dön<Введение в вычислительную математику. Примеры>

    Örnek.

    Değişkenlerin değerlerine ilişkin deneysel veriler X ve de tabloda verilmektedir.

    Hizalamalarının bir sonucu olarak, fonksiyon

    kullanma en küçük kareler yöntemi, bu verilere doğrusal bir bağımlılıkla yaklaşın y=ax+b(seçenekleri bul a ve b). İki çizgiden hangisinin daha iyi olduğunu bulun (en küçük kareler yöntemi anlamında) deneysel verileri hizalar. Çizim yapmak.

    En küçük kareler yönteminin özü (LSM).

    Problem, iki değişkenli fonksiyonun hangi lineer bağımlılık katsayılarını bulmaktır. a ve ben küçük değeri alır. Yani, verilen veriler a ve b deneysel verilerin bulunan düz çizgiden sapmalarının karelerinin toplamı en küçük olacaktır. En küçük kareler yönteminin bütün noktası budur.

    Böylece, örneğin çözümü, iki değişkenli bir fonksiyonun ekstremumunu bulmaya indirgenir.

    Katsayıları bulmak için formüllerin türetilmesi.

    İki bilinmeyenli iki denklem sistemi derlenir ve çözülür. Fonksiyonların kısmi türevlerini bulma değişkenlere göre a ve b, bu türevleri sıfıra eşitliyoruz.

    Ortaya çıkan denklem sistemini herhangi bir yöntemle çözeriz (örneğin ikame yöntemi veya Cramer yöntemi) ve en küçük kareler yöntemini (LSM) kullanarak katsayıları bulmak için formüller elde edin.

    verilerle a ve b işlev en küçük değeri alır. Bu gerçeğin kanıtı aşağıda sayfanın sonundaki metinde verilmiştir.

    En küçük kareler yönteminin tamamı budur. Parametreyi bulmak için formül a toplamları , , ve parametreyi içerir n deneysel veri miktarıdır. Bu toplamların değerlerinin ayrı ayrı hesaplanması önerilir.

    katsayı b hesaplamadan sonra bulundu a.

    Orijinal örneği hatırlamanın zamanı geldi.

    Çözüm.

    Örneğimizde n=5. Gerekli katsayıların formüllerinde yer alan tutarların hesaplanmasında kolaylık olması için tabloyu dolduruyoruz.

    Tablonun dördüncü satırındaki değerler, her sayı için 2. satırın değerleri ile 3. satırın değerlerinin çarpılmasıyla elde edilir. i.

    Tablonun beşinci satırındaki değerler, her sayı için 2. sıradaki değerlerin karesi alınarak elde edilir. i.

    Tablonun son sütununun değerleri, satırlar arasındaki değerlerin toplamıdır.

    Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanırız. a ve b. Tablonun son sütunundaki karşılık gelen değerleri içlerinde değiştiriyoruz:

    Sonuç olarak, y=0.165x+2.184 istenen yaklaşık düz çizgidir.

    Hangi satırları bulmak için kalır y=0.165x+2.184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahminde bulunur.

    En küçük kareler yönteminin hatasının tahmini.

    Bunu yapmak için, orijinal verilerin bu satırlardan kare sapmalarının toplamlarını hesaplamanız gerekir. ve , daha küçük bir değer, en küçük kareler yöntemi açısından orijinal verilere daha iyi yaklaşan bir çizgiye karşılık gelir.

    O zamandan beri, hat y=0.165x+2.184 orijinal verilere daha iyi yaklaşır.

    En küçük kareler yönteminin (LSM) grafik gösterimi.

    Grafiklerde her şey harika görünüyor. Kırmızı çizgi bulunan çizgidir y=0.165x+2.184, mavi çizgi , pembe noktalar orijinal verilerdir.

    Ne için, tüm bu yaklaşımlar ne için?

    Kişisel olarak veri yumuşatma problemlerini, enterpolasyon ve ekstrapolasyon problemlerini çözmek için kullanıyorum (orijinal örnekte, gözlemlenen değerin değerini bulmanız istenebilir) y de x=3 ya da ne zaman x=6 MNC yöntemine göre). Ancak bunun hakkında daha sonra sitenin başka bir bölümünde konuşacağız.

    Sayfanın başı

    Kanıt.

    Böylece bulunduğunda a ve b fonksiyon en küçük değeri alır, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. pozitif kesindi. Hadi gösterelim.

    İkinci mertebeden diferansiyel şu şekildedir:

    Yani

    Bu nedenle, ikinci dereceden formun matrisi forma sahiptir.

    ve öğelerin değerleri bağlı değildir a ve b.

    Matrisin pozitif tanımlı olduğunu gösterelim. Bu, açı minörlerinin pozitif olmasını gerektirir.

    Birinci dereceden açısal minör . Eşitsizlik katıdır, çünkü noktalar çakışmaz. Bu, aşağıdakilerde ima edilecektir.

    İkinci dereceden açısal minör

    bunu kanıtlayalım matematiksel tümevarım yöntemi.

    Çözüm: bulunan değerler a ve b fonksiyonun en küçük değerine karşılık gelir , bu nedenle, en küçük kareler yöntemi için istenen parametrelerdir.

    Hiç anladın mı?
    Çözüm Siparişi Verin

    Sayfanın başı

    En küçük kareler yöntemini kullanarak bir tahmin geliştirme. Sorun çözümü örneği

    ekstrapolasyon - bu, geçmiş ve şimdiki eğilimlerin, kalıpların, tahmin nesnesinin gelecekteki gelişimiyle ilişkilerin yayılmasına dayanan bir bilimsel araştırma yöntemidir. Ekstrapolasyon yöntemleri şunları içerir: hareketli ortalama yöntemi, üstel yumuşatma yöntemi, en küçük kareler yöntemi.

    Öz en küçük kareler yöntemi gözlemlenen ve hesaplanan değerler arasındaki kare sapmaların toplamını minimize etmekten ibarettir. Hesaplanan değerler, seçilen denklem - regresyon denklemine göre bulunur. Gerçek değerler ile hesaplananlar arasındaki mesafe ne kadar küçük olursa, regresyon denklemine dayalı tahmin o kadar doğru olur.

    İncelenen olgunun özünün teorik analizi, bir zaman serisi tarafından gösterilen değişiklik, bir eğri seçmenin temeli olarak hizmet eder. Serinin seviyelerinin büyümesinin doğası hakkında düşünceler bazen dikkate alınır. Dolayısıyla, aritmetik bir ilerlemede çıktı artışı bekleniyorsa, düz bir çizgide yumuşatma gerçekleştirilir. Büyümenin üstel olduğu ortaya çıkarsa, üstel fonksiyona göre düzgünleştirme yapılmalıdır.

    En küçük kareler yönteminin çalışma formülü : Y t+1 = a*X + b, burada t + 1 tahmin dönemidir; Уt+1 – tahmin edilen gösterge; a ve b katsayılardır; X, zamanın bir simgesidir.

    a ve b katsayıları aşağıdaki formüllere göre hesaplanır:

    nerede, Uf - dinamik serisinin gerçek değerleri; n, zaman serisindeki düzey sayısıdır;

    Zaman serilerinin en küçük kareler yöntemiyle yumuşatılması, incelenen olgunun gelişim modellerini yansıtmaya hizmet eder. Bir eğilimin analitik ifadesinde, zaman bağımsız bir değişken olarak kabul edilir ve serilerin seviyeleri bu bağımsız değişkenin bir fonksiyonu olarak hareket eder.

    Bir olgunun gelişimi, başlangıç ​​noktasından bu yana kaç yıl geçtiğine değil, gelişimini hangi faktörlerin, hangi yönde ve hangi yoğunlukta etkilediğine bağlıdır. Bundan, bir olgunun zaman içindeki gelişiminin, bu faktörlerin etkisinin bir sonucu olarak ortaya çıktığı açıktır.

    Eğrinin türünü doğru şekilde ayarlamak, zamana bağlı analitik bağımlılığın türü, ön tahmin analizinin en zor görevlerinden biridir. .

    Parametreleri en küçük kareler yöntemiyle belirlenen trendi tanımlayan fonksiyon tipinin seçimi, çoğu durumda bir dizi fonksiyon inşa ederek ve bunları kök değeri açısından birbirleriyle karşılaştırarak ampiriktir. -ortalama kare hatası, aşağıdaki formülle hesaplanır:

    nerede Uf - dinamik serisinin gerçek değerleri; Ur – zaman serisinin hesaplanmış (düzeltilmiş) değerleri; n, zaman serisindeki düzey sayısıdır; p, trendi (gelişme eğilimi) açıklayan formüllerde belirlenen parametre sayısıdır.

    En küçük kareler yönteminin dezavantajları :

    • Matematiksel bir denklem kullanarak incelenen ekonomik fenomeni tanımlamaya çalışırken, tahmin kısa bir süre için doğru olacaktır ve yeni bilgiler elde edildikçe regresyon denklemi yeniden hesaplanmalıdır;
    • standart bilgisayar programları kullanılarak çözülebilen regresyon denklemi seçiminin karmaşıklığı.

    Bir tahmin geliştirmek için en küçük kareler yöntemini kullanmaya bir örnek

    Bir görev . Bölgedeki işsizlik seviyesini karakterize eden veriler var, %

    • Hareketli ortalama, üstel düzeltme, en küçük kareler yöntemlerini kullanarak, Kasım, Aralık, Ocak ayları için bölgedeki işsizlik oranı tahminini oluşturun.
    • Her bir yöntemi kullanarak ortaya çıkan tahminlerdeki hataları hesaplayın.
    • Elde edilen sonuçları karşılaştırın, sonuçlar çıkarın.

    En küçük kareler çözümü

    Çözüm için gerekli hesaplamaları yapacağımız bir tablo oluşturacağız:

    ε = 28.63/10 = %2.86 tahmin doğruluğu yüksek.

    Çözüm : Hesaplamalarda elde edilen sonuçların karşılaştırılması hareketli ortalama yöntemi , üstel yumuşatma ve en küçük kareler yönteminde, üstel düzgünleştirme yöntemiyle yapılan hesaplamalardaki ortalama bağıl hatanın %20-50 arasında olduğunu söyleyebiliriz. Bu, bu durumda tahmin doğruluğunun yalnızca tatmin edici olduğu anlamına gelir.

    Birinci ve üçüncü durumlarda, ortalama bağıl hata %10'dan az olduğu için tahmin doğruluğu yüksektir. Ancak, hareketli ortalama yöntemi daha güvenilir sonuçlar elde etmeyi mümkün kıldı (Kasım için tahmin -% 1.52, Aralık için tahmin -% 1.53, Ocak için tahmin -% 1.49), çünkü bu yöntemi kullanırken ortalama nispi hata en küçük - 1 ,%13.

    en küçük kareler yöntemi

    Diğer ilgili makaleler:

    Kullanılan kaynakların listesi

    1. Sosyal riskleri teşhis etme ve zorlukları, tehditleri ve sosyal sonuçları tahmin etme konularında bilimsel ve metodolojik öneriler. Rusya Devlet Sosyal Üniversitesi. Moskova. 2010;
    2. Vladimirova L.P. Piyasa koşullarında tahmin ve planlama: Proc. ödenek. M.: Yayınevi "Dashkov and Co", 2001;
    3. Novikova N.V., Pozdeeva O.G. Ulusal Ekonominin Öngörüsü: Eğitim ve Metodolojik Kılavuz. Yekaterinburg: Yayınevi Ural. durum ekonomi üniversite, 2007;
    4. Sürtük derisi L.N. İş tahmininde MBA kursu. Moskova: Alpina Business Books, 2006.

    MEB Programı

    Veri girin

    Veri ve Yaklaşım y = a + bx

    i- deney noktasının numarası;
    x ben- noktada sabit parametrenin değeri i;
    ben- noktada ölçülen parametrenin değeri i;
    ω ben- noktada ölçüm ağırlığı i;
    y ben, kalk.- ölçülen değer ile regresyondan hesaplanan değer arasındaki fark y noktada i;
    Sx ben (x ben)- hata tahmini x benölçerken y noktada i.

    Veri ve Yaklaşım y = kx

    i x ben ben ω ben y ben, kalk. Δy ben Sx ben (x ben)

    Grafiğe tıklayın

    MNC çevrimiçi programı için kullanım kılavuzu.

    Veri alanında, her bir ayrı satıra bir deneysel noktada "x" ve "y" değerlerini girin. Değerler boşluk (boşluk veya sekme) ile ayrılmalıdır.

    Üçüncü değer, "w"nin nokta ağırlığı olabilir. Nokta ağırlığı belirtilmemişse, bire eşittir. Vakaların büyük çoğunluğunda, deneysel noktaların ağırlıkları bilinmemekte veya hesaplanmamaktadır; tüm deneysel veriler eşdeğer kabul edilir. Bazen çalışılan değerler aralığındaki ağırlıklar kesinlikle eşdeğer değildir ve hatta teorik olarak hesaplanabilir. Örneğin, spektrofotometride, ağırlıklar basit formüller kullanılarak hesaplanabilir, ancak temelde herkes işçilik maliyetlerini azaltmak için bunu ihmal eder.

    Veriler, Microsoft Office'ten Excel veya Open Office'ten Calc gibi bir ofis elektronik tablosundan panoya yapıştırılabilir. Bunu yapmak için, elektronik tabloda kopyalanacak veri aralığını seçin, panoya kopyalayın ve verileri bu sayfadaki veri alanına yapıştırın.

    En küçük kareler yöntemiyle hesaplamak için, iki katsayı 'b' - düz çizginin eğim açısının tanjantı ve 'a' - 'y üzerindeki düz çizgi tarafından kesilen değer' belirlemek için en az iki nokta gereklidir. ` eksen.

    Hesaplanan regresyon katsayılarının hatasını tahmin etmek için deneysel noktaların sayısını ikiden fazla ayarlamak gerekir.

    En küçük kareler yöntemi (LSM).

    Deneysel noktaların sayısı ne kadar fazla olursa, katsayıların istatistiksel tahmini o kadar doğru olur (Öğrenci katsayısındaki azalmadan dolayı) ve tahmin genel örneklemin tahminine o kadar yakın olur.

    Her bir deney noktasında değerlerin elde edilmesi, genellikle önemli işçilik maliyetleri ile ilişkilidir, bu nedenle, genellikle sindirilebilir bir tahmin veren ve aşırı işçilik maliyetlerine yol açmayan, uzlaşmacı sayıda deney yapılır. Kural olarak, iki katsayılı doğrusal en küçük kareler bağımlılığı için deneysel noktaların sayısı 5-7 puanlık bölgede seçilir.

    Doğrusal Bağımlılık İçin En Küçük Kareler İçin Kısa Bir Teori

    [`y_i`, `x_i`] değer çiftleri şeklinde bir dizi deneysel verimiz olduğunu varsayalım, burada 'i' 1'den 'n'ye kadar olan bir deneysel ölçümün sayısıdır; "y_i" - "i" noktasındaki ölçülen değerin değeri; "x_i" - "i" noktasında ayarladığımız parametrenin değeri.

    Bir örnek, Ohm yasasının işleyişidir. Elektrik devresinin bölümleri arasındaki gerilimi (potansiyel farkı) değiştirerek bu bölümden geçen akım miktarını ölçüyoruz. Fizik bize deneysel olarak bulunan bağımlılığı verir:

    "I=U/R",
    nerede 'I' - mevcut güç; "R" - direnç; "U" - voltaj.

    Bu durumda "y_i" ölçülen akım değeridir ve "x_i" voltaj değeridir.

    Başka bir örnek olarak, çözelti içindeki bir maddenin bir çözeltisi tarafından ışığın emilmesini düşünün. Kimya bize formülü verir:

    `A = εl C`,
    burada "A" çözümün optik yoğunluğudur; `ε` - çözünen geçirgenlik; 'l' - ışığın çözelti içeren bir küvetten geçtiği yol uzunluğu; 'C', çözünen maddenin konsantrasyonudur.

    Bu durumda, "y_i" ölçülen optik yoğunluk "A"dır ve "x_i", belirlediğimiz maddenin konsantrasyonudur.

    "x_i" ayarındaki göreli hatanın "y_i" ölçümündeki göreli hatadan çok daha az olduğu durumu ele alacağız. Ayrıca, ölçülen tüm 'y_i' değerlerinin rastgele ve normal dağıldığını, yani. normal dağılım yasasına uyun.

    "y"nin "x"e doğrusal bağımlılığı durumunda, teorik bağımlılığı yazabiliriz:
    `y = a + bx`.

    Geometrik bir bakış açısından, 'b' katsayısı, çizgi eğiminin 'x' eksenine tanjantını belirtir ve 'a' katsayısı - doğrunun ' ile kesişme noktasındaki 'y' değeri. y' ekseni ('x = 0' ile).

    Regresyon çizgisinin parametrelerini bulma.

    Bir deneyde, y_i'nin ölçülen değerleri, her zaman gerçek hayatta bulunan ölçüm hatalarından dolayı tam olarak teorik çizgide yer alamaz. Bu nedenle, doğrusal bir denklem bir denklem sistemi ile temsil edilmelidir:
    `y_i = a + b x_i + ε_i` (1),
    burada "ε_i", "i" deneyinde "y"nin bilinmeyen ölçüm hatasıdır.

    Bağımlılık (1) olarak da adlandırılır gerileme, yani istatistiksel anlamlılık ile birbirine iki niceliğin bağımlılığı.

    Bağımlılığı geri yükleme görevi, ['y_i', 'x_i'] deneysel noktalarından 'a' ve 'b' katsayılarını bulmaktır.

    Katsayıları bulmak için genellikle "a" ve "b" kullanılır en küçük kareler yöntemi(MNK). Maksimum olabilirlik ilkesinin özel bir halidir.

    (1)'i `ε_i = y_i - a - b x_i` olarak yeniden yazalım.

    O zaman karesel hataların toplamı
    `Φ = toplam_(i=1)^(n) ε_i^2 = toplam_(i=1)^(n) (y_i - a - b x_i)^2`. (2)

    En küçük kareler yönteminin ilkesi, 'a' ve 'b' parametrelerine göre toplamı (2) en aza indirmektir..

    Toplamın (2) 'a' ve 'b' katsayılarına göre kısmi türevleri sıfıra eşit olduğunda minimuma ulaşılır:
    `frac(kısmi Φ)(kısmi a) = frak(kısmi toplam_(i=1)^(n) (y_i - a - b x_i)^2)(kısmi a) = 0`
    `frac(kısmi Φ)(kısmi b) = frak(kısmi toplam_(i=1)^(n) (y_i - a - b x_i)^2)(kısmi b) = 0`

    Türevleri genişleterek, iki bilinmeyenli iki denklem sistemi elde ederiz:
    `sum_(i=1)^(n) (2a + 2bx_i - 2y_i) = toplam_(i=1)^(n) (a + bx_i - y_i) = 0`
    `sum_(i=1)^(n) (2bx_i^2 + 2ax_i - 2x_iy_i) = toplam_(i=1)^(n) (bx_i^2 + ax_i - x_iy_i) = 0`

    Parantezleri açıp istenen katsayılardan bağımsız toplamları diğer yarısına aktarıyoruz, bir doğrusal denklem sistemi elde ediyoruz:
    `toplam_(i=1)^(n) y_i = bir n + b toplam_(i=1)^(n) bx_i`
    `toplam_(i=1)^(n) x_iy_i = bir toplam_(i=1)^(n) x_i + b toplam_(i=1)^(n) x_i^2`

    Ortaya çıkan sistemi çözerek, "a" ve "b" katsayıları için formüller buluyoruz:

    `a = frac(sum_(i=1)^(n) y_i toplam_(i=1)^(n) x_i^2 - toplam_(i=1)^(n) x_i toplam_(i=1)^(n ) x_iy_i) (n toplam_(i=1)^(n) x_i^2 — (toplam_(i=1)^(n) x_i)^2)` (3.1)

    `b = frac(n toplam_(i=1)^(n) x_iy_i - toplam_(i=1)^(n) x_i toplam_(i=1)^(n) y_i) (n toplam_(i=1)^ (n) x_i^2 - (toplam_(i=1)^(n) x_i)^2)` (3.2)

    Bu formüller, "n > 1" olduğunda (çizgi en az 2 nokta kullanılarak çizilebilir) ve determinantı "D = n toplam_(i=1)^(n) x_i^2 — (toplam_(i= 1) olduğunda çözümlere sahiptir. )^(n) x_i)^2 != 0`, yani deneydeki "x_i" noktaları farklı olduğunda (yani, çizgi dikey olmadığında).

    Regresyon doğrusu katsayılarındaki hataların tahmini

    "a" ve "b" katsayılarının hesaplanmasındaki hatanın daha doğru bir tahmini için çok sayıda deneysel nokta istenir. n = 2 olduğunda, katsayıların hatasını tahmin etmek imkansızdır, çünkü yaklaşım çizgisi benzersiz bir şekilde iki noktadan geçecektir.

    Rastgele değişken 'V'nin hatası belirlenir hata biriktirme yasası
    `S_V^2 = toplam_(i=1)^p (frak(kısmi f)(kısmi z_i))^2 S_(z_i)^2',
    burada "p", "S_V" hatasını etkileyen "S_(z_i)" hatasına sahip "z_i" parametrelerinin sayısıdır;
    "f", "z_i" üzerindeki "V"nin bağımlılık işlevidir.

    'a' ve 'b' katsayılarının hatası için hataların birikim yasasını yazalım.
    `S_a^2 = toplam_(i=1)^(n)(frak(kısmi a)(kısmi y_i))^2 S_(y_i)^2 + toplam_(i=1)^(n)(frak(kısmi a) )(kısmi x_i))^2 S_(x_i)^2 = S_y^2 toplam_(i=1)^(n)(frak(kısmi a)(kısmi y_i))^2 `,
    `S_b^2 = toplam_(i=1)^(n)(frak(kısmi b)(kısmi y_i))^2 S_(y_i)^2 + toplam_(i=1)^(n)(frak(kısmi b) )(kısmi x_i))^2 S_(x_i)^2 = S_y^2 toplam_(i=1)^(n)(frak(kısmi b)(kısmi y_i))^2 `,
    çünkü `S_(x_i)^2 = 0` (daha önce `x` hatasının ihmal edilebilir olduğuna dair bir rezervasyon yapmıştık).

    "S_y^2 = S_(y_i)^2" - hatanın tüm "y" değerleri için tek tip olduğu varsayılarak "y" boyutundaki hata (varyans, standart sapmanın karesi).

    Ortaya çıkan ifadelerde "a" ve "b"yi hesaplamak için formülleri değiştirerek şunu elde ederiz:

    `S_a^2 = S_y^2 frak(toplam_(i=1)^(n) (toplam_(i=1)^(n) x_i^2 - x_i toplam_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frak((n toplam_(i=1)^(n) x_i^2 - (toplam_(i=1)^(n) x_i)^2) toplam_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frak(toplam_(i=1)^(n) x_i^2) (D)` (4.1)

    `S_b^2 = S_y^2 frak(toplam_(i=1)^(n) (n x_i - toplam_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frak( n (n toplam_(i=1)^(n) x_i^2 - (toplam_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) `(4.2)

    Çoğu gerçek deneyde, 'Sy' değeri ölçülmez. Bunu yapmak için, planın bir veya birkaç noktasında birkaç paralel ölçüm (deney) yapmak gerekir, bu da deneyin süresini (ve muhtemelen maliyetini) artırır. Bu nedenle, genellikle 'y'nin regresyon çizgisinden sapmasının rastgele kabul edilebileceği varsayılır. Bu durumda varyans tahmini 'y' formülle hesaplanır.

    `S_y^2 = S_(y, kalan)^2 = frac(sum_(i=1)^n (y_i - a - b x_i)^2) (n-2)`.

    'n-2' böleni, aynı deneysel veri örneği için iki katsayının hesaplanması nedeniyle serbestlik derecesi sayısını azalttığımız için görünür.

    Bu tahmin aynı zamanda `S_(y, kalan)^2` regresyon doğrusuna göre artık varyans olarak da adlandırılır.

    Katsayıların önem değerlendirmesi Öğrenci kriterine göre yapılır.

    `t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

    Hesaplanan 't_a', 't_b' ölçütleri, 't(P, n-2)' tablo ölçütlerinden küçükse, o zaman karşılık gelen katsayının, verilen bir 'P' olasılığı ile sıfırdan önemli ölçüde farklı olmadığı kabul edilir.

    Doğrusal bir ilişkinin tanımının kalitesini değerlendirmek için, Fisher kriterini kullanarak "S_(y, kalan)^2" ve "S_(çubuk y)"yi ortalamaya göre karşılaştırabilirsiniz.

    `S_(y çubuğu) = parça(toplam_(i=1)^n (y_i - çubuk y)^2) (n-1) = parça(toplam_(i=1)^n (y_i - (toplam_(i=) 1)^n y_i) /n)^2) (n-1)` - "y"nin ortalamaya göre varyansının örnek tahmini.

    Bağımlılığı tanımlamak için regresyon denkleminin etkinliğini değerlendirmek için Fisher katsayısı hesaplanır.
    `F = S_(çubuk y) / S_(y, kalan)^2`,
    bu, `F(p, n-1, n-2)` tablolu Fisher katsayısı ile karşılaştırılır.

    `F > F(P, n-1, n-2)` ise, `y = f(x)` bağımlılığının regresyon denklemi kullanılarak açıklaması ile ortalama kullanılarak yapılan açıklama arasındaki fark, olasılık ile istatistiksel olarak anlamlı kabul edilir. "P". Şunlar. regresyon, bağımlılığı "y"nin ortalama etrafındaki yayılmasından daha iyi tanımlar.

    Grafiğe tıklayın
    tabloya değerler eklemek için

    En küçük kareler yöntemi. En küçük kareler yöntemi, bilinmeyen a, b, c parametrelerinin, kabul edilen fonksiyonel bağımlılığın belirlenmesi anlamına gelir.

    En küçük kareler yöntemi, bilinmeyen parametrelerin belirlenmesi anlamına gelir. a, b, c,… kabul edilen fonksiyonel bağımlılık

    y = f(x,a,b,c,…),

    hatanın minimum ortalama karesini (varyansı) sağlayacak olan

    , (24)

    nerede x ben , y ben - deneyden elde edilen sayı çiftleri.

    Birkaç değişkenli bir fonksiyonun ekstremumunun koşulu, kısmi türevlerinin sıfıra eşit olması koşulu olduğundan, parametreler a, b, c,… denklem sisteminden belirlenir:

    ; ; ; … (25)

    Unutulmamalıdır ki, fonksiyonun biçiminden sonra parametreleri seçmek için en küçük kareler yöntemi kullanılır. y = f(x) tanımlı.

    Teorik değerlendirmelerden ampirik formülün ne olması gerektiği hakkında herhangi bir sonuç çıkarmak mümkün değilse, o zaman görsel temsiller, öncelikle gözlemlenen verilerin grafiksel bir temsili tarafından yönlendirilmelidir.

    Uygulamada, çoğu zaman aşağıdaki işlev türleriyle sınırlıdır:

    1) doğrusal ;

    2) ikinci dereceden a .

    En küçük kareler yönteminin özü, zaman veya mekandaki herhangi bir rastgele olgunun gelişme eğilimini en iyi tanımlayan eğilim modelinin parametrelerini bulmada (trend, bu gelişmenin eğilimini karakterize eden bir çizgidir). En küçük kareler yönteminin (OLS) görevi sadece bir trend modeli bulmak değil, aynı zamanda en iyi veya optimal modeli bulmaktır. Bu model, gözlemlenen gerçek değerler ile karşılık gelen hesaplanan trend değerleri arasındaki kare sapmaların toplamı minimum (en küçük) ise optimal olacaktır:

    gözlenen gerçek değer arasındaki standart sapma nerede

    ve karşılık gelen hesaplanan trend değeri,

    İncelenen olgunun gerçek (gözlenen) değeri,

    Trend modelinin tahmini değeri,

    İncelenen olgunun gözlem sayısı.

    MNC nadiren tek başına kullanılır. Kural olarak, çoğu zaman korelasyon çalışmalarında sadece gerekli bir teknik olarak kullanılır. LSM'nin bilgi temelinin sadece güvenilir bir istatistiksel seri olabileceği ve gözlem sayısının 4'ten az olmaması gerektiği unutulmamalıdır, aksi takdirde LSM'nin yumuşatma prosedürleri sağduyusunu kaybedebilir.

    OLS araç seti aşağıdaki prosedürlere indirgenmiştir:

    İlk prosedür. Seçilen faktör argümanı değiştiğinde ortaya çıkan özelliği değiştirme eğiliminin olup olmadığı veya başka bir deyişle " arasında bir bağlantı olup olmadığı ortaya çıkıyor. de " ve " X ».

    İkinci prosedür. Hangi çizginin (yörüngenin) bu eğilimi en iyi tanımlayabileceği veya karakterize edebileceği belirlenir.

    Üçüncü prosedür.

    Örnek. Araştırılan çiftlik için ortalama ayçiçeği verimi hakkında bilgimiz olduğunu varsayalım (Tablo 9.1).

    Tablo 9.1

    gözlem numarası

    Verimlilik, c/ha

    Ülkemizde ayçiçeği üretiminde teknoloji seviyesi son 10 yılda çok fazla değişmediğinden, analiz edilen dönemdeki verimdeki dalgalanmaların büyük olasılıkla hava ve iklim koşullarındaki dalgalanmalara bağlı olduğu anlamına gelir. Bu doğru mu?

    İlk MNC prosedürü. Analiz edilen 10 yıl boyunca hava ve iklim koşullarındaki değişikliklere bağlı olarak ayçiçeği verimindeki değişimde bir eğilimin varlığına ilişkin hipotez test edilmektedir.

    Bu örnekte, " y » ayçiçeği veriminin alınması tavsiye edilir ve « için x » analiz edilen dönemde gözlemlenen yılın sayısıdır. arasında herhangi bir ilişkinin varlığına ilişkin hipotezin test edilmesidir. x " ve " y » iki şekilde yapılabilir: elle ve bilgisayar programları yardımıyla. Tabii ki, bilgisayar teknolojisinin kullanılabilirliği ile bu sorun kendiliğinden çözülür. Ancak, OLS araçlarını daha iyi anlamak için, "aralarında bir ilişkinin varlığına ilişkin hipotezin test edilmesi önerilir. x " ve " y » manuel olarak, yalnızca bir kalem ve normal bir hesap makinesi elinizin altındayken. Bu gibi durumlarda, bir trendin varlığının hipotezi, analiz edilen zaman serisinin grafik görüntüsünün konumu ile görsel olarak en iyi şekilde kontrol edilir - korelasyon alanı:

    Örneğimizdeki korelasyon alanı, yavaş artan bir çizgi etrafında yer almaktadır. Bu bile başlı başına ayçiçeği verimindeki değişimde belirli bir eğilimin varlığını göstermektedir. Sadece korelasyon alanı bir daire, daire, kesinlikle dikey veya kesinlikle yatay bir bulut gibi göründüğünde veya rastgele dağılmış noktalardan oluştuğunda herhangi bir eğilimin varlığından bahsetmek imkansızdır. Diğer tüm durumlarda, " arasında bir ilişkinin varlığına dair hipotezi doğrulamak gerekir. x " ve " y ve araştırmaya devam edin.

    İkinci MNC prosedürü. Hangi hattın (yörünge) analiz edilen dönem için ayçiçeği verim değişimlerindeki eğilimi en iyi tanımlayabileceği veya karakterize edebileceği belirlenir.

    Bilgisayar teknolojisinin mevcudiyeti ile en uygun eğilimin seçimi otomatik olarak gerçekleşir. "Manuel" işleme ile, optimal fonksiyonun seçimi, kural olarak, görsel bir şekilde - korelasyon alanının yeri ile gerçekleştirilir. Yani, grafiğin türüne göre, ampirik eğilime (gerçek yörüngeye) en uygun olan çizginin denklemi seçilir.

    Bildiğiniz gibi, doğada çok çeşitli işlevsel bağımlılıklar vardır, bu nedenle bunların küçük bir bölümünü bile görsel olarak analiz etmek son derece zordur. Neyse ki, gerçek ekonomik uygulamada, çoğu ilişki ya bir parabol, ya bir hiperbol ya da düz bir çizgi ile doğru bir şekilde tanımlanabilir. Bu bağlamda, en iyi işlevi seçmek için "manuel" seçeneği ile kendinizi yalnızca bu üç modelle sınırlayabilirsiniz.

    Hiperbol:

    İkinci dereceden parabol: :

    Örneğimizde, analiz edilen 10 yıl boyunca ayçiçeği verimindeki değişim eğiliminin en iyi şekilde düz bir çizgi ile karakterize edildiğini görmek kolaydır, bu nedenle regresyon denklemi düz bir çizgi denklemi olacaktır.

    Üçüncü prosedür. Bu çizgiyi karakterize eden regresyon denkleminin parametreleri hesaplanır veya başka bir deyişle en iyi trend modelini tanımlayan analitik bir formül belirlenir.

    Regresyon denkleminin parametrelerinin değerlerini bulmak, bizim durumumuzda parametreler ve , en küçük karelerin çekirdeğidir. Bu süreç, bir normal denklem sistemini çözmeye indirgenir.

    (9.2)

    Bu denklem sistemi Gauss yöntemiyle oldukça kolay bir şekilde çözülür. Çözümün bir sonucu olarak, örneğimizde parametrelerin ve değerlerinin bulunduğunu hatırlayın. Böylece, bulunan regresyon denklemi aşağıdaki forma sahip olacaktır:

    KATEGORİLER

    POPÜLER MAKALELER

    2022 "kingad.ru" - insan organlarının ultrason muayenesi