En küçük kareler yöntemini kullanarak veri analizi. Excel'de en küçük kareler yöntemi

En küçük kareler yöntemi

Konunun son dersinde en ünlü uygulamayla tanışacağız. FNP Bilimin çeşitli alanlarında ve pratik faaliyetlerde en geniş uygulamayı bulan. Bu fizik, kimya, biyoloji, ekonomi, sosyoloji, psikoloji vb. olabilir. Kaderin iradesiyle sık sık ekonomiyle uğraşmak zorunda kalıyorum ve bu nedenle bugün sizin için muhteşem bir ülkeye bir gezi ayarlayacağım. Ekonometri=) ...Nasıl istemezsin?! Orası çok iyi; sadece karar vermeniz gerekiyor! ...Ama muhtemelen kesinlikle isteyeceğiniz şey sorunların nasıl çözüleceğini öğrenmektir en küçük kareler yöntemi. Ve özellikle dikkatli okuyucular, bunları yalnızca doğru bir şekilde değil, aynı zamanda ÇOK HIZLI bir şekilde çözmeyi öğrenecekler ;-) Ama önce sorunun genel ifadesi+ eşlik eden örnek:

Belirli bir konu alanındaki niceliksel ifadeye sahip göstergeleri inceleyelim. Aynı zamanda göstergenin göstergeye bağlı olduğuna inanmak için her türlü neden vardır. Bu varsayım bilimsel bir hipotez olabilir veya temel sağduyuya dayanabilir. Ancak bilimi bir kenara bırakıp daha iştah açıcı alanları yani marketleri keşfedelim. Şununla belirtelim:

– bir bakkalın perakende alanı, m2,
– bir bakkalın yıllık cirosu, milyon ruble.

Mağaza alanı ne kadar büyük olursa, çoğu durumda cironun da o kadar büyük olacağı kesinlikle açıktır.

Tefle gözlemler/deneyler/hesaplamalar/danslar yaptıktan sonra elimizde sayısal verilere sahip olduğumuzu varsayalım:

Bakkallarda her şeyin açık olduğunu düşünüyorum: - bu 1. mağazanın alanı, - yıllık cirosu, - 2. mağazanın alanı, - yıllık cirosu vb. Bu arada, sınıflandırılmış materyallere erişime sahip olmak hiç de gerekli değil - ticaret cirosunun oldukça doğru bir değerlendirmesi şu şekilde elde edilebilir: matematiksel istatistik. Ancak dikkatimizi dağıtmayalım, ticari casusluk kursu zaten ücretli =)

Tablo verileri aynı zamanda noktalar biçiminde de yazılabilir ve bilinen biçimde gösterilebilir. Kartezyen sistem .

Önemli bir soruya cevap verelim: Nitel bir çalışma için kaç puan gerekir?

Daha büyük daha iyi. Kabul edilebilir minimum set 5-6 puandan oluşur. Ayrıca veri miktarı az olduğunda “anormal” sonuçlar örnekleme dahil edilememektedir. Yani, örneğin küçük bir elit mağaza, "meslektaşlarından" daha büyük siparişler kazanabilir, böylece bulmanız gereken genel modeli bozabilir!



Çok basit bir şekilde ifade etmek gerekirse, bir fonksiyon seçmemiz gerekiyor, takvim noktalara mümkün olduğu kadar yakından geçen . Bu fonksiyon denir yaklaşık (yaklaşım - yaklaşım) veya teorik fonksiyon . Genel olarak konuşursak, burada hemen bariz bir "rakip" ortaya çıkıyor - grafiği TÜM noktalardan geçen yüksek dereceli bir polinom. Ancak bu seçenek karmaşıktır ve çoğunlukla yanlıştır. (grafik her zaman “döngüye gireceğinden” ve ana eğilimi zayıf şekilde yansıtacağından).

Bu nedenle aranan fonksiyonun oldukça basit olması ve aynı zamanda bağımlılığı yeterince yansıtması gerekir. Tahmin edebileceğiniz gibi, bu tür işlevleri bulma yöntemlerinden birine denir. en küçük kareler yöntemi. Öncelikle genel hatlarıyla özüne bakalım. Bazı fonksiyonların deneysel verilere yakın olmasına izin verin:


Bu yaklaşımın doğruluğu nasıl değerlendirilir? Deneysel ve fonksiyonel değerler arasındaki farkları (sapmaları) da hesaplayalım (çizi inceliyoruz). Akla gelen ilk düşünce toplamın ne kadar büyük olduğunu tahmin etmektir, ancak sorun şu ki farklar negatif olabilir (Örneğin, ) ve bu toplamanın sonucunda ortaya çıkan sapmalar birbirini iptal edecektir. Bu nedenle, yaklaşımın doğruluğunun bir tahmini olarak toplamın alınması gerekir. modüller sapmalar:

veya çöktü: (kimse bilmiyorsa: toplam simgesidir ve – 1'den 1'e kadar değerleri alan yardımcı bir "sayaç" değişkeni ) .

Deneysel noktaları farklı fonksiyonlara yaklaştırarak farklı değerler elde edeceğiz ve açıkçası bu toplamın daha küçük olduğu yerde o fonksiyon daha doğru olacaktır.

Böyle bir yöntem var ve buna denir en az modül yöntemi. Ancak pratikte çok daha yaygın hale geldi. en küçük kareler yöntemi olası negatif değerlerin modül tarafından değil, sapmaların karesi alınarak ortadan kaldırıldığı:



Bundan sonra çabalar, sapmaların karelerinin toplamı olacak şekilde bir fonksiyonun seçilmesini amaçlamaktadır. mümkün olduğu kadar küçüktü. Aslında yöntemin ismi de buradan geliyor.

Şimdi başka bir önemli noktaya dönüyoruz: Yukarıda belirtildiği gibi, seçilen işlev oldukça basit olmalıdır - ancak bu tür birçok işlev de vardır: doğrusal , hiperbolik , üstel , logaritmik , ikinci dereceden vesaire. Ve tabii ki burada hemen "faaliyet alanını daraltmak" istiyorum. Araştırma için hangi fonksiyon sınıfını seçmeliyim? İlkel ama etkili bir teknik:

– En kolay yol noktaları tasvir etmektir çizim üzerinde ve konumlarını analiz edin. Düz bir çizgide koşma eğilimindeyseler, bir çizginin denklemi optimal değerlerle ve . Başka bir deyişle görev, karesel sapmaların toplamı en küçük olacak şekilde BÖYLE katsayıları bulmaktır.

Noktalar örneğin birlikte bulunuyorsa abartı ise doğrusal fonksiyonun zayıf bir yaklaşım vereceği açıktır. Bu durumda hiperbol denklemi için en "uygun" katsayıları, yani minimum kareler toplamını verenleri arıyoruz. .

Şimdi her iki durumda da bahsettiğimize dikkat edin. iki değişkenli fonksiyonlar, kimin argümanları aranan bağımlılık parametreleri:

Ve aslında standart bir problemi çözmemiz gerekiyor - bul iki değişkenli minimum fonksiyon.

Örneğimizi hatırlayalım: "depolama" noktalarının düz bir çizgide yer aldığını ve buna inanmak için her türlü nedenin bulunduğunu varsayalım. doğrusal bağımlılık perakende alanından elde edilen ciro. Sapmaların karesi toplamı olacak şekilde BÖYLE katsayıları “a” ve “be” bulalım. en küçüğüydü. Her şey her zamanki gibi - ilk önce 1. dereceden kısmi türevler. Buna göre doğrusallık kuralı Toplam simgesinin hemen altında ayırt edebilirsiniz:

Bu bilgiyi bir makale veya dönem ödevi için kullanmak isterseniz, kaynak listesindeki bağlantıya çok minnettar olacağım; bu kadar ayrıntılı hesaplamaları birkaç yerde bulacaksınız:

Standart bir sistem oluşturalım:

Her denklemi "iki" azaltıyoruz ve ayrıca toplamları "parçalıyoruz":

Not : “a” ve “be”nin neden toplam simgesinin ötesine çıkarılabileceğini bağımsız olarak analiz edin. Bu arada, resmi olarak bu toplamla yapılabilir

Sistemi “uygulamalı” biçimde yeniden yazalım:

bundan sonra sorunumuzu çözecek algoritma ortaya çıkmaya başlıyor:

Noktaların koordinatlarını biliyor muyuz? Biliyoruz. Tutarlar bulabilir miyiz? Kolayca. En basitini yapalım iki bilinmeyenli iki doğrusal denklem sistemi(“a” ve “olmak”). Sistemi çözüyoruz, örneğin, Cramer'in yöntemi bunun sonucunda durağan bir nokta elde ederiz. Kontrol etme bir ekstremum için yeterli koşul, bu noktada işlevin olduğunu doğrulayabiliriz tam olarak ulaşıyor minimum. Kontrol ek hesaplamalar içeriyor ve bu nedenle bunu perde arkasında bırakacağız (gerekirse eksik çerçeve görüntülenebilirBurada ) . Nihai sonucu çıkarıyoruz:

İşlev en iyi yol (en azından diğer herhangi bir doğrusal fonksiyonla karşılaştırıldığında) deneysel noktaları yakınlaştırır . Kabaca söylemek gerekirse grafiği bu noktalara mümkün olduğu kadar yakından geçer. Gelenekte Ekonometri sonuçta ortaya çıkan yaklaşım fonksiyonuna da denir eşleştirilmiş doğrusal regresyon denklemi .

Söz konusu sorun büyük pratik öneme sahiptir. Örnek durumumuzda, Denk. hangi ticaret cirosunu tahmin etmenizi sağlar ("İgrek") mağaza satış alanının şu veya bu değerine sahip olacak (“x”in bir veya başka anlamı). Evet, ortaya çıkan tahmin yalnızca bir tahmin olacaktır, ancak çoğu durumda oldukça doğru olduğu ortaya çıkacaktır.

Hiçbir zorluk olmadığı için "gerçek" sayılarla sadece bir problemi analiz edeceğim - tüm hesaplamalar 7-8. sınıf okul müfredatı düzeyindedir. Vakaların yüzde 95'inde sizden yalnızca doğrusal bir fonksiyon bulmanız istenecektir, ancak makalenin en sonunda optimal hiperbol, üstel ve diğer bazı fonksiyonların denklemlerini bulmanın artık zor olmadığını göstereceğim.

Aslında geriye kalan tek şey vaat edilen güzellikleri dağıtmaktır - böylece bu tür örnekleri yalnızca doğru değil, aynı zamanda hızlı bir şekilde çözmeyi öğrenebilirsiniz. Standardı dikkatlice inceliyoruz:

Görev

İki gösterge arasındaki ilişkinin incelenmesi sonucunda aşağıdaki sayı çiftleri elde edildi:

En küçük kareler yöntemini kullanarak ampirik değere en iyi yaklaşan doğrusal fonksiyonu bulun. (Tecrübeli) veri. Kartezyen dikdörtgen koordinat sisteminde deneysel noktaların ve yaklaşık fonksiyonun grafiğinin oluşturulacağı bir çizim yapın . Ampirik ve teorik değerler arasındaki sapmaların karelerinin toplamını bulun. Özelliğin daha iyi olup olmayacağını öğrenin (en küçük kareler yöntemi açısından) Deneysel noktaları yaklaştırın.

Lütfen “x” anlamlarının doğal olduğunu ve bunun biraz sonra bahsedeceğim karakteristik anlamlı bir anlamı olduğunu unutmayın; ama elbette kesirli de olabilirler. Ayrıca belirli bir görevin içeriğine bağlı olarak hem “X” hem de “oyun” değerleri tamamen veya kısmen negatif olabilir. Bize "meçhul" bir görev verildi ve başlıyoruz çözüm:

Sistemin çözümü olarak optimal fonksiyonun katsayılarını buluyoruz:

Daha kompakt kayıt amacıyla, toplamanın 1'den .'ye kadar gerçekleştirildiği zaten açık olduğundan "sayaç" değişkeni çıkarılabilir.

Gerekli miktarları tablo halinde hesaplamak daha uygundur:


Hesaplamalar bir mikro hesap makinesinde yapılabilir, ancak Excel'i kullanmak çok daha iyidir - hem daha hızlı hem de hatasız; kısa bir video izleyin:

Böylece aşağıdakileri elde ederiz sistem:

Burada ikinci denklemi 3 ile çarpabilir ve 2.yi 1. denklemden terim bazında çıkar. Ancak bu şanstır; pratikte sistemler genellikle bir hediye değildir ve bu gibi durumlarda tasarruf sağlar Cramer'in yöntemi:
Bu, sistemin benzersiz bir çözümü olduğu anlamına gelir.

Hadi kontrol edelim. İstemediğinizi anlıyorum, ama neden kesinlikle gözden kaçırılmayacak hataları atlayasınız ki? Bulunan çözümü sistemdeki her denklemin sol tarafına koyalım:

Karşılık gelen denklemlerin sağ tarafları elde edilir, bu da sistemin doğru çözüldüğü anlamına gelir.

Böylece istenen yaklaşım fonksiyonu: – itibaren tüm doğrusal fonksiyonlar Deneysel verilere en iyi yaklaşan kişi odur.

Farklı dümdüz mağazanın cirosunun kendi alanına bağımlılığı, bulunan bağımlılık tersi (ilke “ne kadar çoksa o kadar az”) ve bu gerçek olumsuzluklarla hemen ortaya çıkıyor eğim. İşlev belirli bir göstergenin 1 birim artmasıyla bağımlı göstergenin değerinin azaldığını söyler ortalama 0,65 birim arttı. Dedikleri gibi karabuğdayın fiyatı ne kadar yüksek olursa o kadar az satılır.

Yaklaşım fonksiyonunun grafiğini çizmek için iki değerini buluyoruz:

ve çizimi yürütün:

Oluşturulan düz çizgiye denir eğilim çizgisi (yani doğrusal bir trend çizgisi, yani genel durumda bir trendin mutlaka düz bir çizgi olması gerekmez). Herkes “trendde olmak” tabirine aşinadır ve bu terimin ek yorumlara ihtiyacı olmadığını düşünüyorum.

Sapmaların karelerinin toplamını hesaplayalım Ampirik ve teorik değerler arasında. Geometrik olarak bu, "ahududu" bölümlerinin uzunluklarının karelerinin toplamıdır. (ikisi o kadar küçük ki görülemiyor bile).

Hesaplamaları bir tabloda özetleyelim:


Yine manuel olarak da yapılabilirler, ne olur ne olmaz diye 1. maddeye örnek vereyim:

ancak bunu zaten bilinen şekilde yapmak çok daha etkilidir:

Bir kez daha tekrarlıyoruz: Elde edilen sonucun anlamı nedir?İtibaren tüm doğrusal fonksiyonlar y fonksiyonu gösterge en küçüğüdür, yani ailesindeki en iyi yaklaşımdır. Ve bu arada, problemin son sorusu tesadüfi değil: ya önerilen üstel fonksiyon deneysel noktalara daha iyi yaklaşırsa?

Karşılık gelen kare sapmaların toplamını bulalım - ayırt etmek için bunları "epsilon" harfiyle göstereceğim. Teknik tamamen aynı:

Ve yine, her ihtimale karşı, 1. nokta için hesaplamalar:

Excel'de standart işlevi kullanıyoruz tecrübe (söz dizimi Excel Yardımında bulunabilir).

Çözüm: , bu, üstel fonksiyonun deneysel noktalara düz bir çizgiden daha kötü bir şekilde yaklaştığı anlamına gelir .

Ancak burada şunu da belirtmek gerekir ki “daha ​​kötüsü” henüz anlamına gelmiyor, Yanlış olan ne. Şimdi bu üstel fonksiyonun bir grafiğini oluşturdum - ve aynı zamanda noktaların yakınından geçiyor - öyle ki analitik araştırma olmadan hangi fonksiyonun daha doğru olduğunu söylemek zordur.

Bu, çözümü sonuçlandırıyor ve argümanın doğal değerleri sorusuna dönüyorum. Genellikle ekonomik veya sosyolojik olan çeşitli çalışmalarda, ayları, yılları veya diğer eşit zaman aralıklarını numaralandırmak için doğal “X”ler kullanılır. Örneğin aşağıdaki sorunu düşünün:

Mağazanın yılın ilk yarısına ilişkin perakende cirosuna ilişkin aşağıdaki veriler mevcuttur:

Analitik düz çizgi hizalamasını kullanarak Temmuz ayı ciro hacmini belirleyin.

Evet, sorun değil: 1, 2, 3, 4, 5, 6 aylarını numaralandırıyoruz ve olağan algoritmayı kullanıyoruz, bunun sonucunda bir denklem elde ediyoruz - tek şey, zaman geldiğinde genellikle şunu kullanıyorlar: "te" harfi (bu kritik olmasa da). Ortaya çıkan denklem, yılın ilk yarısında ticaret cirosunun ortalama 27,74 adet arttığını gösteriyor. her ay. Temmuz ayı tahminlerini alalım (ay no. 7): d.e.

Ve bunun gibi sayısız görev var. İsteyenler ek bir hizmet olan benim hizmetimden yararlanabilirler. Excel hesap makinesi (demo versiyonu), Hangi analiz edilen sorunu neredeyse anında çözer! Programın çalışan versiyonu mevcut karşılığında yada ... için sembolik ücret.

Dersin sonunda diğer bazı türlerdeki bağımlılıkların bulunması hakkında kısa bilgi verilecektir. Temel yaklaşım ve çözüm algoritması aynı kaldığı için aslında anlatacak pek bir şey yok.

Deney noktalarının düzeninin bir hiperbole benzediğini varsayalım. Daha sonra, en iyi hiperbolün katsayılarını bulmak için fonksiyonun minimumunu bulmanız gerekir; herkes ayrıntılı hesaplamalar yapabilir ve benzer bir sisteme ulaşabilir:

Resmi teknik açıdan bakıldığında “doğrusal” bir sistemden elde edilir. (yıldız işaretiyle belirtelim)"x" yerine "x" yazın. Peki ya miktarlar? hesaplayın, ardından optimal “a” ve “be” katsayılarını hesaplayın elinizin altında.

Bu noktalara inanmak için her türlü neden varsa logaritmik bir eğri boyunca bulunur, ardından optimum değerleri bulmak için fonksiyonun minimumunu buluruz . Resmi olarak, sistemde (*) şununla değiştirilmesi gerekir:

Excel'de hesaplamalar yaparken işlevi kullanın LN. Göz önünde bulundurulan her durum için hesap makineleri oluşturmanın benim için özellikle zor olmayacağını itiraf ediyorum, ancak yine de hesaplamaları kendiniz "programlasanız" daha iyi olur. Yardımcı olacak ders videoları.

Üstel bağımlılıkta durum biraz daha karmaşıktır. Maddeyi doğrusal duruma indirgemek için fonksiyonun logaritmasını alıp şunu kullanırız: logaritmanın özellikleri:

Şimdi, ortaya çıkan fonksiyonu doğrusal fonksiyonla karşılaştırarak, sistemde (*) yerine , ve – ile değiştirilmesi gerektiği sonucuna varıyoruz. Kolaylık sağlamak için şunu belirtelim:

Lütfen sistemin ve'ye göre çözüldüğünü ve bu nedenle kökleri bulduktan sonra katsayıyı bulmayı unutmamanız gerektiğini unutmayın.

Deneysel noktaları yakınlaştırmak için optimal parabol , bulunmalı üç değişkenli minimum fonksiyon. Standart eylemleri gerçekleştirdikten sonra aşağıdaki "çalışmayı" elde ederiz sistem:

Evet elbette burada daha fazla miktar var ama en sevdiğiniz uygulamayı kullanırken hiç zorluk yaşanmıyor. Son olarak, Excel'i kullanarak hızlı bir şekilde kontrolü nasıl gerçekleştireceğinizi ve istediğiniz trend çizgisini nasıl oluşturacağınızı anlatacağım: bir dağılım grafiği oluşturun, fareyle noktalardan herhangi birini seçin ve sağ tıklayıp seçeneği seçin "Trend çizgisi ekle". Ardından grafik türünü seçin ve sekmede "Seçenekler" seçeneği etkinleştir "Denklemleri diyagramda göster". TAMAM

Her zamanki gibi yazıyı güzel bir cümleyle bitirmek istiyorum ve neredeyse “Trend olun!” yazıyordum. Fakat zamanla fikrini değiştirdi. Ve kalıplaşmış olduğu için değil. Kimse için nasıldır bilmiyorum ama ben aslında tanıtılan Amerika ve özellikle Avrupa trendini takip etmek istemiyorum =) Bu nedenle, her birinizin kendi çizgisine bağlı kalmasını diliyorum!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

En küçük kareler yöntemi, en yaygın ve en gelişmiş yöntemlerden biridir. Doğrusal ekonometrik modellerin parametrelerini tahmin etmeye yönelik yöntemlerin basitliği ve etkinliği. Aynı zamanda, onu kullanırken bazı dikkatli olunmalıdır, çünkü onu kullanarak oluşturulan modeller, parametrelerinin kalitesine ilişkin bir dizi gereksinimi karşılamayabilir ve sonuç olarak süreç geliştirme kalıplarını "iyi" yansıtmayabilir. yeterli.

En küçük kareler yöntemini kullanarak doğrusal bir ekonometrik modelin parametrelerini tahmin etme prosedürünü daha ayrıntılı olarak ele alalım. Böyle bir model genel olarak denklem (1.2) ile temsil edilebilir:

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

a 0 , a 1 ,..., a n parametrelerini tahmin ederken ilk veriler, bağımlı değişkenin değerlerinin bir vektörüdür sen= (y 1 , y 2 , ... , y T)" ve bağımsız değişkenlerin değerleri matrisi

bunlardan oluşan ilk sütun model katsayısına karşılık gelir.

En küçük kareler yöntemi, adını, bu yönteme dayanarak elde edilen parametre tahminlerinin karşılaması gereken temel prensibe dayanarak almıştır: model hatasının karelerinin toplamı minimum olmalıdır.

En küçük kareler yöntemini kullanarak problem çözme örnekleri

Örnek 2.1. Ticari işletmenin 12 mağazadan oluşan bir ağı vardır ve faaliyetlerine ilişkin bilgiler tabloda sunulmaktadır. 2.1.

İşletmenin yönetimi, yıllık cironun büyüklüğünün mağazanın perakende alanına nasıl bağlı olduğunu bilmek istiyor.

Tablo 2.1

Mağaza numarası Yıllık ciro, milyon ruble. Perakende alanı, bin m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

En küçük kareler çözümü. Mağazanın yıllık cirosu milyon ruble olsun; - mağazanın perakende alanı, bin m2.

Şekil 2.1. Örnek 2.1 için Dağılım Grafiği

Değişkenler arasındaki fonksiyonel ilişkinin biçimini belirlemek için bir dağılım diyagramı oluşturacağız (Şekil 2.1).

Dağılım diyagramına dayanarak, yıllık cironun perakende alanına pozitif yönde bağlı olduğu sonucuna varabiliriz (yani, y arttıkça artacaktır). En uygun fonksiyonel bağlantı şekli doğrusal.

Daha ileri hesaplamalara ilişkin bilgiler tabloda sunulmaktadır. 2.2. En küçük kareler yöntemini kullanarak doğrusal tek faktörlü ekonometrik modelin parametrelerini tahmin ediyoruz

Tablo 2.2

T YT x 1 ton yt 2 x 1t 2 x 1t yt
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Ortalama 68,29 0,89

Böylece,

Dolayısıyla perakende alanının 1 bin m2 artmasıyla diğer koşullar eşit olduğunda ortalama yıllık ciro 67.8871 milyon ruble artıyor.

Örnek 2.2.Şirketin yönetimi, yıllık cironun yalnızca mağazanın satış alanına değil (bkz. örnek 2.1) değil aynı zamanda ortalama ziyaretçi sayısına da bağlı olduğunu fark etti. İlgili bilgiler tabloda sunulmaktadır. 2.3.

Tablo 2.3

Çözüm.Şunu belirtelim: Mağazanın günlük ortalama ziyaretçi sayısı bin kişi.

Değişkenler arasındaki fonksiyonel ilişkinin biçimini belirlemek için bir dağılım diyagramı oluşturacağız (Şekil 2.2).

Dağılım grafiğine dayanarak, yıllık cironun günlük ortalama ziyaretçi sayısına pozitif olarak bağlı olduğu sonucuna varabiliriz (yani, y arttıkça artacaktır). Fonksiyonel bağımlılığın şekli doğrusaldır.

Pirinç. 2.2. Örnek 2.2 için Dağılım Grafiği

Tablo 2.4

T x 2t x 2t 2 ytx2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Ortalama 10,65

Genel olarak iki faktörlü bir ekonometrik modelin parametrelerinin belirlenmesi gerekmektedir.

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

Daha ileri hesaplamalar için gerekli bilgiler tabloda sunulmaktadır. 2.4.

En küçük kareler yöntemini kullanarak doğrusal iki faktörlü ekonometrik modelin parametrelerini tahmin edelim.

Böylece,

Katsayının tahmini =61,6583, diğer koşullar eşit olduğunda perakende alanında 1 bin m 2 artışla yıllık cironun ortalama 61,6583 milyon ruble artacağını gösteriyor.

Katsayı tahmini = 2,2748, diğer koşullar eşit olmak kaydıyla 1 bin kişi başına düşen ortalama ziyaretçi sayısının arttığını gösteriyor. günlük ciro ortalama 2,2748 milyon ruble artacak.

Örnek 2.3. Tabloda sunulan bilgileri kullanma. 2.2 ve 2.4, tek faktörlü ekonometrik modelin parametresini tahmin edin

mağazanın yıllık cirosunun merkezi değeri nerede, milyon ruble; - t'inci mağazaya gelen günlük ortalama ziyaretçi sayısının merkezi değeri, bin kişi. (bkz. örnekler 2.1-2.2).

Çözüm. Hesaplamalar için gerekli ek bilgiler tabloda sunulmaktadır. 2.5.

Tablo 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Miktar 48,4344 431,0566

(2.35) formülünü kullanarak şunu elde ederiz:

Böylece,

http://www.cleverstudents.ru/articles/mnk.html

Örnek.

Değişkenlerin değerlerine ilişkin deneysel veriler X Ve en tabloda verilmektedir.

Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

Kullanma en küçük kareler yöntemi, bu verilere doğrusal bir bağımlılıkla yaklaşın y=ax+b(parametreleri bul A Ve B). İki çizgiden hangisinin (en küçük kareler yöntemi anlamında) deneysel verileri daha iyi hizaladığını bulun. Çizim yapmak.

Çözüm.

Örneğimizde n=5. Gerekli katsayıların formüllerinde yer alan tutarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

Tablonun dördüncü satırındaki değerler, her sayı için 2. satırdaki değerlerin 3. satırdaki değerlerle çarpılmasıyla elde edilir. Ben.

Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. Ben.

Tablonun son sütunundaki değerler satırlar arasındaki değerlerin toplamıdır.

Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz A Ve B. Tablonun son sütunundaki karşılık gelen değerleri bunların yerine koyarız:

Buradan, y = 0,165x+2,184- istenen yaklaşık düz çizgi.

Hangi satırlardan hangisinin olduğunu bulmak için kalır y = 0,165x+2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahmin yapar.

Kanıt.

Böylece bulunduğunda A Ve B Fonksiyon en küçük değeri alırsa, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. pozitif kesindi. Hadi gösterelim.

İkinci dereceden diferansiyel şu şekildedir:

Yani

Bu nedenle, ikinci dereceden formun matrisi şu forma sahiptir:

ve elemanların değerleri bağlı değildir A Ve B.

Matrisin pozitif tanımlı olduğunu gösterelim. Bunu yapmak için açısal küçüklerin pozitif olması gerekir.

Birinci dereceden açısal minör . Eşitsizlik kesindir, çünkü noktalar

  • öğretici

giriiş

Ben bir matematikçi ve programcıyım. Kariyerimde attığım en büyük adım şunu söylemeyi öğrendiğim zamandı: "Hiç birşey anlamıyorum!" Artık bilimin aydınına bana ders verdiğini, onun, aydının bana ne söylediğini anlamadığımı söylemekten utanmıyorum. Ve bu çok zor. Evet, cehaletinizi kabul etmek zor ve utanç vericidir. Kim bir şeyin temellerini bilmediğini itiraf etmekten hoşlanır? Mesleğim gereği çok sayıda sunum ve derse katılmak zorunda kalıyorum ve itiraf etmeliyim ki çoğu durumda hiçbir şey anlamadığım için uyumak istiyorum. Ama anlamıyorum çünkü bilimdeki mevcut durumun en büyük sorunu matematikte yatıyor. Tüm dinleyicilerin matematiğin tüm alanlarına kesinlikle aşina olduklarını varsayar (ki bu saçmadır). Türevin ne olduğunu bilmediğinizi kabul etmek (ne olduğuna biraz sonra değineceğiz) utanç vericidir.

Ama çarpmanın ne olduğunu bilmediğimi söylemeyi öğrendim. Evet, Lie cebiri üzerindeki alt cebirin ne olduğunu bilmiyorum. Evet, hayatta ikinci dereceden denklemlere neden ihtiyaç duyulduğunu bilmiyorum. Bu arada, bildiğinden eminsen konuşacak bir şeyimiz var demektir! Matematik bir dizi hiledir. Matematikçiler halkın kafasını karıştırmaya ve gözünü korkutmaya çalışırlar; Karışıklığın olmadığı yerde itibar da olmaz, otorite de olmaz. Evet, olabildiğince soyut bir dille konuşmak prestijlidir ki bu da tam bir saçmalıktır.

Türevin ne olduğunu biliyor musun? Büyük ihtimalle bana fark oranının limitini anlatacaksınız. St.Petersburg Devlet Üniversitesi'nde matematik ve mekaniğin ilk yılında Viktor Petrovich Khavin bana şunları söyledi: azimli Bir fonksiyonun Taylor serisinin ilk teriminin katsayısı olarak türev (bu, türevsiz Taylor serisini belirlemek için ayrı bir jimnastikti). Sonunda neyle ilgili olduğunu anlayana kadar bu tanıma uzun süre güldüm. Türev, türevini aldığımız fonksiyonun y=x, y=x^2, y=x^3 fonksiyonuna ne kadar benzer olduğunun basit bir ölçüsünden başka bir şey değildir.

Artık öğrencilere ders verme onuruna sahibim. korkmuş matematik. Eğer matematikten korkuyorsanız biz de aynı yoldayız. Bir metni okumaya çalıştığınızda ve size aşırı karmaşık göründüğünde, bunun kötü yazıldığını bilin. Doğruluğunu kaybetmeden “parmaklarda” tartışılamayacak tek bir matematik alanı olmadığını iddia ediyorum.

Yakın gelecek için ödev: Öğrencilerime doğrusal ikinci dereceden düzenleyicinin ne olduğunu anlamalarını verdim. Utanmayın, hayatınızın üç dakikasını geçirin ve bağlantıyı takip edin. Eğer hiçbir şey anlamıyorsan, o zaman aynı yoldayız. Ben (profesyonel bir matematikçi-programcı) da hiçbir şey anlamadım. Ve sizi temin ederim ki, bunu "parmaklarınızla" çözebilirsiniz. Şu anda ne olduğunu bilmiyorum ama sizi temin ederim ki çözebileceğiz.

Öğrencilerim dehşet içinde yanıma gelip doğrusal-ikinci dereceden düzenleyicinin hayatınızda asla ustalaşamayacağınız berbat bir şey olduğunu söylediklerinde onlara vereceğim ilk ders şu olacaktır: en küçük kareler yöntemleri. Doğrusal denklemleri çözebilir misiniz? Bu metni okuyorsanız, büyük olasılıkla hayır.

Yani, (x0, y0), (x1, y1) gibi iki nokta (1,1) ve (3,2) verildiğinde görev, bu iki noktadan geçen çizginin denklemini bulmaktır:

illüstrasyon

Bu satırın aşağıdaki gibi bir denklemi olması gerekir:

Burada alfa ve beta bizim tarafımızdan bilinmiyor, ancak bu doğrunun iki noktası biliniyor:

Bu denklemi matris formunda yazabiliriz:

Burada lirik bir inceleme yapmalıyız: matris nedir? Bir matris, iki boyutlu bir diziden başka bir şey değildir. Bu, veri saklamanın bir yoludur; buna başka bir anlam yüklenmemelidir. Belirli bir matrisin tam olarak nasıl yorumlanacağı bize bağlıdır. Periyodik olarak bunu doğrusal bir haritalama olarak, periyodik olarak ikinci dereceden bir form olarak ve bazen de basitçe bir vektör kümesi olarak yorumlayacağım. Bunların hepsi bağlamda açıklığa kavuşturulacaktır.

Somut matrisleri sembolik temsilleriyle değiştirelim:

O zaman (alfa, beta) kolayca bulunabilir:

Daha spesifik olarak önceki verilerimiz için:

Bu, (1,1) ve (3,2) noktalarından geçen doğrunun aşağıdaki denklemine yol açar:

Tamam, burada her şey açık. İçinden geçen doğrunun denklemini bulalım üç puanlar: (x0,y0), (x1,y1) ve (x2,y2):

Oh-oh-oh, ama iki bilinmeyen için üç denklemimiz var! Standart bir matematikçi çözümün olmadığını söyleyecektir. Programcı ne diyecek? Ve ilk önce önceki denklem sistemini aşağıdaki biçimde yeniden yazacak:

Bizim durumumuzda i, j, b vektörleri üç boyutludur, dolayısıyla (genel durumda) bu sistemin çözümü yoktur. Herhangi bir vektör (alfa\*i + beta\*j), (i, j) vektörlerinin kapsadığı düzlemde yer alır. Eğer b bu düzleme ait değilse çözüm yoktur (denklemde eşitlik sağlanamaz). Ne yapalım? Bir uzlaşma arayalım. ile belirtelim e(alfa, beta) eşitliği tam olarak ne kadar sağlayamadık:

Ve bu hatayı en aza indirmeye çalışacağız:

Neden kare?

Sadece normun minimumunu değil, normun karesinin minimumunu da arıyoruz. Neden? Minimum noktanın kendisi çakışır ve kare düzgün bir fonksiyon verir (argümanların ikinci dereceden bir fonksiyonu (alfa, beta)), oysa basitçe uzunluk, minimum noktada türevlenemeyen koni şeklinde bir fonksiyon verir. Br. Bir kare daha uygundur.

Açıkçası, vektör kullanıldığında hata en aza indirilir. e vektörlerin kapsadığı düzleme dik Ben Ve J.

İllüstrasyon

Başka bir deyişle: tüm noktalardan bu düz çizgiye olan mesafelerin kare uzunluklarının toplamı minimum olacak şekilde bir düz çizgi arıyoruz:

GÜNCELLEME: Burada bir sorunum var, düz çizgiye olan mesafe dik projeksiyonla değil dikey olarak ölçülmeli. Bu yorumcu haklı.

İllüstrasyon

Tamamen farklı bir deyişle (dikkatlice, kötü biçimlendirilmiş, ancak açık olmalı): tüm nokta çiftleri arasındaki olası tüm çizgileri alıyoruz ve hepsi arasındaki ortalama çizgiyi arıyoruz:

İllüstrasyon

Diğer bir açıklama ise basittir: Tüm veri noktaları (burada üç tane var) ile aradığımız düz çizgi arasına bir yay iliştiriyoruz ve denge durumunun düz çizgisi tam olarak aradığımız şeydir.

Minimum ikinci dereceden form

Yani bu vektör verildiğinde B ve matrisin sütun vektörleri tarafından yayılan bir düzlem A(bu durumda (x0,x1,x2) ve (1,1,1)), vektörü arıyoruz e Minimum kare uzunluğunda. Açıkçası, minimum değere yalnızca vektör için ulaşılabilir. e, matrisin sütun vektörlerinin kapsadığı düzleme dik A:

Başka bir deyişle, şöyle bir x=(alfa, beta) vektörü arıyoruz:

Bu x=(alfa, beta) vektörünün ikinci dereceden ||e(alfa, beta)||^2 fonksiyonunun minimumu olduğunu hatırlatmama izin verin:

Burada matrisin ikinci dereceden form olarak da yorumlanabileceğini hatırlamak faydalı olacaktır; örneğin birim matris ((1,0),(0,1)) x^2 + y^ fonksiyonu olarak yorumlanabilir. 2:

ikinci dereceden form

Bütün bu jimnastik doğrusal regresyon adı altında bilinir.

Dirichlet sınır koşuluyla Laplace denklemi

Şimdi en basit gerçek görev: belirli bir üçgen yüzey var, onu düzeltmek gerekiyor. Örneğin yüzümün bir modelini yükleyelim:

Orijinal taahhüt mevcuttur. Dış bağımlılıkları en aza indirmek için halihazırda Habré'de bulunan yazılım oluşturucumun kodunu aldım. Doğrusal bir sistemi çözmek için OpenNL kullanıyorum, bu mükemmel bir çözücüdür, ancak kurulumu çok zordur: iki dosyayı (.h+.c) projenizin bulunduğu klasöre kopyalamanız gerekir. Tüm yumuşatma aşağıdaki kodla yapılır:

İçin (int d=0; d<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; i&yüz = yüzler[i]; for (int j=0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y ve Z koordinatları ayrılabilir, ayrı ayrı düzeltiyorum. Yani, her biri modelimdeki köşe sayısına eşit sayıda değişken içeren üç doğrusal denklem sistemini çözüyorum. A matrisinin ilk n satırı, satır başına yalnızca bir 1'e sahiptir ve b vektörünün ilk n satırı, orijinal model koordinatlarına sahiptir. Yani tepe noktasının yeni konumu ile tepe noktasının eski konumu arasına bir yay bağlıyorum - yeniler eskilerinden çok uzaklaşmamalı.

A matrisinin sonraki tüm satırları (faces.size()*3 = ağdaki tüm üçgenlerin kenarlarının sayısı), bir kez 1 ve bir kez -1 oluşumuna sahiptir; b vektörü, bunun karşısında sıfır bileşene sahiptir. Bu, üçgen ağımızın her bir kenarına bir yay koyduğum anlamına gelir: tüm kenarlar, başlangıç ​​ve bitiş noktalarıyla aynı tepe noktasını almaya çalışır.

Bir kez daha tekrarlayalım: tüm köşeler değişkendir ve orijinal konumlarından uzaklaşamazlar ancak aynı zamanda birbirlerine benzemeye çalışırlar.

İşte sonuç:

Her şey yoluna girecekti, model gerçekten yumuşatıldı ama orijinal kenarından uzaklaştı. Kodu biraz değiştirelim:

İçin (int i=0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

A matrisimizde kenardaki köşeler için v_i = verts[i][d] kategorisinden bir satır değil, 1000*v_i = 1000*verts[i][d] kategorisinden bir satır ekliyorum. Neyi değiştirir? Bu da ikinci dereceden hata biçimimizi değiştiriyor. Artık kenarda üstten tek bir sapma, eskisi gibi bir birime değil, 1000*1000 birime mal olacak. Yani uç köşelere daha güçlü bir yay astık, çözüm diğerlerini daha güçlü bir şekilde germeyi tercih edecek. İşte sonuç:

Köşeler arasındaki yay kuvvetini ikiye katlayalım:
nlKatsayısı(yüz[ j ], 2); nlKatsayısı(yüz[(j+1)%3], -2);

Yüzeyin daha pürüzsüz hale gelmesi mantıklıdır:

Ve şimdi yüz kat daha güçlü:

Bu nedir? Bir tel halkayı sabunlu suya batırdığımızı hayal edin. Sonuç olarak, ortaya çıkan sabun filmi, sınıra - tel halkamıza - dokunarak mümkün olduğunca az eğriliğe sahip olmaya çalışacaktır. Sınırı sabitleyerek ve içeride pürüzsüz bir yüzey isteyerek elde ettiğimiz şey tam olarak budur. Tebrikler, Laplace denklemini Dirichlet sınır koşullarıyla çözdük. Kulağa hoş geliyor mu? Ancak gerçekte tek bir doğrusal denklem sistemini çözmeniz yeterlidir.

Poisson denklemi

Başka bir güzel ismi hatırlayalım.

Diyelim ki şöyle bir resmim var:

Herkese iyi görünüyor ama sandalyeyi sevmiyorum.

Resmi ikiye böleceğim:



Ve ellerimle bir sandalye seçeceğim:

Daha sonra maskede beyaz olan her şeyi resmin sol tarafına çekeceğim ve aynı zamanda resim boyunca iki komşu piksel arasındaki farkın sağdaki iki komşu piksel arasındaki farka eşit olması gerektiğini söyleyeceğim. resim:

İçin (int i=0; i

İşte sonuç:

Kod ve resimler mevcut

Sıradan En Küçük Kareler (OLS) yöntemi- belirli fonksiyonların istenen değişkenlerden sapmalarının karelerinin toplamının en aza indirilmesine dayanan, çeşitli problemleri çözmek için kullanılan matematiksel bir yöntem. Aşırı belirlenmiş denklem sistemlerini “çözmek” için (denklem sayısı bilinmeyenlerin sayısını aştığında), sıradan (aşırı belirlenmemiş) doğrusal olmayan denklem sistemleri durumunda çözümler bulmak, bazılarının nokta değerlerine yaklaşmak için kullanılabilir. işlev. OLS, örnek verilerden regresyon modellerinin bilinmeyen parametrelerini tahmin etmek için kullanılan temel regresyon analizi yöntemlerinden biridir.

Ansiklopedik YouTube

    1 / 5

    ✪ En küçük kareler yöntemi. Ders

    ✪ Mitin I.V. - Fiziksel sonuçların işlenmesi. deney - En küçük kareler yöntemi (Ders 4)

    ✪ En küçük kareler yöntemi, ders 1/2. Doğrusal fonksiyon

    ✪ Ekonometri. Ders 5. En Küçük Kareler Yöntemi

    ✪ En küçük kareler yöntemi. Yanıtlar

    Altyazılar

Hikaye

19. yüzyılın başlarına kadar. bilim adamlarının, bilinmeyenlerin sayısının denklem sayısından az olduğu bir denklem sistemini çözmek için belirli kuralları yoktu; O zamana kadar denklemlerin türüne ve hesap makinelerinin zekasına bağlı özel teknikler kullanıldı ve bu nedenle aynı gözlem verilerine dayanan farklı hesap makineleri farklı sonuçlara vardı. Bu yöntemi ilk kullanan Gauss (1795) oldu ve Legendre (1805) bunu bağımsız olarak keşfedip modern adı (Fransızca) altında yayınladı. En İyi Yöntemler). Laplace yöntemi olasılık teorisiyle ilişkilendirdi ve Amerikalı matematikçi Adrain (1808) onun olasılık teorisi uygulamalarını değerlendirdi. Yöntem, Encke, Bessel, Hansen ve diğerlerinin daha ileri araştırmalarıyla yaygınlaştırıldı ve geliştirildi.

En küçük kareler yönteminin özü

İzin vermek x (\displaystyle x)- kit n (\displaystyle n) bilinmeyen değişkenler (parametreler), f ben (x) (\displaystyle f_(i)(x)), , m > n (\displaystyle m>n)- bu değişkenler kümesinden bir dizi işlev. Görev bu değerleri seçmektir x (\displaystyle x) böylece bu fonksiyonların değerleri belirli değerlere mümkün olduğunca yakın olur. y ben (\displaystyle y_(i)). Esasen aşırı belirlenmiş bir denklem sisteminin “çözümünden” bahsediyoruz f ben (x) = y ben (\displaystyle f_(i)(x)=y_(i)), i = 1 , … , m (\displaystyle i=1,\ldots ,m) sistemin sol ve sağ kısımlarının belirtilen maksimum yakınlığı anlamında. En küçük kareler yönteminin özü, sol ve sağ tarafların sapmalarının karelerinin toplamını bir “yakınlık ölçüsü” olarak seçmektir. | f ben (x) − y ben | (\displaystyle |f_(i)(x)-y_(i)|). Dolayısıyla MNC'nin özü şu şekilde ifade edilebilir:

∑ ben e ben 2 = ∑ ben (y ben − f ben (x)) 2 → min x (\displaystyle \sum _(i)e_(i)^(2)=\sum _(i)(y_(i)-f_( i)(x))^(2)\rightarrow \min _(x)).

Denklem sisteminin bir çözümü varsa, kareler toplamının minimumu sıfıra eşit olacaktır ve denklem sisteminin kesin çözümleri analitik olarak veya örneğin çeşitli sayısal optimizasyon yöntemleri kullanılarak bulunabilir. Sistem aşırı belirlenmişse, yani genel anlamda bağımsız denklemlerin sayısı istenen değişkenlerin sayısından fazlaysa, o zaman sistemin kesin bir çözümü yoktur ve en küçük kareler yöntemi bazı "optimal" vektörleri bulmamıza olanak tanır. x (\displaystyle x) vektörlerin maksimum yakınlığı anlamında y (\displaystyle y) Ve f (x) (\displaystyle f(x)) veya sapma vektörünün maksimum yakınlığı e (\displaystyle e) sıfıra (yakınlık Öklid uzaklığı anlamında anlaşılmaktadır).

Örnek - doğrusal denklem sistemi

Özellikle, en küçük kareler yöntemi bir doğrusal denklem sistemini "çözmek" için kullanılabilir.

A x = b (\displaystyle Ax=b),

Nerede bir (\displaystyle A) dikdörtgen boyutlu matris m × n , m > n (\displaystyle m\times n,m>n)(yani A matrisinin satır sayısı aranan değişken sayısından daha fazladır).

Genel durumda böyle bir denklem sisteminin çözümü yoktur. Dolayısıyla bu sistem ancak böyle bir vektörün seçilmesi anlamında “çözülebilir” x (\displaystyle x) vektörler arasındaki "mesafeyi" en aza indirmek için A x (\displaystyle Ax) Ve b (\displaystyle b). Bunu yapmak için sistem denklemlerinin sol ve sağ tarafları arasındaki farkların karelerinin toplamını en aza indirme kriterini uygulayabilirsiniz; (A x − b) T (A x − b) → min (\displaystyle (Ax-b)^(T)(Ax-b)\rightarrow \min ). Bu minimizasyon problemini çözmenin aşağıdaki denklem sisteminin çözümüne yol açtığını göstermek kolaydır.

A T A x = A T b ⇒ x = (A T A) − 1 A T b (\displaystyle A^(T)Ax=A^(T)b\Rightarrow x=(A^(T)A)^(-1)A^ (T)b).

Regresyon analizinde OLS (veri yaklaşımı)

Olsun n (\displaystyle n) bazı değişkenlerin değerleri y (\displaystyle y)(bu gözlemlerin, deneylerin vb. sonuçları olabilir) ve ilgili değişkenler x (\displaystyle x). Buradaki zorluk, arasındaki ilişkinin sağlanmasıdır. y (\displaystyle y) Ve x (\displaystyle x) bazı bilinmeyen parametreler dahilinde bilinen bazı fonksiyonlara göre yaklaşık b (\displaystyle b) yani aslında parametrelerin en iyi değerlerini bulmak b (\displaystyle b) değerlerin maksimuma yakınlaştırılması f (x , b) (\displaystyle f(x,b)) gerçek değerlere y (\displaystyle y). Aslında bu, aşırı belirlenmiş bir denklem sisteminin "çözülmesi" durumuna gelir. b (\displaystyle b):

F (x t , b) = y t , t = 1 , … , n (\displaystyle f(x_(t),b)=y_(t),t=1,\ldots ,n).

Regresyon analizinde ve özellikle ekonometride değişkenler arasındaki olasılıksal bağımlılık modelleri kullanılır

Y t = f (x t , b) + ε t (\displaystyle y_(t)=f(x_(t),b)+\varepsilon _(t)),

Nerede ε t (\displaystyle \varepsilon _(t))- Lafta rastgele hatalar modeller.

Buna göre gözlenen değerlerin sapmaları y (\displaystyle y) modelden f (x , b) (\displaystyle f(x,b)) modelin kendisinde zaten varsayılmaktadır. En küçük kareler yönteminin (sıradan, klasik) özü bu tür parametreleri bulmaktır. b (\displaystyle b), burada sapmaların karelerinin toplamı (hatalar, regresyon modelleri için bunlara genellikle regresyon artıkları denir) e t (\displaystyle e_(t)) minimum olacaktır:

b ^ O L S = arg ⁡ min b R S S (b) (\displaystyle (\hat (b))_(OLS)=\arg \min _(b)RSS(b)),

Nerede R S S (\displaystyle RSS)- İngilizce Artık Kareler Toplamı şu şekilde tanımlanır:

R S S (b) = e T e = ∑ t = 1 n e t 2 = ∑ t = 1 n (y t − f (x t , b)) 2 (\displaystyle RSS(b)=e^(T)e=\sum _ (t=1)^(n)e_(t)^(2)=\toplam _(t=1)^(n)(y_(t)-f(x_(t),b))^(2) ).

Genel durumda bu problem sayısal optimizasyon (minimizasyon) yöntemleriyle çözülebilir. Bu durumda onlar hakkında konuşuyorlar doğrusal olmayan en küçük kareler(NLS veya NLLS - İngilizce Doğrusal Olmayan En Küçük Kareler). Çoğu durumda analitik bir çözüm elde etmek mümkündür. Minimizasyon problemini çözmek için fonksiyonun durağan noktalarının bulunması gerekir. R S S (b) (\displaystyle RSS(b)) bilinmeyen parametrelere göre ayırt edilmesi b (\displaystyle b), türevleri sıfıra eşitlemek ve elde edilen denklem sistemini çözmek:

∑ t = 1 n (y t − f (x t , b)) ∂ f (x t , b) ∂ b = 0 (\displaystyle \sum _(t=1)^(n)(y_(t)-f(x_) (t),b))(\frac (\kısmi f(x_(t),b))(\kısmi b))=0).

Doğrusal regresyon durumunda OLS

Regresyon bağımlılığının doğrusal olmasına izin verin:

y t = ∑ j = 1 k b j x t j + ε = x t T b + ε t (\displaystyle y_(t)=\sum _(j=1)^(k)b_(j)x_(tj)+\varepsilon =x_( t)^(T)b+\varepsilon _(t)).

İzin vermek sen açıklanan değişkenin gözlemlerinin sütun vektörüdür ve X (\displaystyle X)- Bu (n × k) (\displaystyle ((n\time k)))-faktör gözlemlerinin matrisi (matrisin satırları, belirli bir gözlemdeki faktör değerlerinin vektörleridir, sütunlar, tüm gözlemlerdeki belirli bir faktörün değerlerinin bir vektörüdür). Doğrusal modelin matris gösterimi şu şekildedir:

y = X b + ε (\displaystyle y=Xb+\varepsilon ).

Daha sonra açıklanan değişkenin tahmin vektörü ile regresyon artıklarının vektörü eşit olacaktır.

y ^ = X b , e = y − y ^ = y − X b (\displaystyle (\hat (y))=Xb,\quad e=y-(\hat (y))=y-Xb).

Buna göre regresyon artıklarının kareleri toplamı şuna eşit olacaktır:

R S S = e T e = (y − X b) T (y − X b) (\displaystyle RSS=e^(T)e=(y-Xb)^(T)(y-Xb)).

Bu fonksiyonun parametre vektörüne göre türevini almak b (\displaystyle b) ve türevleri sıfıra eşitleyerek bir denklem sistemi elde ederiz (matris formunda):

(X T X) b = X T y (\displaystyle (X^(T)X)b=X^(T)y).

Şifresi çözülmüş matris formunda bu denklem sistemi şuna benzer:

(∑ x t 1 2 ∑ x t 1 x t 2 ∑ x t 1 x t 3 … ∑ x t 1 x t k ∑ x t 2 x t 1 ∑ x t 2 2 ∑ x t 2 x t 3 … ∑ x t 2 x t k ∑ x t 3 x t 1 ∑ x t 3 x t 2 ∑ x t 3 2 … ∑ x t 3 x t k ⋮ ⋮ ⋮ ⋱ ⋮ ∑ x t k x t 1 ∑ x t k x t 2 ∑ x t k x t 3 … ∑ x t k 2) (b 1 b 2 b 3 ⋮ b k) = (∑ x t 1 y t ∑ x t 2 y t ∑ x t 3 y t ⋮ ∑ x t k y t) , (\displaystyle (\begin(pmatrix)\toplam x_(t1)^(2)&\toplam x_(t1)x_(t2)&\toplam x_(t1)x_(t3)&\ldots &\toplam x_(t1)x_(tk)\\\toplam x_(t2)x_(t1)&\toplam x_(t2)^(2)&\toplam x_(t2)x_(t3)&\ldots &\ toplam x_(t2)x_(tk)\\\toplam x_(t3)x_(t1)&\toplam x_(t3)x_(t2)&\toplam x_(t3)^(2)&\ldots &\sum x_ (t3)x_(tk)\\\vdots &\vdots &\vdots &\ddots &\vdots \\\toplam x_(tk)x_(t1)&\toplam x_(tk)x_(t2)&\toplam x_ (tk)x_(t3)&\ldots &\toplam x_(tk)^(2)\\\end(pmatrix))(\begin(pmatrix)b_(1)\\b_(2)\\b_(3 )\\\vdots \\b_(k)\\\end(pmatrix))=(\begin(pmatrix)\sum x_(t1)y_(t)\\\sum x_(t2)y_(t)\\ \sum x_(t3)y_(t)\\\vdots \\\sum x_(tk)y_(t)\\\end(pmatrix))),) tüm toplamların tüm geçerli değerler üzerinden alındığı yer t (\displaystyle t).

Modele bir sabit dahil edilmişse (her zamanki gibi), o zaman x t 1 = 1 (\displaystyle x_(t1)=1) herkesin önünde t (\displaystyle t) bu nedenle denklem sistemi matrisinin sol üst köşesinde gözlem sayısı vardır n (\displaystyle n) ve ilk satırın ve ilk sütunun geri kalan öğelerinde - yalnızca değişken değerlerinin toplamları: ∑ x t j (\displaystyle \toplam x_(tj)) ve sistemin sağ tarafındaki ilk eleman ∑ y t (\displaystyle \toplam y_(t)).

Bu denklem sisteminin çözümü, doğrusal bir model için en küçük kareler tahminlerinin genel formülünü verir:

b ^ Ö L S = (X T X) − 1 X T y = (1 n X T X) − 1 1 n X T y = V x − 1 C x y (\displaystyle (\hat (b))_(OLS)=(X^(T) )X)^(-1)X^(T)y=\left((\frac (1)(n))X^(T)X\right)^(-1)(\frac (1)(n ))X^(T)y=V_(x)^(-1)C_(xy)).

Analitik amaçlar için, bu formülün son temsilinin faydalı olduğu ortaya çıkıyor (denklem sisteminde n'ye bölünürken toplamlar yerine aritmetik ortalamalar görünür). Bir regresyon modelinde veriler merkezli, o zaman bu gösterimde ilk matris, faktörlerin örnek bir kovaryans matrisi anlamına gelir ve ikincisi, faktörlerin bağımlı değişkenle kovaryanslarının bir vektörüdür. Ayrıca veriler aynı zamanda normalleştirilmiş MSE'ye (yani sonuçta standartlaştırılmış), o zaman ilk matris, faktörlerin örnek korelasyon matrisi anlamına gelir, ikinci vektör, faktörlerin bağımlı değişkenle örnek korelasyonlarının bir vektörüdür.

Modeller için OLS tahminlerinin önemli bir özelliği sabit ile- oluşturulan regresyonun çizgisi örnek verilerin ağırlık merkezinden geçer, yani eşitlik sağlanır:

y ¯ = b 1 ^ + ∑ j = 2 k b ^ j x ¯ j (\displaystyle (\bar (y))=(\hat (b_(1)))+\sum _(j=2)^(k) (\hat (b))_(j)(\bar (x))_(j)).

Özellikle, tek regresörün bir sabit olduğu uç durumda, tek parametrenin (sabitin kendisi) OLS tahmininin, açıklanan değişkenin ortalama değerine eşit olduğunu buluruz. Yani, büyük sayılar yasalarından iyi özellikleriyle bilinen aritmetik ortalama, aynı zamanda en küçük kareler tahminidir - ondan sapmaların minimum kare toplamı kriterini karşılar.

En basit özel durumlar

Eşleştirilmiş doğrusal regresyon durumunda y t = a + b x t + ε t (\displaystyle y_(t)=a+bx_(t)+\varepsilon _(t)) Bir değişkenin diğerine doğrusal bağımlılığı tahmin edildiğinde hesaplama formülleri basitleştirilir (matris cebiri olmadan yapabilirsiniz). Denklem sistemi şu şekildedir:

(1 x ¯ x ¯ x 2 ¯) (a b) = (y ¯ x y ¯) (\displaystyle (\begin(pmatrix)1&(\bar (x))\\(\bar (x))&(\bar (x^(2)))\\\end(pmatrix)(\begin(pmatrix)a\\b\\\end(pmatrix))=(\begin(pmatrix)(\bar (y))\\ (\overline (xy))\\\end(pmatrix))).

Buradan katsayı tahminlerini bulmak kolaydır:

( b ^ = Cov ⁡ (x , y) Var ⁡ (x) = x y ¯ − x ¯ y ¯ x 2 ¯ − x ¯ 2 , a ^ = y ¯ − b x ¯ . (\displaystyle (\begin(cases) (\hat (b))=(\frac (\mathop (\textrm (Cov)) (x,y))(\mathop (\textrm (Var)) (x)))=(\frac ((\overline) (xy))-(\bar (x))(\bar (y))))((\overline (x^(2))))-(\overline (x))^(2))),\\( \hat (a))=(\bar (y))-b(\bar (x))).\end(cases)))

Genel durumda sabitli modellerin tercih edilmesi gerçeğine rağmen, bazı durumlarda teorik değerlendirmelerden sabitin olduğu bilinmektedir. a (\displaystyle a) sıfıra eşit olmalıdır. Örneğin fizikte gerilim ve akım arasındaki ilişki şöyledir: U = I ⋅ R (\displaystyle U=I\cdot R); Gerilim ve akımı ölçerken direnci tahmin etmek gerekir. Bu durumda modelden bahsediyoruz. y = b x (\displaystyle y=bx). Bu durumda bir denklem sistemi yerine tek bir denklemimiz olur

(∑ x t 2) b = ∑ x t y t (\displaystyle \sol(\toplam x_(t)^(2)\sağ)b=\toplam x_(t)y_(t)).

Bu nedenle, tek katsayıyı tahmin etmeye yönelik formül şu şekildedir:

B ^ = ∑ t = 1 n x t y t ∑ t = 1 n x t 2 = x y ¯ x 2 ¯ (\displaystyle (\hat (b))=(\frac (\sum _(t=1)^(n)x_(t) )y_(t))(\toplam _(t=1)^(n)x_(t)^(2)))=(\frac (\overline (xy))(\overline (x^(2)) ))).

Bir polinom modelinin durumu

Veriler bir değişkenin polinom regresyon fonksiyonuna uyuyorsa f (x) = b 0 + ∑ ben = 1 k b ben x ben (\displaystyle f(x)=b_(0)+\sum \limits _(i=1)^(k)b_(i)x^(i)) o zaman dereceleri algılamak x ben (\displaystyle x^(i)) her biri için bağımsız faktörler olarak ben (\displaystyle i) Doğrusal bir modelin parametrelerini tahmin etmeye yönelik genel formüle dayalı olarak model parametrelerini tahmin etmek mümkündür. Bunu yapmak için genel formülde böyle bir yorumla dikkate alınması yeterlidir. x t ben x t j = x t ben x t j = x t ben + j (\displaystyle x_(ti)x_(tj)=x_(t)^(i)x_(t)^(j)=x_(t)^(i+j)) Ve x t j y t = x t j y t (\displaystyle x_(tj)y_(t)=x_(t)^(j)y_(t)). Sonuç olarak, bu durumda matris denklemleri şu şekli alacaktır:

(n ∑ n x t … ∑ n x t k ∑ n x t ∑ n x ben 2 … ∑ m x ben k + 1 ⋮ ⋮ ⋱ ⋮ ∑ n x t k ∑ n x t k + 1 … ∑ n x t 2 k) [ b 0 b 1 ⋮ b k ] = [ ∑ n y t ∑ n x t y t ⋮ ∑ n x t k y t ] . (\displaystyle (\begin(pmatrix)n&\toplam \limits _(n)x_(t)&\ldots &\sum \limits _(n)x_(t)^(k)\\\toplam \limits _( n)x_(t)&\sum \limits _(n)x_(i)^(2)&\ldots &\sum \limits _(m)x_(i)^(k+1)\\\vdots & \vdots &\ddots &\vdots \\\sum \limits _(n)x_(t)^(k)&\sum \limits _(n)x_(t)^(k+1)&\ldots &\ toplam \limits _(n)x_(t)^(2k)\end(pmatrix))(\begin(bmatrix)b_(0)\\b_(1)\\\vdots \\b_(k)\end( bmatrix))=(\begin(bmatrix)\sum \limits _(n)y_(t)\\\sum \limits _(n)x_(t)y_(t)\\\vdots \\\sum \limits _(n)x_(t)^(k)y_(t)\end(bmatrix))).)

OLS tahmincilerinin istatistiksel özellikleri

Öncelikle yukarıdaki formülden de anlaşılacağı gibi doğrusal modeller için OLS tahminlerinin doğrusal tahminler olduğunu not ediyoruz. Tarafsız OLS tahminleri için, regresyon analizinin en önemli koşulunu yerine getirmek gerekli ve yeterlidir: faktörlere bağlı olarak rastgele bir hatanın matematiksel beklentisi sıfıra eşit olmalıdır. Bu koşul, özellikle şu durumlarda karşılanır:

  1. rastgele hataların matematiksel beklentisi sıfırdır ve
  2. faktörler ve rastgele hatalar bağımsız rastgele  değişkenlerdir.

İkinci koşul - faktörlerin dışsallığı koşulu - temeldir. Bu özellik karşılanmazsa, hemen hemen tüm tahminlerin son derece yetersiz olacağını varsayabiliriz: tutarlı bile olmayacaklar (yani, çok büyük miktarda veri bile bu durumda yüksek kaliteli tahminler elde etmemize izin vermiyor) ). Klasik durumda, dışsallık koşulunun otomatik olarak karşılandığı anlamına gelen rastgele hatanın aksine, faktörlerin determinizmi hakkında daha güçlü bir varsayım yapılır. Genel durumda tahminlerin tutarlılığı için matrisin yakınsaması ile birlikte dışsallık koşulunun sağlanması yeterlidir. Vx (\displaystyle V_(x))Örnek boyutu sonsuza arttıkça bazı tekil olmayan matrislere.

Tutarlılık ve tarafsızlığa ek olarak (sıradan) en küçük kareler tahminlerinin de etkili olabilmesi için (doğrusal tarafsız tahminler sınıfının en iyisi), rastgele hatanın ek özelliklerinin karşılanması gerekir:

Bu varsayımlar rastgele hata vektörünün kovaryans matrisi için formüle edilebilir. V (ε) = σ 2 I (\displaystyle V(\varepsilon)=\sigma ^(2)I).

Bu koşulları sağlayan doğrusal modele denir. klasik. Klasik doğrusal regresyon için OLS tahminleri tarafsızdır, tutarlıdır ve tüm doğrusal tarafsız tahminler sınıfındaki en etkili tahminlerdir (İngiliz literatüründe bazen kısaltma kullanılır) MAVİ (En İyi Doğrusal Tarafsız Tahminci) - en iyi doğrusal tarafsız tahmin; Rus edebiyatında Gauss-Markov teoremine daha sık başvurulur). Gösterilmesi kolay olduğu gibi, katsayı tahminleri vektörünün kovaryans matrisi şuna eşit olacaktır:

V (b ^ Ö L S) = σ 2 (X T X) − 1 (\displaystyle V((\hat (b))_(OLS))=\sigma ^(2)(X^(T)X)^(-1 )).

Verimlilik, bu kovaryans matrisinin "minimum" olduğu anlamına gelir (katsayıların herhangi bir doğrusal kombinasyonu ve özellikle katsayıların kendileri minimum varyansa sahiptir), yani doğrusal tarafsız tahminciler sınıfında OLS tahmincileri en iyisidir. Bu matrisin çapraz elemanları (katsayı tahminlerinin varyansları) elde edilen tahminlerin kalitesinin önemli parametreleridir. Ancak rastgele hata varyansı bilinmediğinden kovaryans matrisini hesaplamak mümkün değildir. Rastgele hataların varyansının tarafsız ve tutarlı (klasik doğrusal model için) tahmininin miktar olduğu kanıtlanabilir:

S 2 = R S S / (n − k) (\displaystyle s^(2)=RSS/(n-k)).

Bu değeri kovaryans matrisi formülünde yerine koyarak kovaryans matrisinin bir tahminini elde ederiz. Ortaya çıkan tahminler aynı zamanda tarafsız ve tutarlıdır. Hata varyansının tahmininin (ve dolayısıyla katsayıların varyansının) ve model parametrelerinin tahminlerinin bağımsız rastgele değişkenler olması da önemlidir; bu, model katsayıları hakkındaki hipotezlerin test edilmesi için test istatistiklerinin elde edilmesini mümkün kılar.

Klasik varsayımların karşılanmaması durumunda OLS parametre tahminlerinin en verimli olmadığı ve W (\displaystyle W) bazı simetrik pozitif tanımlı ağırlık matrisidir. Geleneksel en küçük kareler, ağırlık matrisinin birim matrisle orantılı olduğu bu yaklaşımın özel bir durumudur. Bilindiği gibi simetrik matrisler (veya operatörler) için bir genişleme vardır. W = P T P (\displaystyle W=P^(T)P). Bu nedenle, belirtilen fonksiyonel aşağıdaki gibi temsil edilebilir e T P T P e = (P e) T P e = e ∗ T e ∗ (\displaystyle e^(T)P^(T)Pe=(Pe)^(T)Pe=e_(*)^(T)e_( *)) yani bu fonksiyonel bazı dönüştürülmüş "kalanların" karelerinin toplamı olarak temsil edilebilir. Böylece, en küçük kareler yöntemlerinin bir sınıfını - LS yöntemlerini (En Küçük Kareler) - ayırt edebiliriz.

Genelleştirilmiş bir doğrusal regresyon modeli için (rastgele hataların kovaryans matrisine hiçbir kısıtlama getirilmeyen), en etkili olanın (doğrusal tarafsız tahminler sınıfında) tahminler olduğu kanıtlanmıştır (Aitken teoremi). genelleştirilmiş En Küçük Kareler (GLS - Genelleştirilmiş En Küçük Kareler)- Rastgele hataların ters kovaryans matrisine eşit ağırlık matrisine sahip LS yöntemi: W = V ε − 1 (\displaystyle W=V_(\varepsilon )^(-1)).

Doğrusal bir modelin parametrelerinin GLS tahminlerine yönelik formülün şu şekilde olduğu gösterilebilir:

B ^ G L S = (X T V − 1 X) − 1 X T V − 1 y (\displaystyle (\hat (b))_(GLS)=(X^(T)V^(-1)X)^(-1) X^(T)V^(-1)y).

Bu tahminlerin kovaryans matrisi buna göre şuna eşit olacaktır:

V (b ^ G L S) = (X T V − 1 X) − 1 (\displaystyle V((\hat (b))_(GLS))=(X^(T)V^(-1)X)^(- 1)).

Aslında OLS'nin özü, orijinal verilerin belirli (doğrusal) bir dönüşümünde (P) ve sıradan OLS'nin dönüştürülmüş verilere uygulanmasında yatmaktadır. Bu dönüşümün amacı, dönüştürülen veriler için rastgele hataların zaten klasik varsayımları sağlamasıdır.

Ağırlıklı OLS

Çapraz ağırlık matrisi (ve dolayısıyla rastgele hataların kovaryans matrisi) durumunda, ağırlıklı En Küçük Kareler (WLS) olarak adlandırılan matrise sahibiz. Bu durumda, model artıklarının ağırlıklı kareler toplamı en aza indirilir, yani her gözlem, bu gözlemdeki rastgele hatanın varyansıyla ters orantılı bir "ağırlık" alır: e T W e = ∑ t = 1 n e t 2 σ t 2 (\displaystyle e^(T)We=\sum _(t=1)^(n)(\frac (e_(t)^(2))(\ sigma_(t)^(2)))). Aslında veriler, gözlemlerin ağırlıklandırılmasıyla (rastgele hataların tahmin edilen standart sapması ile orantılı bir miktara bölünerek) dönüştürülür ve ağırlıklı verilere sıradan OLS uygulanır.

ISBN 978-5-7749-0473-0 .

  • Ekonometri. Ders Kitabı / Ed. Eliseeva II - 2. baskı. - M .: Finans ve İstatistik, 2006. - 576 s. - ISBN 5-279-02786-3.
  • Alexandrova N.V. Matematiksel terimlerin, kavramların, notasyonların tarihi: sözlük-referans kitabı. - 3. baskı - M.: LKI, 2008. - 248 s. - ISBN 978-5-382-00839-4. IV Mitin, Rusakov V.S. Deneysel verilerin analizi ve işlenmesi - 5. baskı - 24 s.
  • Fonksiyona 2. derece polinomla yaklaşalım. Bunu yapmak için normal denklem sisteminin katsayılarını hesaplıyoruz:

    , ,

    Aşağıdaki forma sahip normal bir en küçük kareler sistemi oluşturalım:

    Sistemin çözümünü bulmak kolaydır:, , .

    Böylece 2. dereceden bir polinom bulunur: .

    Teorik bilgiler

    Sayfaya dön<Введение в вычислительную математику. Примеры>

    Örnek 2. Bir polinomun optimal derecesini bulma.

    Sayfaya dön<Введение в вычислительную математику. Примеры>

    Örnek 3. Ampirik bağımlılığın parametrelerini bulmak için normal bir denklem sisteminin türetilmesi.

    Katsayıları ve fonksiyonları belirlemek için bir denklem sistemi türetelim belirli bir fonksiyonun noktalara göre ortalama karekök yaklaşımını gerçekleştiren. Bir fonksiyon oluşturalım ve bunun için gerekli ekstremum koşulu yazın:

    Daha sonra normal sistem şu şekli alacaktır:

    Bilinmeyen parametreler için kolayca çözülebilen doğrusal bir denklem sistemi elde ettik.

    Teorik bilgiler

    Sayfaya dön<Введение в вычислительную математику. Примеры>

    Örnek.

    Değişkenlerin değerlerine ilişkin deneysel veriler X Ve en tabloda verilmektedir.

    Hizalamalarının bir sonucu olarak, fonksiyon elde edilir

    Kullanma en küçük kareler yöntemi, bu verilere doğrusal bir bağımlılıkla yaklaşın y=ax+b(parametreleri bul A Ve B). İki çizgiden hangisinin (en küçük kareler yöntemi anlamında) deneysel verileri daha iyi hizaladığını bulun. Çizim yapmak.

    En küçük kareler yönteminin (LSM) özü.

    Görev, iki değişkenli fonksiyonun geçerli olduğu doğrusal bağımlılık katsayılarını bulmaktır. A Ve Ben küçük değeri alır. Yani verilen A Ve B Deneysel verilerin bulunan düz çizgiden sapmalarının karelerinin toplamı en küçük olacaktır. En küçük kareler yönteminin asıl amacı budur.

    Dolayısıyla örneği çözmek, iki değişkenli bir fonksiyonun ekstremumunu bulmaya indirgenir.

    Katsayıları bulmak için formüllerin türetilmesi.

    İki bilinmeyenli iki denklemden oluşan bir sistem derlenip çözülür. Bir fonksiyonun kısmi türevlerini bulma değişkenlere göre A Ve B, bu türevleri sıfıra eşitliyoruz.

    Ortaya çıkan denklem sistemini herhangi bir yöntemi kullanarak çözeriz (örneğin ikame yöntemiyle veya Cramer yöntemi) ve en küçük kareler yöntemini (LSM) kullanarak katsayıları bulmak için formüller elde edin.

    Verilen A Ve B işlev en küçük değeri alır. Bu gerçeğin ispatı aşağıda sayfanın sonundaki metinde verilmektedir.

    En küçük kareler yönteminin tamamı budur. Parametreyi bulma formülü A toplamları , , ve parametrelerini içerir N— deneysel veri miktarı. Bu tutarların değerlerinin ayrı ayrı hesaplanmasını öneririz.

    Katsayı B Hesaplamadan sonra bulunan A.

    Orijinal örneği hatırlamanın zamanı geldi.

    Çözüm.

    Örneğimizde n=5. Gerekli katsayıların formüllerinde yer alan tutarların hesaplanmasında kolaylık sağlamak için tabloyu dolduruyoruz.

    Tablonun dördüncü satırındaki değerler, her sayı için 2. satırdaki değerlerin 3. satırdaki değerlerle çarpılmasıyla elde edilir. Ben.

    Tablonun beşinci satırındaki değerler, her sayı için 2. satırdaki değerlerin karesi alınarak elde edilir. Ben.

    Tablonun son sütunundaki değerler satırlar arasındaki değerlerin toplamıdır.

    Katsayıları bulmak için en küçük kareler yönteminin formüllerini kullanıyoruz A Ve B. Tablonun son sütunundaki karşılık gelen değerleri bunların yerine koyarız:

    Buradan, y = 0,165x+2,184- İstenilen yaklaşık düz çizgi.

    Hangi satırlardan hangisinin olduğunu bulmak için kalır y = 0,165x+2,184 veya orijinal verilere daha iyi yaklaşır, yani en küçük kareler yöntemini kullanarak bir tahmin yapar.

    En küçük kareler yönteminde hata tahmini.

    Bunu yapmak için orijinal verilerin bu çizgilerden sapmalarının karelerinin toplamını hesaplamanız gerekir. Ve , daha küçük bir değer, en küçük kareler yöntemi anlamında orijinal verilere daha iyi yaklaşan bir çizgiye karşılık gelir.

    O zamandan beri düz y = 0,165x+2,184 orijinal verilere daha iyi yaklaşır.

    En küçük kareler (LS) yönteminin grafiksel gösterimi.

    Grafiklerde her şey açıkça görülüyor. Kırmızı çizgi bulunan düz çizgidir y = 0,165x+2,184, mavi çizgi , pembe noktalar orijinal verilerdir.

    Buna neden ihtiyaç duyuldu, neden tüm bu yaklaşımlar?

    Kişisel olarak bunu veri yumuşatma, enterpolasyon ve ekstrapolasyon problemlerini çözmek için kullanıyorum (orijinal örnekte onlardan gözlemlenen bir değerin değerini bulmaları istenebilir) sen en x=3 ya da ne zaman x=6 en küçük kareler yöntemini kullanarak). Ancak bunun hakkında daha sonra sitenin başka bir bölümünde daha fazla konuşacağız.

    Sayfanın başı

    Kanıt.

    Böylece bulunduğunda A Ve B Fonksiyon en küçük değeri alırsa, bu noktada fonksiyon için ikinci dereceden diferansiyelin ikinci dereceden formunun matrisinin olması gerekir. pozitif kesindi. Hadi gösterelim.

    İkinci dereceden diferansiyel şu şekildedir:

    Yani

    Bu nedenle, ikinci dereceden formun matrisi şu forma sahiptir:

    ve elemanların değerleri bağlı değildir A Ve B.

    Matrisin pozitif tanımlı olduğunu gösterelim. Bunu yapmak için açısal küçüklerin pozitif olması gerekir.

    Birinci dereceden açısal minör . Noktalar çakışmadığı için eşitsizlik kesindir. Aşağıda bunu ima edeceğiz.

    İkinci dereceden açısal minör

    Hadi bunu kanıtlayalım matematiksel tümevarım yöntemiyle.

    Çözüm: bulunan değerler A Ve B fonksiyonun en küçük değerine karşılık gelir dolayısıyla en küçük kareler yöntemi için gerekli parametrelerdir.

    Bunu çözecek zamanınız yok mu?
    Bir çözüm sipariş edin

    Sayfanın başı

    En küçük kareler yöntemini kullanarak tahmin geliştirme. Sorun çözümü örneği

    Ekstrapolasyon geçmiş ve şimdiki eğilimlerin, kalıpların ve bağlantıların tahmin nesnesinin gelecekteki gelişimine yayılmasına dayanan bilimsel bir araştırma yöntemidir. Ekstrapolasyon yöntemleri şunları içerir: hareketli ortalama yöntemi, üstel düzeltme yöntemi, en küçük kareler yöntemi.

    Öz en küçük kareler yöntemi gözlenen ve hesaplanan değerler arasındaki sapmaların karelerinin toplamının en aza indirilmesinden oluşur. Hesaplanan değerler seçilen denklem - regresyon denklemi kullanılarak bulunur. Gerçek değerler ile hesaplananlar arasındaki mesafe ne kadar küçük olursa, regresyon denklemine dayalı tahmin o kadar doğru olur.

    Değişimin bir zaman serisi tarafından yansıtıldığı, incelenen olgunun özünün teorik bir analizi, bir eğri seçiminin temelini oluşturur. Bazen serinin seviyelerindeki artışın niteliğine ilişkin hususlar dikkate alınır. Dolayısıyla, çıktının aritmetik bir ilerlemeyle artması bekleniyorsa, düzleştirme düz bir çizgide gerçekleştirilir. Büyümenin geometrik ilerleme gösterdiği ortaya çıkarsa, üstel bir fonksiyon kullanılarak düzeltme yapılmalıdır.

    En küçük kareler yöntemi için çalışma formülü : Y t+1 = a*X + b t + 1 – tahmin dönemi; Уt+1 – tahmin edilen gösterge; a ve b katsayılardır; X zamanın sembolüdür.

    A ve b katsayılarının hesaplanması aşağıdaki formüller kullanılarak gerçekleştirilir:

    nerede, Uf – dinamik serinin gerçek değerleri; n – zaman serisi seviyelerinin sayısı;

    En küçük kareler yöntemini kullanarak zaman serilerinin yumuşatılması, incelenen olgunun gelişim modelini yansıtmaya hizmet eder. Bir trendin analitik ifadesinde zaman bağımsız bir değişken olarak ele alınır ve serinin seviyeleri bu bağımsız değişkenin bir fonksiyonu olarak hareket eder.

    Bir olgunun gelişimi, başlangıç ​​noktasından bu yana kaç yıl geçtiğine değil, gelişimini hangi faktörlerin, hangi yönde ve hangi yoğunlukta etkilediğine bağlıdır. Buradan bir olgunun zaman içindeki gelişiminin bu faktörlerin etkisinin sonucu olduğu açıktır.

    Eğrinin türünü, zamana analitik bağımlılığın türünü doğru bir şekilde belirlemek, tahmine dayalı analizin en zor görevlerinden biridir. .

    Parametreleri en küçük kareler yöntemiyle belirlenen trendi tanımlayan fonksiyon tipinin seçimi, çoğu durumda ampirik olarak, bir dizi fonksiyon oluşturularak ve bunların değerlerine göre birbirleriyle karşılaştırılarak gerçekleştirilir. formülle hesaplanan ortalama kare hata:

    burada UV, dinamik serinin gerçek değerleridir; Ur – dinamik serinin hesaplanan (düzeltilmiş) değerleri; n – zaman serisi seviyelerinin sayısı; p – trendi (gelişme trendi) tanımlayan formüllerde tanımlanan parametre sayısı.

    En küçük kareler yönteminin dezavantajları :

    • İncelenen ekonomik olguyu bir matematiksel denklem kullanarak tanımlamaya çalışırken, tahmin kısa bir süre için doğru olacaktır ve yeni bilgiler elde edildikçe regresyon denklemi yeniden hesaplanmalıdır;
    • standart bilgisayar programları kullanılarak çözülebilen bir regresyon denklemi seçmenin karmaşıklığı.

    Tahmin geliştirmek için en küçük kareler yöntemini kullanmaya bir örnek

    Görev . Bölgedeki işsizlik oranını karakterize eden veriler var, %

    • Aşağıdaki yöntemleri kullanarak Kasım, Aralık ve Ocak ayları için bölgedeki işsizlik oranı tahminini oluşturun: hareketli ortalama, üstel düzeltme, en küçük kareler.
    • Her yöntemi kullanarak ortaya çıkan tahminlerdeki hataları hesaplayın.
    • Sonuçları karşılaştırın ve sonuçlar çıkarın.

    En küçük kareler çözümü

    Bunu çözmek için gerekli hesaplamaları yapacağımız bir tablo hazırlayacağız:

    ε = 28,63/10 = %2,86 tahmin doğruluğu yüksek.

    Çözüm : Hesaplamalardan elde edilen sonuçların karşılaştırılması hareketli ortalama yöntemi , üstel düzeltme yöntemi ve en küçük kareler yöntemine göre, üstel düzeltme yöntemi kullanılarak hesaplandığında ortalama bağıl hatanın %20-50 aralığında olduğunu söyleyebiliriz. Bu, bu durumda tahminin doğruluğunun yalnızca tatmin edici olduğu anlamına gelir.

    Birinci ve üçüncü durumlarda, ortalama bağıl hata %10'dan az olduğundan tahmin doğruluğu yüksektir. Ancak hareketli ortalama yöntemi daha güvenilir sonuçlar elde etmeyi mümkün kıldı (Kasım için tahmin -% 1,52, Aralık için tahmin -% 1,53, Ocak için tahmin -% 1,49), çünkü bu yöntemi kullanırken ortalama göreceli hata en küçük - 1 ,%13.

    En küçük kareler yöntemi

    Bu konuyla ilgili diğer makaleler:

    Kullanılan kaynakların listesi

    1. Sosyal risklerin teşhisi ve zorlukların, tehditlerin ve sosyal sonuçların tahmin edilmesine ilişkin bilimsel ve metodolojik öneriler. Rusya Devlet Sosyal Üniversitesi. Moskova. 2010;
    2. Vladimirova L.P. Piyasa koşullarında tahmin ve planlama: Ders Kitabı. ödenek. M .: "Dashkov and Co" Yayınevi, 2001;
    3. Novikova N.V., Pozdeeva O.G. Ulusal ekonomiyi tahmin etmek: Eğitimsel ve metodolojik el kitabı. Ekaterinburg: Ural Yayınevi. durum ekon. Üniv., 2007;
    4. Slutskin L.N. İş tahmini üzerine MBA kursu. M.: Alpina Business Books, 2006.

    Çokuluslu şirket programı

    Verileri girin

    Veriler ve yaklaşım y = a + bx

    Ben- deneysel nokta sayısı;
    x ben- bir noktada sabit bir parametrenin değeri Ben;
    sen ben- ölçülen parametrenin bir noktada değeri Ben;
    ωi- ağırlığın bir noktada ölçülmesi Ben;
    y ben, hesapla.- ölçülen ve regresyon hesaplanan değeri arasındaki fark sen noktada Ben;
    S x ben (x ben)- hata tahmini x benölçerken sen noktada Ben.

    Veriler ve yaklaşım y = kx

    Ben x ben sen ben ωi y ben, hesapla. ey ben S x ben (x ben)

    Grafiğe tıklayın

    MNC çevrimiçi programının kullanım kılavuzu.

    Veri alanına, her ayrı satıra bir deneysel noktada "x" ve "y" değerlerini girin. Değerler boşluk karakteriyle (boşluk veya sekme) ayrılmalıdır.

    Üçüncü değer “w” noktasının ağırlığı olabilir. Bir noktanın ağırlığı belirtilmemişse bire eşittir. Çoğu durumda deneysel noktaların ağırlıkları bilinmiyor veya hesaplanmıyor; tüm deneysel veriler eşdeğer kabul edilir. Bazen çalışılan değer aralığındaki ağırlıklar kesinlikle eşdeğer değildir ve hatta teorik olarak hesaplanabilir. Örneğin, spektrofotometride ağırlıklar basit formüller kullanılarak hesaplanabilir, ancak bu çoğunlukla işçilik maliyetlerini azaltmak için ihmal edilir.

    Veriler, Microsoft Office'ten Excel veya Open Office'ten Calc gibi bir ofis paketindeki bir elektronik tablodan pano aracılığıyla yapıştırılabilir. Bunu yapmak için e-tabloda kopyalanacak veri aralığını seçin, panoya kopyalayın ve verileri bu sayfadaki veri alanına yapıştırın.

    En küçük kareler yöntemini kullanarak hesaplama yapmak için, iki katsayıyı (b) (doğrunun eğim açısının tanjantı) ve 'a' (doğrunun "y" ekseninde kestiği değer) belirlemek için en az iki noktaya ihtiyaç vardır.

    Hesaplanan regresyon katsayılarının hatasını tahmin etmek için deneysel nokta sayısını ikiden fazlaya ayarlamanız gerekir.

    En küçük kareler yöntemi (LSM).

    Deney noktalarının sayısı ne kadar fazla olursa, katsayıların istatistiksel değerlendirmesi o kadar doğru olur (Öğrenci katsayısının azalması nedeniyle) ve tahmin genel örneklemin tahminine o kadar yakın olur.

    Her deneysel noktada değer elde etmek genellikle önemli işçilik maliyetleriyle ilişkilidir, bu nedenle yönetilebilir bir tahmin veren ve aşırı işçilik maliyetlerine yol açmayan uzlaşma sayıda deney sıklıkla gerçekleştirilir. Kural olarak, iki katsayılı doğrusal en küçük kareler bağımlılığı için deneysel noktaların sayısı 5-7 puanlık bir bölgede seçilir.

    Doğrusal İlişkiler İçin Kısa En Küçük Kareler Teorisi

    Diyelim ki [`y_i`,`x_i`] değer çiftleri biçiminde bir dizi deneysel verimiz var; burada 'i', 1'den 'n'ye kadar bir deneysel ölçümün sayısıdır; 'y_i' - 'i' noktasında ölçülen değerin değeri; `x_i` - `i` noktasında ayarladığımız parametrenin değeri.

    Örnek olarak Ohm yasasının işleyişini düşünün. Bir elektrik devresinin bölümleri arasındaki voltajı (potansiyel farkı) değiştirerek bu bölümden geçen akım miktarını ölçeriz. Fizik bize deneysel olarak bulunan bir bağımlılığı verir:

    'I = U/R',
    burada 'ben' mevcut güçtür; 'R' - direnç; 'U' - voltaj.

    Bu durumda, 'y_i' ölçülen mevcut değerdir ve 'x_i' voltaj değeridir.

    Başka bir örnek olarak, çözelti içindeki bir maddenin çözeltisi tarafından ışığın emilmesini düşünün. Kimya bize şu formülü verir:

    'A = ε l C',
    burada 'A' çözeltinin optik yoğunluğudur; 'ε' - çözünen maddenin geçirgenliği; 'l' - ışık çözeltili bir küvetten geçtiğinde yol uzunluğu; 'C' çözünmüş maddenin konsantrasyonudur.

    Bu durumda 'y_i', 'A' optik yoğunluğunun ölçülen değeri, 'x_i' ise belirttiğimiz maddenin konsantrasyon değeridir.

    'x_i' atamasındaki göreceli hatanın, 'y_i' ölçümündeki göreceli hatadan önemli ölçüde daha az olduğu durumu ele alacağız. Ayrıca ölçülen tüm 'y_i' değerlerinin rastgele ve normal dağıldığını varsayacağız, yani. normal dağılım kanununa uyun.

    'Y'nin 'x'e doğrusal bağımlılığı durumunda teorik bağımlılığı yazabiliriz:
    'y = a + b x'.

    Geometrik açıdan bakıldığında, 'b' katsayısı, çizginin eğim açısının 'x' eksenine olan tanjantını ve 'a' katsayısı - çizginin kesişme noktasındaki 'y'nin değerini belirtir. "y" ekseniyle aynı çizgi ("x = 0"da).

    Regresyon çizgisi parametrelerinin bulunması.

    Bir deneyde, "y_i"nin ölçülen değerleri, gerçek hayatta her zaman doğal olan ölçüm hataları nedeniyle tam olarak teorik düz çizgide bulunamaz. Bu nedenle doğrusal bir denklem, bir denklem sistemiyle temsil edilmelidir:
    'y_i ​​= a + b x_i + ε_i' (1),
    burada 'ε_i', 'i'inci deneyde 'y'nin bilinmeyen ölçüm hatasıdır.

    Bağımlılık (1) aynı zamanda denir gerileme yani iki büyüklüğün birbirine istatistiksel anlamlı bağımlılığı.

    Bağımlılığı yeniden sağlama görevi, deneysel noktalardan ['y_i', 'x_i'] 'a' ve 'b' katsayılarını bulmaktır.

    'a' ve 'b' katsayılarını bulmak için genellikle kullanılır en küçük kareler yöntemi(ÇUŞ). Maksimum olabilirlik ilkesinin özel bir durumudur.

    (1)'i `ε_i = y_i - a - b x_i` biçiminde yeniden yazalım.

    Daha sonra karesel hataların toplamı şöyle olacaktır:
    `Φ = toplam_(i=1)^(n) ε_i^2 = toplam_(i=1)^(n) (y_i - a - b x_i)^2'. (2)

    En küçük kareler (en küçük kareler) prensibi 'a' ve 'b' parametrelerine göre toplamı (2) en aza indirmektir..

    Minimum değere, toplamın (2) 'a' ve 'b' katsayılarına göre kısmi türevleri sıfıra eşit olduğunda ulaşılır:
    `frac(kısmi Φ)(kısmi a) = frac(kısmi toplam_(i=1)^(n) (y_i - a - b x_i)^2)(kısmi a) = 0`
    `frac(kısmi Φ)(kısmi b) = frac(kısmi toplam_(i=1)^(n) (y_i - a - b x_i)^2)(kısmi b) = 0`

    Türevleri genişleterek iki bilinmeyenli iki denklemden oluşan bir sistem elde ederiz:
    `toplam_(i=1)^(n) (2a + 2bx_i — 2y_i) = toplam_(i=1)^(n) (a + bx_i — y_i) = 0`
    `toplam_(i=1)^(n) (2bx_i^2 + 2ax_i — 2x_iy_i) = toplam_(i=1)^(n) (bx_i^2 + ax_i — x_iy_i) = 0`

    Parantezleri açıp gerekli katsayılardan bağımsız toplamları diğer yarıya aktarırız, bir doğrusal denklem sistemi elde ederiz:
    `toplam_(i=1)^(n) y_i = a n + b toplam_(i=1)^(n) bx_i`
    `toplam_(i=1)^(n) x_iy_i = a toplam_(i=1)^(n) x_i + b toplam_(i=1)^(n) x_i^2`

    Ortaya çıkan sistemi çözerek 'a' ve 'b' katsayıları için formüller buluyoruz:

    `a = frac(toplam_(i=1)^(n) y_i toplam_(i=1)^(n) x_i^2 — toplam_(i=1)^(n) x_i toplam_(i=1)^(n ) x_iy_i) (n toplam_(i=1)^(n) x_i^2 — (toplam_(i=1)^(n) x_i)^2)` (3.1)

    `b = frac(n toplam_(i=1)^(n) x_iy_i — toplam_(i=1)^(n) x_i toplam_(i=1)^(n) y_i) (n toplam_(i=1)^ (n) x_i^2 — (toplam_(i=1)^(n) x_i)^2)` (3.2)

    Bu formüllerin, 'n > 1' (doğru en az 2 nokta kullanılarak oluşturulabilir) ve determinantı 'D = n toplam_(i=1)^(n) x_i^2 - (sum_(i= 1) olduğunda çözümleri vardır. )^(n) x_i)^2 != 0`, yani. deneydeki "x_i" noktaları farklı olduğunda (yani çizgi dikey olmadığında).

    Regresyon çizgisi katsayılarının hatalarının tahmini

    'a' ve 'b' katsayılarının hesaplanmasındaki hatanın daha doğru bir şekilde değerlendirilmesi için çok sayıda deneysel nokta arzu edilir. 'n = 2' olduğunda katsayıların hatasını tahmin etmek imkansızdır çünkü yaklaşan çizgi benzersiz bir şekilde iki noktadan geçecektir.

    Rastgele değişken 'V'nin hatası belirlenir hata birikimi kanunu
    `S_V^2 = toplam_(i=1)^p (frac(kısmi f)(kısmi z_i))^2 S_(z_i)^2`,
    burada 'p', 'S_V' hatasını etkileyen, 'S_(z_i)' hatasına sahip 'z_i' parametrelerinin sayısıdır;
    'f', 'V'nin 'z_i'ye bağımlılığının bir fonksiyonudur.

    'a' ve 'b' katsayılarının hatası için hata birikimi yasasını yazalım.
    `S_a^2 = toplam_(i=1)^(n)(frac(kısmi a)(kısmi y_i))^2 S_(y_i)^2 + toplam_(i=1)^(n)(frac(kısmi a )(kısmi x_i))^2 S_(x_i)^2 = S_y^2 toplam_(i=1)^(n)(frac(kısmi a)(kısmi y_i))^2 `,
    `S_b^2 = toplam_(i=1)^(n)(frac(kısmi b)(kısmi y_i))^2 S_(y_i)^2 + toplam_(i=1)^(n)(frac(kısmi b )(kısmi x_i))^2 S_(x_i)^2 = S_y^2 toplam_(i=1)^(n)(frac(kısmi b)(kısmi y_i))^2 `,
    Çünkü 'S_(x_i)^2 = 0' (daha önce 'x' hatasının ihmal edilebilir olduğuna dair bir rezervasyon yapmıştık).

    'S_y^2 = S_(y_i)^2' - 'y' ölçümünde hata (varyans, standart sapmanın karesi), hatanın 'y'nin tüm değerleri için aynı olduğu varsayılarak.

    Elde edilen ifadelerde 'a' ve 'b'yi hesaplamak için kullanılan formülleri yerine koymak

    `S_a^2 = S_y^2 frac(toplam_(i=1)^(n) (toplam_(i=1)^(n) x_i^2 — x_i toplam_(i=1)^(n) x_i)^2 ) (D^2) = S_y^2 frac((n toplam_(i=1)^(n) x_i^2 — (toplam_(i=1)^(n) x_i)^2) toplam_(i=1) ^(n) x_i^2) (D^2) = S_y^2 frac(sum_(i=1)^(n) x_i^2) (D)` (4.1)

    `S_b^2 = S_y^2 frac(toplam_(i=1)^(n) (n x_i — toplam_(i=1)^(n) x_i)^2) (D^2) = S_y^2 frac( n (n toplam_(i=1)^(n) x_i^2 — (toplam_(i=1)^(n) x_i)^2)) (D^2) = S_y^2 frac(n) (D) '(4.2)

    Çoğu gerçek deneyde 'Sy' değeri ölçülmez. Bunu yapmak için, planın bir veya birkaç noktasında birkaç paralel ölçümün (deneyin) yapılması gerekir, bu da deneyin süresini (ve muhtemelen maliyetini) artırır. Bu nedenle genellikle 'y'nin regresyon doğrusundan sapmasının rastgele kabul edilebileceği varsayılır. Bu durumda "y" varyansının tahmini aşağıdaki formül kullanılarak hesaplanır.

    'S_y^2 = S_(y, geri kalan)^2 = frac(toplam_(i=1)^n (y_i - a - b x_i)^2) (n-2)'.

    'n-2' böleni, aynı deneysel veri örneğini kullanarak iki katsayının hesaplanması nedeniyle serbestlik derecesi sayımızın azalması nedeniyle ortaya çıkar.

    Bu tahmin aynı zamanda 'S_(y, rest)^2' regresyon çizgisine göre artık varyans olarak da adlandırılır.

    Katsayıların önemi Öğrenci t testi kullanılarak değerlendirilir

    `t_a = frac(|a|) (S_a)`, `t_b = frac(|b|) (S_b)`

    Hesaplanan 't_a', 't_b' kriterleri tablodaki 't(P, n-2)' kriterlerinden küçükse, o zaman karşılık gelen katsayının belirli bir 'P' olasılığı ile sıfırdan önemli ölçüde farklı olmadığı kabul edilir.

    Doğrusal bir ilişkinin tanımının kalitesini değerlendirmek için, Fisher kriterini kullanarak 'S_(y, rest)^2' ve 'S_(bar y)'yi ortalamaya göre karşılaştırabilirsiniz.

    `S_(çubuk y) = frac(toplam_(i=1)^n (y_i — çubuk y)^2) (n-1) = frac(toplam_(i=1)^n (y_i — (toplam_(i= 1)^n y_i) /n)^2) (n-1)` - ortalamaya göre 'y' varyansının örnek tahmini.

    Bağımlılığı tanımlamada regresyon denkleminin etkinliğini değerlendirmek için Fisher katsayısı hesaplanır.
    'F = S_(çubuk y) / S_(y, geri kalan)^2',
    bu tablosal Fisher katsayısı 'F(p, n-1, n-2)' ile karşılaştırılır.

    Eğer 'F > F(P, n-1, n-2)' ise, regresyon denklemi kullanılarak 'y = f(x)' ilişkisinin tanımı ile ortalama kullanılarak yapılan açıklama arasındaki fark, olasılık ile istatistiksel olarak anlamlı kabul edilir 'P'. Onlar. Regresyon, bağımlılığı 'y'nin ortalama etrafındaki yayılmasından daha iyi tanımlar.

    Grafiğe tıklayın
    tabloya değer eklemek için

    En küçük kareler yöntemi. En küçük kareler yöntemi, kabul edilen fonksiyonel bağımlılık olan bilinmeyen a, b, c parametrelerinin belirlenmesi anlamına gelir

    En küçük kareler yöntemi bilinmeyen parametrelerin belirlenmesini ifade eder a, b, c,… kabul edilen fonksiyonel bağımlılık

    y = f(x,a,b,c,…),

    hatanın minimum ortalama karesini (varyansını) sağlayacak olan

    , (24)

    burada x i, y i deneyden elde edilen sayı çiftlerinin kümesidir.

    Çok değişkenli bir fonksiyonun ekstremumu için koşul, kısmi türevlerinin sıfıra eşit olması koşulu olduğundan, parametreler a, b, c,… denklem sisteminden belirlenir:

    ; ; ; … (25)

    Fonksiyon türünden sonra parametrelerin seçiminde en küçük kareler yönteminin kullanıldığı unutulmamalıdır. y = f(x) tanımlanmış

    Teorik değerlendirmelerden ampirik formülün ne olması gerektiği konusunda hiçbir sonuç çıkarılamıyorsa, o zaman görsel temsillerle, özellikle de gözlemlenen verilerin grafiksel temsilleriyle yönlendirilmek gerekir.

    Uygulamada çoğunlukla aşağıdaki işlev türleriyle sınırlıdırlar:

    1) doğrusal ;

    2) ikinci dereceden a.

    En küçük kareler yönteminin özü şudur: herhangi bir rastgele olgunun zaman veya mekandaki gelişme eğilimini en iyi tanımlayan bir eğilim modelinin parametrelerini bulmada (eğilim, bu gelişmenin eğilimini karakterize eden bir çizgidir). En küçük kareler yönteminin (LSM) görevi yalnızca bir trend modeli bulmak değil, aynı zamanda en iyi veya en uygun modeli bulmaktır. Gözlemlenen gerçek değerler ile karşılık gelen hesaplanan eğilim değerleri arasındaki sapmaların karelerinin toplamı minimum (en küçük) ise bu model optimal olacaktır:

    gözlemlenen gerçek değer arasındaki sapmanın karesi nerede

    ve karşılık gelen hesaplanan trend değeri,

    İncelenen olgunun gerçek (gözlenen) değeri,

    Trend modelinin hesaplanan değeri,

    İncelenen olgunun gözlem sayısı.

    MNC tek başına oldukça nadir kullanılır. Kural olarak, çoğu zaman korelasyon çalışmalarında yalnızca gerekli bir teknik teknik olarak kullanılır. OLS'nin bilgi tabanının ancak güvenilir bir istatistiksel seri olabileceği ve gözlem sayısının 4'ten az olmaması gerektiği, aksi takdirde OLS'nin yumuşatma işlemlerinin sağduyuyu kaybedebileceği unutulmamalıdır.

    MNC araç seti aşağıdaki prosedürlerden oluşur:

    İlk prosedür. Seçilen faktör-argüman değiştiğinde ortaya çıkan niteliği değiştirmeye yönelik herhangi bir eğilimin olup olmadığı, başka bir deyişle “arasında bir bağlantı olup olmadığı” ortaya çıkıyor. en " Ve " X ».

    İkinci prosedür. Hangi çizginin (yörüngenin) bu eğilimi en iyi şekilde tanımlayabileceği veya karakterize edebileceği belirlenir.

    Üçüncü prosedür.

    Örnek. Diyelim ki incelenen çiftliğin ortalama ayçiçeği verimi hakkında bilgimiz var (Tablo 9.1).

    Tablo 9.1

    Gözlem numarası

    Verimlilik, c/ha

    Ülkemizde ayçiçeği üretimindeki teknoloji seviyesi son 10 yılda neredeyse hiç değişmediğinden, bu, analiz edilen dönemde verimdeki dalgalanmaların büyük ölçüde hava ve iklim koşullarındaki dalgalanmalara bağlı olduğu anlamına geliyor. Bu gerçekten doğru mu?

    İlk OLS prosedürü. Analiz edilen 10 yıl boyunca ayçiçeği verim değişimlerinde hava ve iklim koşullarındaki değişikliklere bağlı bir eğilimin varlığına ilişkin hipotez test edilmiştir.

    Bu örnekte " sen " Ayçiçeği veriminin alınması tavsiye edilir ve bunun için " X » – analiz edilen dönemde gözlemlenen yılın sayısı. arasında herhangi bir ilişkinin varlığına ilişkin hipotezin test edilmesi" X " Ve " sen "iki şekilde yapılabilir: manuel olarak ve bilgisayar programlarını kullanarak. Elbette bilgisayar teknolojisinin kullanılabilirliği ile bu sorun kendi kendine çözülebilir. Ancak ÇUŞ araçlarını daha iyi anlayabilmek için “arasındaki ilişkinin varlığına ilişkin hipotezin test edilmesi tavsiye edilmektedir” X " Ve " sen » Yalnızca bir kalem ve sıradan bir hesap makinesi elinizde olduğunda manuel olarak. Bu gibi durumlarda, bir eğilimin varlığına ilişkin hipotez, analiz edilen dinamik serisinin grafik görüntüsünün (korelasyon alanı) konumuyla görsel olarak en iyi şekilde kontrol edilir:

    Örneğimizdeki korelasyon alanı yavaş yavaş artan bir çizginin etrafında yer almaktadır. Bu durum başlı başına ayçiçeği rekoltesindeki değişimlerde belli bir eğilimin varlığına işaret etmektedir. Korelasyon alanı yalnızca bir daireye, bir daireye, tam olarak dikey veya tam olarak yatay bir buluta benzediğinde veya düzensiz dağılmış noktalardan oluştuğunda herhangi bir eğilimin varlığından bahsetmek mümkün değildir. Diğer tüm durumlarda, “arasında bir ilişkinin varlığına ilişkin hipotez” X " Ve " sen "ve araştırmaya devam edin.

    İkinci OLS prosedürü. Analiz edilen dönem boyunca ayçiçeği verimindeki değişim eğilimini hangi çizginin (yörüngenin) en iyi şekilde tanımlayabileceği veya karakterize edebileceği belirlenir.

    Bilgisayar teknolojiniz varsa optimum trendin seçimi otomatik olarak gerçekleşir. "Manuel" işlemede, en uygun fonksiyonun seçimi, kural olarak, görsel olarak - korelasyon alanının konumuna göre gerçekleştirilir. Yani grafiğin türüne göre ampirik eğilime (gerçek yörüngeye) en iyi uyan çizginin denklemi seçilir.

    Bilindiği gibi doğada çok çeşitli fonksiyonel bağımlılıklar vardır, bu nedenle bunların küçük bir kısmını bile görsel olarak analiz etmek son derece zordur. Neyse ki, gerçek ekonomik uygulamada çoğu ilişki bir parabol, bir hiperbol veya bir düz çizgi ile oldukça doğru bir şekilde tanımlanabilir. Bu bakımdan en iyi fonksiyonun seçildiği “manuel” seçeneği ile kendinizi yalnızca bu üç modelle sınırlandırabilirsiniz.

    Hiperbol:

    İkinci dereceden parabol: :

    Örneğimizde, analiz edilen 10 yıl boyunca ayçiçeği verimindeki değişim eğiliminin en iyi şekilde düz bir çizgiyle karakterize edildiğini görmek kolaydır, dolayısıyla regresyon denklemi bir düz çizginin denklemi olacaktır.

    Üçüncü prosedür. Bu çizgiyi karakterize eden regresyon denkleminin parametreleri hesaplanır veya başka bir deyişle en iyi trend modelini tanımlayan analitik bir formül belirlenir.

    Regresyon denkleminin parametrelerinin değerlerini bulmak, bizim durumumuzda ve parametreleri, OLS'nin özüdür. Bu süreç bir normal denklem sisteminin çözümüne indirgenir.

    (9.2)

    Bu denklem sistemi Gauss yöntemiyle oldukça kolay bir şekilde çözülebilir. Çözüm sonucunda örneğimizde parametre ve değerlerinin bulunduğunu hatırlayalım. Böylece bulunan regresyon denklemi aşağıdaki forma sahip olacaktır:

    KATEGORİLER

    POPÜLER MAKALELER

    2023 “kingad.ru” - insan organlarının ultrason muayenesi