Dağıtım sıraları. Nitelik ve varyasyon dağıtım serisi

Varyasyonun istatistiksel çalışmasında ilk adım, varyasyon serisi - özniteliğin artan (daha sık) veya azalan (daha az sıklıkta) değerlerine göre popülasyon birimlerinin sıralı dağılımı ve özelliğin bir veya daha fazla değerine sahip birimlerin sayısının sayılması.

Bir varyasyon serisinin üç biçimi vardır: aralıklı seri, ayrık seri, aralıklı seri. Varyasyon serisi genellikle denir yakın dağıtım Bu terim, hem niceliksel hem de niceliksel olmayan özelliklerdeki varyasyon çalışmasında kullanılır. dağıtım serisi yapısal gruplama(bkz. bölüm 6).

Dereceli sıra - bu, çalışılan özelliğin artan (azalan) sırasına göre popülasyonun bireysel birimlerinin bir listesidir.

Tablo 1 sıralanmış bir dizi örneği olarak kullanılabilir. 5.5.

Tablo 5.5

Boyuta göre sıralanmış St. Petersburg'un büyük bankaları01.07.96 tarihi itibariyle öz sermaye

Popülasyon birimlerinin sayısı yeterince büyükse, dereceli seriler hantal hale gelir ve bir bilgisayar yardımıyla bile oluşturulması uzun zaman alır. Bu gibi durumlarda, popülasyon birimleri incelenen özelliğin değerlerine göre gruplanarak varyasyon serisi oluşturulur.

Öznitelik az sayıda değer alırsa, ayrık bir varyasyon serisi oluşturulur. Böyle bir diziye örnek olarak futbol maçlarının atılan gol sayısına göre dağılımı verilebilir (Tablo 5.1). Ayrık varyasyon serisi - bu, iki satırdan veya bir grafikten oluşan bir tablodur: bir değişken özelliğinin belirli değerleri XBen ve özelliğin verilen değerine sahip popülasyon birimlerinin sayısı fi frekanslar (f, İngilizce kelime frekansının ilk harfidir).

Grup sayısının belirlenmesi

Ayrık bir varyasyon serisindeki grupların sayısı, değişken özelliğinin gerçekte var olan değerlerinin sayısına göre belirlenir. Özellik ayrı değerler alabilirse, ancak sayıları çok büyükse (örneğin, farklı tarımsal işletmelerde yılın 1 Ocak'ındaki canlı hayvan sayısı sıfırdan on binlerce baş arasında değişebilir), o zaman bir aralık varyasyon serisi inşa edildi. Varlıkları alanındaki hem tamsayı hem de kesirli değerleri alabilen özellikleri incelemek için bir aralık varyasyon serisi de oluşturulur. Örneğin, satılan ürünlerin karlılığı, bir üretim biriminin maliyeti, bir şehrin 1 sakini başına düşen gelir, farklı bölgelerin nüfusu içinde yüksek eğitimli insanların oranı ve genel olarak tüm ikincil özellikler bunlardır. değerleri, bir birincil özelliğin değerinin diğerinin değerine bölünmesiyle hesaplanır (bkz. Bölüm 3).

Aralık varyasyon serisi bir tablodur (iki sütundan (veya satırdan) oluşur - varyasyonu incelenen özelliğin aralıkları ve bu aralığa düşen popülasyon birimlerinin sayısı (sıklıklar) veya bu sayının toplam popülasyon (sıklıklar).

Bir aralık varyasyon dizisi oluştururken, optimal grup sayısını (karakter aralıkları) seçmek ve aralığın uzunluğunu ayarlamak gerekir. Bir varyasyon serisi analiz edilirken frekanslar farklı aralıklarda karşılaştırıldığından, aralığın değerinin sabit olması gerekir. Optimal grup sayısı, toplamdaki özellik değerlerinin çeşitliliği yeterince yansıtılacak ve aynı zamanda dağılımın düzenliliği, şekli rastgele frekans dalgalanmaları ile bozulmayacak şekilde seçilir. Çok az sayıda grup varsa, varyasyon paterni olmayacaktır; çok fazla grup varsa, rastgele frekans atlamaları dağılımın şeklini bozacaktır.

Çoğu zaman, varyasyon serisindeki grup sayısı, Amerikalı istatistikçi Sturgess tarafından önerilen formüle bağlı kalınarak belirlenir. (Sturgess):

Nerede k- grup sayısı; N- nüfusun büyüklüğü.

Bu formül, grup sayısının veri miktarının bir fonksiyonu olduğunu gösterir.

Belirli bir yıl için tahıl mahsullerinin verimine göre bölgedeki işletmelerin dağılımının değişken bir dizisini oluşturmanın gerekli olduğunu varsayalım. Tahıl mahsulü olan tarımsal işletme sayısı 143; en düşük verim değeri 10,7 c/ha, en yüksek verim değeri 53,1 c/ha'dır. Sahibiz:

Grup sayısı tam sayı olduğu için 8 veya 9 grup oluşturmanız önerilir.

Aralığın boyutunu belirleme

Grup sayısını bilerek, aralığın değerini hesaplayın:

Örneğimizde, aralık değeri şu şekildedir:

a) 8 grup ile

b) 9 grup ile

Bir dizi oluşturmak ve varyasyonu analiz etmek için, mümkünse aralık boyutunun ve sınırlarının yuvarlatılmış değerlerine sahip olmak çok daha iyidir. Bu nedenle, en iyi çözüm, aralığı 5 q/ha'ya eşit olan 9 gruplu bir varyasyon serisi oluşturmak olacaktır. Bu varyasyon serisi tabloda verilmiştir. 5.6 ve grafik gösterimi şekil 2'de verilmiştir. 5.1.

Aralıkların sınırları farklı şekillerde belirtilebilir: Tabloda gösterildiği gibi, bir önceki aralığın üst sınırı bir sonrakinin alt sınırını tekrarlar. 5.6 veya tekrar etmez.

İkinci durumda, ikinci aralık 15.1-20, üçüncü aralık 20.1-25 vb. olarak belirlenecektir, yani. tüm verim değerlerinin mutlaka onda bire yuvarlandığı varsayılır. Ek olarak, 15.1-20 aralığının ortasında istenmeyen bir komplikasyon ortaya çıkar ve bu, kesinlikle 17.5'e değil, 17.55'e eşit olacaktır; buna göre 40-60 yuvarlatılmış aralığını 40.1-6.0 ile değiştirdiğimizde, ortadaki 50'nin yuvarlatılmış değeri yerine 50.5 elde ederiz.Bu nedenle, aralıkları tekrar eden bir yuvarlatılmış kenarlık ile bırakmak ve nüfus birimlerinin aynı olduğunu kabul etmek tercih edilir. aralığın sınırına eşit bir özellik değerine sahip olan, bu tam değerin ilk raporlandığı aralığa dahil edilir. Böylece hektar başına 15 cent verim sağlayan bir çiftlik birinci gruba, hektar başına 20 cent değerinde bir işletme ikinci gruba dahil edilir ve bu böyle devam eder.

Pirinç. 5.1. Çiftliklerin verime göre dağılımı

Tablo 5.6

Tahıl ürünlerinin verimine göre bölgedeki çiftliklerin dağılımı

Verime göre çiftlik grupları,

c/ha XJ

çiftlik sayısı

Aralığın ortası

c/ha XJ"

Birikmiş frekans f'j

Varyasyon serisinin grafik gösterimi

Varyasyon serilerinin ve özelliklerinin analizinde önemli yardım, grafik gösterimle sağlanır. Aralık serisi, apsis ekseninde bulunan çubukların tabanlarının değişen öznitelik değerlerinin aralıkları ve çubukların yüksekliklerinin ölçeğe karşılık gelen frekanslar olduğu bir çubuk grafikle temsil edilir. y ekseni boyunca. Bölgedeki çiftliklerin tahıl mahsulü verimleri açısından dağılımının grafiksel bir gösterimi, Şekil 2'de gösterilmektedir. 5.1. Bu tür bir diyagrama genellikle histogram(Yunanca "histos" kelimesinden - doku, yapı).

Tablo verileri. 5.5 ve şek. 5.1, birçok işaretin karakteristik dağılım biçimini gösterir: işaretin ortalama aralıklarının değerleri daha yaygındır, daha az sıklıkta - aşırıdır; özelliğin küçük ve büyük değerleri. Bu dağılımın şekli, matematiksel istatistik dersinde ele alınan normal dağılım yasasına yakındır. Büyük Rus matematikçi A. M. Lyapunov (1857 - 1918), bir değişken değişkenin hiçbiri baskın bir etkiye sahip olmayan çok sayıda faktörden etkilenirse normal bir dağılımın oluştuğunu kanıtladı. Hem doğal hem de agroteknik, ekonomik tahıl mahsullerinin verimindeki değişimi etkileyen, yaklaşık olarak eşit birçok faktörün rastgele bir kombinasyonu, bölge çiftliklerinin verimle normal dağılım yasasına yakın bir dağılımını yaratır.

Ayrık bir varyasyon dizisi varsa veya aralıkların orta noktaları kullanılıyorsa, böyle bir varyasyon dizisinin grafiksel gösterimi denir. çokgen(Yunanca kelimelerden - bir çokgen). Koordinatları olan noktaları düz çizgilerle birleştirerek her biriniz bu grafiği kolayca oluşturabilirsiniz. X, Ve /.

Bir çokgenin veya diyagramın yüksekliğinin tabanına oranı yaklaşık 5:8 oranında tavsiye edilir.

frekans kavramı

eğer tabloda 5.6 Belirli bir üretkenlik düzeyine sahip çiftlik sayısını toplamın yüzdesi olarak ifade edin, tüm çiftlik sayısını (143) %100 olarak alın, ardından ortalama verim aşağıdaki gibi hesaplanabilir:

Nerede w- varyasyon serisinin 7. kategorisinin sıklığı;

Kümülatif dağılım

Varyasyon serisinin dönüştürülmüş formu, bir dizi birikmiş frekans, tabloda verilmiştir. 5.6, sütun 5. Bu, özniteliğin karşılık gelen aralık değerlerinin alt sınırından küçük ve ona eşit olan popülasyondaki birim sayısı için bir dizi değerdir. Böyle bir dizi denir Kümülatif."Daha az değil" veya "daha büyük" bir kümülatif dağıtım oluşturabilirsiniz. İlk durumda, kümülatif dağılım grafiği denir kümülatif, saniyede - bağışlamak(Şekil 5.2).

Yoğunluk, dağılımlar

Eşit olmayan aralıklara sahip bir varyasyon serisiyle uğraşmak zorundaysanız, karşılaştırılabilirlik için frekansı veya frekansı aralığın birimine getirmeniz gerekir. Ortaya çıkan orana denir dağıtım yoğunluğu:

Dağılım yoğunluğu, hem genelleştirici göstergeleri hesaplamak hem de eşit olmayan aralıklarla varyasyon serilerinin grafik gösterimi için kullanılır.

Pirinç. 5.2. Ogiva ve kümülatif verim dağılımı

5.7. Varyasyonun yapısal özellikleri sıra

Dağıtım medyanı

Varyasyonu incelerken, varyasyon serisinin yapısını, yapısını nicel olarak tanımlayan bu tür özellikleri kullanılır. Bu, örneğin, medyan- popülasyonu iki eşit parçaya bölen değişken özelliğin değeri ~ öznitelik değerleri medyandan daha düşük VE öznitelik değerleri ortancadan daha büyük (Tablo 5.5'teki beşin üçüncü bankası, yani 196 milyar ruble).

Tablo örneğinde. 5.5 medyan ve ortalama arasındaki temel farkı gösterir. Medyan, sıralanan serilerin kenarlarındaki özellik değerlerine bağlı değildir. St. Petersburg'daki en büyük bankanın sermayesi on kat daha büyük olsa bile medyan değer değişmezdi. Bu nedenle, medyan genellikle bir özelliğin tipik değerinin aritmetik ortalamadan daha güvenilir bir göstergesi olarak kullanılır, eğer değerler dizisi heterojen ise, ortalamadan keskin sapmalar içerir. Bu seride, 269 milyar rubleye eşit olan ortalama özkaynak değeri, en büyük seçeneğin güçlü etkisi altında oluşmuştur. Bankaların %80'i ortalamanın altında sermayeye sahiptir ve sadece %20'si daha fazladır. Böyle bir ortalamanın tipik bir değer olarak kabul edilmesi pek olası değildir. Çift sayıda nüfus birimi ile medyan, iki merkezi seçeneğin aritmetik ortalaması olarak alınır, örneğin, özelliğin on değeri, sıralanan serideki beşinci ve altıncı değerlerin ortalaması.

Bir aralık varyasyon serisinde, medyanı bulmak için formül (5.14) kullanılır.

burada Me medyandır;

x 0 - medyanın bulunduğu aralığın alt sınırı;

F M e-1 - medyandan önceki aralıkta birikmiş frekans;

ben- medyan aralıktaki sıklık;

Ben- aralık değeri;

k - grup sayısı.

Masada. 5.6 medyan 143 değerin ortalamasıdır, yani serinin başlangıcından itibaren yetmiş saniyelik üretkenlik değeri. Biriken frekans sayısından da anlaşılacağı üzere dördüncü aralıkta yer almaktadır. Daha sonra

Tek sayıda nüfus birimiyle, gördüğümüz gibi medyan sayı eşittir değil , formül (5.14)'deki gibi, bir , ancak bu ayrım önemli değildir ve genellikle pratikte göz ardı edilir.

Ayrık bir varyasyon serisinde, medyan, birikmiş frekansın bulunduğu gruptaki özelliğin değeri olarak düşünülmelidir;

nüfusun yarısından fazlası. Örneğin, Tablodaki veriler için. 5.1 Maç başına atılan ortalama gol sayısı 2 olacaktır.

Dağıtım çeyrekleri

Medyana benzer şekilde, özelliğin değerleri hesaplanır ve popülasyon, birim sayısına eşit dört parçaya bölünür. Bu miktarlara denir çeyrekler ve büyük Latin "harfi" ile gösterilir Q imzalı bir çeyrek numara rozeti ile. açık ki Q 2 Benimle eşleşir. Birinci ve üçüncü çeyrekler için formülleri ve hesaplamayı Tabloya göre sunuyoruz. 5.6.

Çünkü Q 2 = Me = 29,5 c/ha, birinci çeyrek ile medyan arasındaki farkın medyan ile üçüncü çeyrek arasındaki farktan daha az olduğu görülmektedir. Bu gerçek, dağılımın orta bölgesinde bir miktar asimetrinin varlığına işaret etmektedir ki bu da Şekil 1'de de göze çarpmaktadır. 5.1.

Seriyi beş eşit parçaya bölen karakteristik değerlere denir. beşte birlik on parçaya ondalıklar, yüz parça yüzdelikler. Bu özellikler sadece varyasyonel serilerin yapısını ayrıntılı olarak incelemek gerektiğinde kullanıldığından, formüllerini ve hesaplamalarını vermeyeceğiz.

dağıtım modu

Kuşkusuz, incelenen serilerde, toplamda en sık meydana gelen bir özelliğin böyle bir değeri büyük önem taşımaktadır. Bu miktar denir moda ve Mo'yu gösterir. Ayrık bir seride mod, en yüksek frekansa sahip özelliğin değeri olarak hesaplanmadan belirlenir. Örneğin, Tabloya göre. 5.1 en sık 2 gol bir futbol maçında atıldı - 71 kez. Mod 2 sayısıdır. Genellikle özelliğin bir modal değerine sahip satırlar vardır. Varyasyon serisinde bir özelliğin iki veya daha fazla eşit (ve hatta birkaç farklı, ancak komşudan daha büyük) değerleri varsa, sırasıyla iki modlu (“deve benzeri”) veya çok modlu olarak kabul edilir. Bu, kümenin heterojenliğini gösterir, muhtemelen farklı modlara sahip birkaç kümenin toplamını temsil eder.

Dolayısıyla, farklı ülkelerden gelen turist kalabalığında, yerel halk arasında hakim olan tek bir moda giyim yerine, dünyanın farklı halkları tarafından benimsenen farklı “modaların” bir karışımını bulabilirsiniz.

Bir aralık varyasyon serisinde, özellikle bir özelliğin sürekli varyasyonunda, tam anlamıyla, özelliğin her değeri yalnızca bir kez ortaya çıkar. Modal aralık, en yüksek frekansa sahip aralıktır.Bu aralık içinde, yakınında dağılım yoğunluğunun olduğu, yani özelliğin koşullu değeri bulunur. değişken bir özelliğin ölçüm birimi başına popülasyon birimi sayısı maksimuma ulaşır. Bu koşullu bir değerdir ve dikkate alınır nokta modası. Böyle bir nokta modunun, aralığın sınırlarına daha yakın yerleştirildiğini varsaymak mantıklıdır; bunun ötesinde, bitişik aralıktaki frekans, modal aralığın diğer sınırının ötesindeki aralıktaki frekanstan daha büyüktür. Bu nedenle, yaygın olarak kullanılan formüle sahibiz (5.15):

Nerede X 0 - modal aralığın alt sınırı;

fmo - modal aralıktaki frekans;

fmo -1 - önceki aralıktaki sıklık;

fmo +1 - modaldan sonraki aralıktaki frekans;

Ben - aralık değeri.

Tabloya göre. 5.6 modayı hesaplayın:

Aralık serisindeki modun hesaplanması oldukça koşulludur. Mo yaklaşık olarak grafiksel olarak belirlenebilir (bkz. Şekil 5.1).

Bu genelleştirici göstergenin ana değeri farklı olsa da, aritmetik ortalama değer, varyasyon serisinin yapısının incelenmesiyle de ilgilidir. Çiftliklerin verime göre dağılım serisinde (Tablo 5.6), ortalama verim, aralıkların frekans ağırlıklı ortası olarak hesaplanır. X(formül (5.2) ile):

Ortalama, medyan ve mod arasındaki ilişki

Bu dağılımda aritmetik ortalama, medyan ve mod arasındaki fark küçüktür. Şekildeki dağılım normal yasaya yakınsa, medyan mod ile ortalama değer arasındadır ve moda göre ortalamaya daha yakındır.

Sağ taraflı asimetri ile X̅ > ben > ay;

sol taraflı asimetri ile X̅ < Ben< Mo.

Orta derecede çarpık dağılımlar için eşitlik doğrudur:

5.8. Boyut ve yoğunluk ölçüleri varyasyonlar

Mutlak ortalama varyasyon boyutları

Toplamdaki özelliğin varyasyonunun incelenmesindeki bir sonraki aşama, kuvvetin özelliklerinin, varyasyonun büyüklüğünün ölçülmesidir. Bunların en basiti olabilir kapsam veya varyasyon genliği - bir özelliğin maksimum ve minimum değerleri arasındaki, incelenen değerler kümesinde bulunan değerlerden mutlak fark. Böylece, varyasyon aralığı formül ile hesaplanır.

Aralığın büyüklüğü, yalnızca özelliğin değerlerindeki maksimum farkı karakterize ettiğinden, tüm popülasyondaki varyasyonunun düzenli gücünü ölçemez. Bu amaca yönelik gösterge, istisnasız, toplu olarak niteliğin değerlerindeki tüm farklılıkları dikkate almalı ve genellemelidir. Bu tür farklılıkların sayısı, popülasyonun tüm birimlerinden ikisinin kombinasyonlarının sayısına eşittir; tabloya göre. 5.6 olacak: C^= 10 153. Ancak, tüm sapmaları dikkate almaya, hesaplamaya ve ortalamaya gerek yoktur. Bireysel özellik değerlerinin, özelliğin aritmetik ortalama değerinden sapmalarının ortalamasını kullanmak daha kolaydır ve bunlardan sadece 143 tane vardır, ancak özellik değerlerinin aritmetik ortalama değerinden ortalama sapması, göre ikincisinin iyi bilinen özelliği sıfırdır. Bu nedenle, varyasyonun gücünün bir göstergesi sapmaların cebirsel ortalaması değil, ortalama sapma modülü:

Tabloya göre. 5.6 orta modül veya ortalama doğrusal sapma, mutlak değerde, aritmetik ortalamadan aralıkların orta noktalarının modulo frekans ağırlıklı sapma olarak hesaplanır, yani formüle göre

Bu, incelenen çiftlik setindeki verimin ortalama olarak bölgedeki ortalama verimden 6,85 c/ha saptığı anlamına gelir. Hesaplama ve yorumlamanın basitliği bu göstergenin olumlu yönleridir, ancak modüllerin matematiksel özellikleri "kötü"dür: onların parametresi ortalama sapma modülü olmayan normal dağılım da dahil olmak üzere herhangi bir olasılık yasası ile uyumlu hale getirilemez, ancak standart sapma("standart sapma" olarak adlandırılan İngilizce bilgisayar programlarında, kısaltılmış "s.d." veya basitçe « S», Rusça konuşan - NKO). İstatistik literatüründe, ortalama değerden standart sapma genellikle küçük (küçük harfli) bir Yunanca harf sigma (st) veya S(bkz. bölüm 7):

dereceli seriler için

Aralık serisi için

Tabloya göre. 5.6 tane veriminin standart sapması şuydu:

Ortalama değerin ve aralıkların orta noktalarının, örneğin tamsayılara yuvarlanmasının σ değeri üzerinde çok az etkiye sahip olduğu ve bu durumda 8,55 c/ha'ya tekabül ettiği belirtilmelidir.

Gerçek popülasyonlardaki büyüklükteki standart sapma her zaman ortalama sapma modülünden daha büyüktür. Oran (şurada: A agregalarda keskin, belirgin sapmaların varlığına bağlıdır ve agreganın ana kütle ile heterojen elementlerle “kirlenmesinin” bir göstergesi olarak hizmet edebilir: bu oran ne kadar büyükse, bu tür “kirlenme” o kadar güçlüdür. Normal dağılım yasası σ için: bir = 1,2.

dağılım kavramı

Standart sapmanın karesi değeri verir dağılım σ2 . Dağılım formülü:

basit (gruplanmamış veriler için):

ağırlıklı (gruplandırılmış veriler için):

Hemen hemen tüm matematiksel istatistik yöntemleri dağılıma dayalıdır. Varyansları toplama kuralı büyük pratik öneme sahiptir (bkz. Bölüm 6).

Diğer varyasyon ölçüleri

Onu tüm popülasyonda değil, sadece merkezi kısmında karakterize eden varyasyonun gücünün bir başka göstergesi, ortalama çeyrek mesafe, onlar. aşağıda belirtilen çeyrekler arasındaki farkın ortalama değeri Q:

Tarımsal işletmelerin verime göre dağılımı için tablo. 5.2

Q\u003d (36,25 - 25,09): 2 \u003d 5,58 kg / ha. Nüfusun orta kısmındaki varyasyonun gücü, kural olarak, tüm popülasyondakinden daha azdır. Ortalama sapma modülü ile ortalama üç aylık sapma arasındaki oran, aynı zamanda varyasyon yapısını incelemeye de hizmet eder: bu oranın büyük bir değeri, zayıf bir şekilde değişen bir "çekirdek"in ve bu çekirdek veya "halo" etrafında güçlü bir şekilde dağılmış bir ortamın varlığını gösterir. "incelenen popülasyonda. Tablodaki veriler için. 5.6 oran bir: q= 1.23, bu, popülasyonun merkezi kısmındaki ve çevresindeki varyasyonun gücündeki küçük bir farkı gösterir.

Varyasyonun yoğunluğunu değerlendirmek ve bunu farklı popülasyonlarda ve hatta farklı özellikler için karşılaştırmak için, göreli değişken göstergeleri. Daha önce tartışılan varyasyon gücünün mutlak göstergelerinin, özelliğin aritmetik ortalama değerine oranı olarak hesaplanırlar. Aşağıdaki göstergeleri alıyoruz:

1) bağıl varyasyon aralığı p:

2) bağıl sapma modulo T:

3) bağıl kare sapma olarak varyasyon katsayısı v:

4) göreceli çeyrek mesafe D:

Nerede Q - ortalama çeyrek mesafe.

Verimi tabloya göre değiştirmek için. 5.6 bu göstergeler şunlardır:

ρ = 42,4: 30,3 = 1,4 veya %140;

T= 6,85: 30,3 = 0,226 veya %22,6;

v = 8,44: 30,3 = 0,279 veya %27,9;

D= 5,58: 30,3 = 0,184 veya %18,4.

Varyasyonun yoğunluk derecesinin değerlendirilmesi, yalnızca belirli bir bileşime sahip bir popülasyonun her bir özelliği için mümkündür. Bu nedenle, bir dizi tarımsal işletme için, aynı doğal bölgedeki verimdeki değişim, şu durumlarda zayıf olarak değerlendirilebilir: v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.

Aksine, yetişkin erkek veya kadın popülasyonundaki boy farkı halihazırda %7'ye eşit bir katsayıda olup, insanlar tarafından güçlü olarak değerlendirilmeli ve algılanmalıdır. Bu nedenle, varyasyonun yoğunluğunun değerlendirilmesi, gözlemlenen varyasyonun standart olarak alınan olağan yoğunluğunun bir kısmı ile karşılaştırılmasından oluşur. Verimlilik, kazanç veya kişi başına düşen gelir, bir binadaki oturma odası sayısının birkaç hatta onlarca kez değişebileceği gerçeğine alışkınız, ancak insanların boylarındaki farkın en az bir buçuk katı zaten algılanıyor. çok güçlü.

Farklı güç, yoğunluk değişimleri nesnel sebeplerden kaynaklanmaktadır. Örneğin, 24 Ocak 1997'de St. Petersburg'daki ticari bankalarda ABD dolarının satış fiyatı 5675 ila 5640 ruble arasında değişiyordu. ortalama 5664 ruble fiyatla. Bağıl varyasyon aralığı ρ = 35:5664 = %0,6. Bu kadar küçük bir varyasyon, dolar kurunda önemli bir fark olduğunda, alıcıların "pahalı" bankadan "daha ucuz" olanlara anında bir çıkış yapması gerçeğinden kaynaklanmaktadır. Aksine, Rusya'nın farklı bölgelerinde bir kilogram patates veya sığır eti fiyatı büyük ölçüde değişir - yüzde onlarca veya daha fazla. Bunun nedeni, malların üretici bölgeden tüketici bölgeye teslimi için farklı maliyetlerdir, yani; atasözü "denizaşırı bir düve yarımdır, ancak bir ruble taşınır."

5.9. Dağıtım anları ve göstergeler biçimleri

Dağıtım merkezi anları

Varyasyonun doğası hakkında daha fazla çalışma için, bir özelliğin bireysel değerlerinin aritmetik ortalama değerinden farklı sapma derecelerinin ortalama değerleri kullanılır. Bu göstergeler denir merkezi anlar sapmaların yükseltildiği güce karşılık gelen düzenin dağılımları (Tablo 5.7) veya sadece momentler (merkezi olmayan momentler nadiren kullanılır ve burada dikkate alınmayacaktır). Üçüncü moment ts-'nin değeri, işareti gibi, pozitif sapma küplerinin negatif küplere üstünlüğüne bağlıdır veya bunun tersi de geçerlidir. Normal ve diğer herhangi bir kesinlikle simetrik dağılım altında, pozitif küplerin toplamı kesinlikle negatif küplerin toplamına eşittir.

Asimetri göstergeleri

Üçüncü dereceden momente dayanarak, dağılımın asimetri derecesini karakterize eden bir gösterge oluşturmak mümkündür:

Gibi isminde asimetri katsayısı. Hem gruplanmış hem de gruplanmamış verilerden hesaplanabilir. Tabloya göre. 5.6 asimetri indeksi şuydu:

onlar. asimetri hafiftir. İngiliz istatistikçi K. Pearson, ortalama değer ile mod arasındaki farka dayanarak, başka bir asimetri göstergesi önerdi.

Tablo 5.7

Merkezi anlar

Tabloya göre. 5.6 Pearson endeksi şuydu:

Pearson indeksi, dağılım serisinin orta kısmındaki asimetri derecesine, üçüncü dereceden momente dayalı asimetri indeksi ise özelliğin uç değerlerine bağlıdır. Bu nedenle, örneğimizde, dağılımın orta kısmında, grafikten de görülebileceği gibi, asimetri daha belirgindir (Şekil 5.1). Güçlü sağ taraflı ve sol taraflı (pozitif ve negatif) çarpıklığa sahip dağılımlar Şekil 2'de gösterilmektedir. 5.3.

Dağılım basıklığının karakterizasyonu

Dördüncü dereceden momentin yardımıyla, dağılım serisinin asimetriden daha karmaşık bir özelliği, adı verilen Basıklık.


Pirinç. 5.3. Asimetri, dağılımlar

basıklık göstergesi formül ile hesaplanır

(5.30)

Genellikle basıklık, dağılımın "dikliği" olarak yorumlanır, ancak bu kesin değildir ve eksiktir. Dağılım grafiği, özellik varyasyonunun gücüne bağlı olarak keyfi olarak dik görünebilir: varyasyon ne kadar zayıfsa, belirli bir ölçekte dağılım eğrisi o kadar diktir. Apsis boyunca ve ordinat boyunca ölçekleri değiştirerek, herhangi bir dağılımın yapay olarak "dik" ve "eğimli" yapılabileceği gerçeğinden bahsetmiyorum bile. Dağılımın basıklığının ne olduğunu göstermek ve doğru bir şekilde yorumlamak için, aynı varyasyon gücüne (aynı σ değeri) ve farklı basıklık göstergelerine sahip serileri karşılaştırmanız gerekir. Basıklığı çarpıklıkla karıştırmamak için karşılaştırılan tüm satırların simetrik olması gerekir. Böyle bir karşılaştırma Şekil l'de gösterilmektedir. 5.4.

Şekil 5.4. Dağıtım basıklığı

Normal dağılıma sahip bir varyasyon serisi için değerler Ben formül (5.30) ile hesaplanan basıklık göstergesi, j üçe eşittir.

Ancak böyle bir göstergeye çeviride "fazlalık" anlamına gelen "basıklık" adı verilmemelidir. "Basıklık" terimi, formül (5.30)'a göre oranın kendisine değil, incelenen dağılım için böyle bir oranın, normal dağılımın verilen oranının değeriyle karşılaştırılmasına uygulanmalıdır, yani. 3 değeri ile. Dolayısıyla basıklık göstergesi için nihai formüller, yani. aynı varyasyon gücüne sahip normal dağılıma kıyasla fazlalıklar şu şekildedir:

dereceli seriler için

aralıklı ve ayrık varyasyon serileri için

Pozitif bir basıklığın yanı sıra, küçük bir üç aylık mesafe ile büyük bir standart sapma arasında daha önce belirtilen önemli farkın varlığı, incelenen fenomen kütlesinde, bu özellikte hafifçe değişen bir "çekirdek" olduğu anlamına gelir. dağınık "halo". Önemli bir olumsuz basıklıkla, böyle bir "çekirdek" hiç yoktur.

Dağılımın çarpıklık ve basıklık göstergelerinin değerleri ile, korelasyon ve regresyon analizinin sonuçlarını değerlendirmek için gerekli olan dağılımın normal olana yakınlığı, tahminlerin olasılıksal değerlendirme olasılıkları ( bkz. bölümler 7,8,9). Dağılım normal kabul edilebilir veya daha doğrusu çarpıklık ve basıklık göstergeleri standart sapmalarının iki katını Cm aşmıyorsa, gerçek dağılımın normal dağılıma benzerliği hipotezi reddedilemez. Bu standart sapmalar aşağıdaki formüllerle hesaplanır:

5.10. Mümkün olan maksimum değerler varyasyon göstergeleri ve uygulamaları

Herhangi bir istatistiksel göstergeyi uygularken, incelenen sistem için belirli bir göstergenin olası maksimum değerlerinin ne olduğunu ve gerçekte gözlenen değerlerin mümkün olan maksimum değerlere oranının ne olduğunu bilmek faydalıdır. Bu sorun, belirli bir ürün tipinin üretim hacmi, belirli kaynakların mevcudiyeti, sermaye yatırımlarının dağılımı, gelirler ve karlar gibi hacim göstergelerinin varyasyonunu incelerken özellikle ilgilidir. Bölgede sebze üretiminin tarımsal işletmeler arasındaki dağılımı örneğinde bu konuyu teorik ve pratik olarak ele alalım.

Varyasyon göstergelerinin mümkün olan en düşük değerine, hacim özelliğinin nüfusun tüm birimleri arasında, yani her bir tarımsal işletmede aynı üretim hacmiyle, kesinlikle tekdüze bir şekilde dağıtılmasıyla ulaşıldığı açıktır. Böyle bir sınırlayıcı (elbette pratikte pek olası olmayan) bir dağılımda varyasyon yoktur ve tüm göstergeler, varyasyonlar sıfıra eşittir.

Varyasyon göstergelerinin mümkün olan maksimum değeri, tüm hacminin popülasyonun bir biriminde yoğunlaştığı popülasyondaki hacim özelliğinin böyle bir dağılımı ile elde edilir; örneğin, tüm sebze üretimi hacmi - diğer çiftliklerde üretimleri olmadığında, bölgenin bir tarımsal işletmesinde. Nüfusun bir biriminde bir özelliğin hacminin böylesine son derece olası bir konsantrasyonunun olasılığı o kadar küçük değildir; her durumda, kesinlikle tekdüze bir dağılım olasılığından çok daha fazladır.

Maksimumunun belirtilen sınırlayıcı durumu için varyasyon üslerini göz önünde bulundurun. Nüfus birimlerinin sayısını gösterelim P,özelliğin ortalama değeri X̅ , o zaman özelliğin toplu haldeki toplam hacmi şu şekilde ifade edilecektir: X̅ P. Bütün bu hacim nüfusun bir biriminde yoğunlaşmıştır, öyle ki Xmaks.= x̅ p.xdakika = 0, genliğin (değişim aralığı) maksimum değerinin şuna eşit olduğu sonucu çıkar:

Ortalama modulo ve ikinci dereceden sapmaların maksimum değerlerini hesaplamak için bir sapma tablosu oluşturacağız (Tablo 5.8).

Tablo 5.8

Maksimumda ortalamadan sapmaların modülleri ve kareleriolası varyasyon

Nüfus birim numaraları

Özellik değerleri

Ortalamadan sapmalar

x ben - X̅

sapma modülleri

|x ben - x̅|

sapma kareleri

(XBen- X̅ ) 2

X̅ P

X̅ (P - 1)

-X̅

-X̅

-X̅

X̅ (P - 1)

X̅

X̅

X̅

X̅ 2 (P - 1) 2

X̅ 2

X̅ 2

X̅ 2

X̅ P

2X̅ (P - 1)

X̅ 2 [(P - 1) 2 +(n-1)]

Tablonun son satırındaki ifadelere göre. 5.8, varyasyon göstergelerinin aşağıdaki olası maksimum değerlerini elde ederiz.

Ortalama sapma modülü veya ortalama doğrusal sapma:

Standart sapma:

Bağıl modüler (doğrusal) sapma:

Varyasyon katsayısı:

Üç aylık mesafeye gelince, mümkün olan maksimum varyasyona sahip sistem, yapının hiçbir (“çalışmayan”) özelliğinin olmadığı, özellik dağılımının dejenere bir yapısına sahiptir: medyan, çeyrekler ve benzerleri.

Ana varyasyon göstergelerinin mümkün olan maksimum değerleri için elde edilen formüllere dayanarak, her şeyden önce, bu değerlerin popülasyon hacmine bağımlılığı hakkında sonuç çıkar. P. Bu bağımlılık Tablo'da özetlenmiştir. 5.9.

En dar değişim sınırları ve popülasyonun büyüklüğüne zayıf bir bağımlılık, ortalama modülü ve göreceli doğrusal sapmayı ortaya çıkarır. Aksine, standart sapma ve varyasyon katsayısı büyük ölçüde popülasyon birimlerinin sayısına bağlıdır. Bu bağımlılık, farklı büyüklükteki popülasyonlardaki varyasyonun yoğunluğunu karşılaştırırken dikkate alınmalıdır. Altı işletmenin toplamında üretim hacmindeki değişim katsayısı 0,58 ve 20 işletmenin toplamında 0,72 ise, o zaman ikinci popülasyondaki üretim hacminin daha eşitsiz olduğu sonucuna varmak doğru olur mu? Aslında, ilk, daha küçük olanda, 0,58: 2,24 = mümkün olan maksimumun %25,9'u, yani. sınır, altı işletmeden birindeki üretim yoğunlaşma seviyesi ve ikinci, daha büyük kümede, gözlemlenen varyasyon katsayısı yalnızca 0,72 idi: 4,36 = mümkün olan maksimum değerin %16,5'i.

Tablo 5.9

Nüfusun farklı boyutları için hacimsel bir özelliğin varyasyon göstergelerinin sınır değerleri

Popülasyon boyutu

Göstergelerin maksimum değerleri

X̅

X̅

1,5X̅

1,73X̅

1,67X̅

2,24X̅

1,80X̅

3X̅

1,90X̅

4,36X̅

1,96X̅

7X̅

1,98X̅

9,95X̅

2X̅

Pratik önemi olan, gerçek ortalama sapma modülünün mümkün olan maksimuma oranı gibi bir göstergedir. Böylece, altı girişimin toplamı için bu oran: 0,47: 1,67 = 0,281 veya %28,1 oldu. Elde edilen göstergenin yorumu şu şekildedir: işletmeler arasında gözlemlenen çıktı dağılımından tekdüze bir dağılıma geçmek için, yeniden dağıtmak gerekli olacaktır.

veya toplamda toplam üretimin %23,4'ü. Gerçek üretim konsantrasyonunun derecesi (σ'nın gerçek değeri veya v) bir işletmede üretimin tekelleştirilmesi durumunda marjinal değerin belirli bir kısmıdır, o zaman gerçek göstergenin marjinal olana oranı, üretimin yoğunlaşma (veya tekelleşme) derecesini karakterize edebilir.

Yapıdaki değişim veya değişim göstergelerinin gerçek değerlerinin mümkün olan maksimuma oranları, yapısal kaymaların analizinde de kullanılır (bkz. Bölüm 11).

1. Jeanie K. Ortalama değerler. - M.: İstatistik, 1970.

2. Krivenkova L. N., Yuzbashev M. M. Değişim göstergelerinin var olduğu alan ve uygulaması // İstatistik Bülteni. - 1991. - 6 numara. -S.66-70.

3. Pashaver I. S.İstatistiklerde ortalama değerler. - M.: İstatistikler. 1979.

4. Shurakov V. V., Dayitbegov D. M. ve diğerleri.İstatistiksel veri işleme için otomatik iş istasyonu (Bölüm 4. Ön istatistiksel veri işleme). - M.: Finans ve istatistik, 1990.

değişen- herhangi bir nesneyi, bu özelliğe sahip olmaları koşuluyla, bazı özelliklerinin artan veya azalan düzeninde sıralama prosedürü.

Sıralayabilirsiniz:

Yaşam standardı, doğum oranı, işsizlik;

Prestije göre meslekler;

Tüketici tercihine göre mal;

Siyasi faaliyetlere, mali duruma göre yanıt verenler;

Sıralama nesneleri, doğrudan sıralanan nesnelerdir. Temel sıralama(sıralama özelliği) - nesnelerin sıralandığı özellik. Sıralamanın bir sonucu olarak, her nesneye kendi bireyinin atandığı sıralanmış bir dizi elde ederiz. rütbe- sıralanan sıradaki nesnenin yeri. Sıralanan dizideki yer sayısı ve buna bağlı olarak sıra sayısı, nesne sayısına eşittir.

Dereceli seri türleri:

1) her nesnenin, diğer nesnelerin özelliğinin değerlerinden farklı bir özellik değeri vardır, ardından sıralanan serinin her nesnesine, başka bir nesneden farklı olarak kendi sıralaması atanır;

2) birkaç nesne aynı öznitelik değerine sahiptir, ardından sıralanan serideki bu nesnelere belirli bir formüle göre hesaplanan aynı sıralar atanır. Bu durumda, sıralanan seriye, ilgili sıralara sahip bir dereceli seri denir. Problemleri çözerken, ilk sırayı özelliğin en yüksek değerine atayacağız. İlişkili sıra, aynı özellik değerine sahip nesnelerin işgal ettiği yerlerin ortalama değeri olarak hesaplanır. 2 veya daha fazla dereceli seri için istatistiksel bir ilişkinin kurulması, kullanılarak gerçekleştirilir. sıra bağlantı katsayıları- aynı nesnelerin iki farklı temelde (özellikler) sıralamasındaki tutarlılık derecesini hesaplamanıza izin veren katsayılar. Sıra bağlantısının en yaygın katsayısı (sıra korelasyonu), ρ-Spearman katsayısıdır.

Diyelim ki n nesne x özelliğine ve y özelliğine göre sıralandı. İzin vermek

i'inci nesnenin sıralarının uyuşmazlığının ölçüsü: d ben = R x ben - R y ben

Özellikler:

-1 ile 1 arasındaki aralıktaki değişiklikler;

Sıralanan serinin tam tutarlılığı varsa Po = 1; bir ve aynı nesnenin mertebeleri iki açıdan aynıdır.

Sıralanan serilerde tam bir tutarsızlık varsa Po = -1; bu durum, sıralama serisinin ters yönde olması durumunda ortaya çıkar: R x i – 1 2 3 4 5; R y ben – 5 4 3 2 1.

Not: İki tür eşit için hesaplanabilir (eğer her nesnenin kendi sıralaması varsa ve ilgili sıralamalar varsa).

ρ-Spearman katsayısının istatistiksel önemi hakkındaki hipotezin test edilmesi.

H 0: ρ gs = 0

H 1: ρ gs ≠ 0

Sıfır hipotezi her zaman ρ'nın 0'a eşit olduğunu belirtir. Alternatif hipotez, ρ'nın değerinin 0'dan farklı olmasıdır.

Acil durum tablolarındaki gibi önem düzeyi.

Durum A B İÇİNDE G D e VE Z VE
Yaşam kalitesi 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
İşsizlik 20,3 18,0 19,8 23,4 21,6 20,8
rütbe x
y rütbesi
|d ben |
d 2 ben
Σ d 2 ben

t - Kendall ilişkili sıralar olmaması koşuluyla, popülasyondan rastgele alınan iki gözlem için doğru ve yanlış sıralama olasılıkları arasındaki farktır. Özellikler:

-1'den 1'e değişir;

x ve y özellikleri istatistiksel olarak bağımsızsa, τ katsayısı 0 olur; τ'nin 0'a eşit olması, özelliklerin istatistiksel olarak bağımsız olduğu anlamına gelmez;

τ 1'e eşitse, bu, özellikler arasında tam bir doğrudan istatistiksel ilişki olduğu veya sıralanan serilerin tamamen tutarlı olduğu anlamına gelir; τ -1 ise, tam bir istatistiksel ters ilişki olduğu veya sıralanan serilerin tutarsız olduğu anlamına gelir.

S, her iki nesne için tutarlı bir doğru sıraya sahip nesne çiftlerinin toplam sayısıdır. D, her iki nesne için tutarsız yanlış sıraya sahip nesne çiftlerinin toplam sayısıdır.

τ katsayısının istatistiksel önemi hakkındaki hipotezi test etme:

H 0: τ gs = 0

H 1: τ gs ≠ 0

HS katsayısı 0'dan farklıysa, τ katsayısı istatistiksel olarak anlamlıdır.

|Z H | > Z cr => H 1

Az sayıda nesne için sıralanmış bir seri oluşturursak, sıfır hipotezinin doğrulanması bize daha fazla sayıda nesneyi incelememiz gerektiğini söyler.

Yeterli sayıda nesne çalışılmışsa, sıfır hipotezinin doğrulanması, özellikler arasında hiçbir ilişki olmadığını gösterir.

Çoklu Rank Bağlantı Katsayısı

2'den fazla dereceli seri arasındaki ilişkiyi ölçmenin gerekli olduğu durumlarda kullanılır (örneğin, 1 ve aynı nesneleri derecelendirirken uzman görüşlerinin (2'den fazla) tutarlılığını değerlendirmek istediğimizde).

S, satır için sıra değerlerinin tüm popülasyon için ortalama sıradan kare sapmalarının toplamıdır. k 2 – değişken sayısı (uzman sayısı). n, sıralanan nesnelerin sayısıdır.

Özet kavramı, gruplama, sınıflandırma

Özet- sistematikleştirme ve özetleme: hava durumu raporu, alanlardan özet. Özet, bilgilerin ayrıntılı analizine izin vermez. Herhangi bir özet, veri gruplamasına dayalı olmalıdır, örn. önce gruplandırma, ardından verileri özetleme.

gruplama- popülasyonların en önemli özelliklerine göre birkaç gruba ayrılması.

Kalitatif ve kantitatif gruplamayı ayırt eder. kalite- niteliksel nicel- varyasyon. Buna karşılık, varyasyon yapısal ve analitik olarak ayrılır. . Yapısal gruplandırma, her grubun oranının hesaplanmasını içerir. Örnek: Bir işletmede %80'i işçi, %20'si çalışan, %5'i yönetici, %3'ü çalışan, %12'si uzmandır. Hedef analitik gruplamalar - işaretler arasındaki ilişkiyi belirlemek için: iş deneyimi ve ortalama kazanç, deneyim ve çıktı ve diğerleri.

Gruplandırırken şunları yapmalısınız:

İncelenen fenomenin doğasının kapsamlı bir analizini yapmak;

Bir gruplama özelliğinin tanımlanması (bir veya daha fazla);

Grupların sınırlarını, gruplar birbirinden önemli ölçüde farklı olacak ve her grupta homojen unsurlar birleştirilecek şekilde belirleyin.

Karmaşıklık derecesine göre, gruplandırmalar basit ve kombinasyonel olabilir (özelliklere göre).

İlk bilgilere göre, birincil ve ikincil gruplamalar ayırt edilir, öncelikİlk gözlem verilerine dayanarak gerçekleştirilen, ikincil birincil gruplama verilerini kullanır.

Grup sayısı belirlenir Sturgess formülüne göre:

Nerede N- grup sayısı, N- Genel popülasyon.

Eşit aralıklar kullanılıyorsa, o zaman aralık değeri eşittir .

Aralıklar eşit olabilir veya olmayabilir. İkincisi, sırayla, aritmetik veya geometrik ilerleme yasasına göre değişenlere ayrılır. İlk ve son aralıklar açık veya kapalı olabilir. Kapalı aralıklar, aralık sınırlarını içerir veya içermez.

Aralıklar kapalıysa ve üst sınırların dahil edilmesi hakkında hiçbir şey söylenmiyorsa, o zaman üst sınırların dahil edildiğini varsayarız.

Aralıklar açıksa, son aralık bizi yönlendirir.

Bu aralıklardaki bir işaret, ayrı ayrı ve sürekli olarak ölçülebilir (yani, bölünmüş). Sürekli işareti ile sınırlar 1-10, 10-20, 20-30; nitelik ayrı ayrı değişirse, aşağıdaki giriş kullanılabilir: 1 - 10, 11 - 20, 21 - 30.

Aralıklar açıksa, son aralığın değeri bir öncekine, birincisinin değeri de ikincisine eşittir.

sınıflandırma kaliteye göre gruplandırma. Nispeten kararlıdır, standardize edilmiştir ve devlet istatistik makamları tarafından onaylanmıştır.


3.2. Dağıtım sıraları: türleri ve ana özellikleri

Altında yakın dağıtım herhangi bir sosyo-ekonomik olguyu tek bir temelde karakterize eden bir dizi veriyi ifade eder. Bu, iki temelde en basit gruplama türüdür.

Dağıtım serileri, ayrık ve sürekli özellik dağılımı ile niteliksel ve niceliksel, sıralanmış ve sıralanmamış, gruplanmış ve gruplanmamış olarak ayrılmıştır.

Gruplandırılmamış, derecelendirilmemiş bir ödeme serisine bir örnek bordrodur. Aynı zamanda personel listesi alfabetik veya personel numaralarına göre sıralanabilir. Dereceli serilere bir örnek, takımların listesi, tenis oyuncularının sıralamasıdır.

sıralanmış sıra dağılımlar - bir özelliğin azalan veya artan düzeninde düzenlenmiş bir dizi veri.

Gruplandırılmış dereceli seriler için aşağıdaki özellikler ayırt edilir: değişken, sıklık veya sıklık, kümülatif ve dağıtım yoğunluğu.

Varyant()özelliğin ortalama aralık değeridir. Çünkü bir gruplama oluşturulurken, bir özelliğin her aralıkta tekdüze dağılımı ilkesi izlenmelidir, ardından değişken, aralıkların sınırlarının yarısı toplamı olarak hesaplanabilir.

Sıklık() verilen özellik değerinin kaç kez oluştuğunu gösterir. Bağıl frekans ifadesi sıklık(.) , yani pay, frekansların toplamından özgül ağırlık.

kümülatif() – kümülatif frekans veya frekans, kümülatif hesaplama. Hacim, maliyetler, gelirler kümülatif olarak hesaplanır, yani. etkinlik sonuçları.

tablo 1

Faal kredi kuruluşlarının gruplandırılması
kayıtlı kayıtlı sermaye miktarına göre

2008 yılında Rusya'da

Değişkenliğin istatistiksel çalışmasında ilk adım, bir varyasyon serisinin inşasıdır - bir özelliğin artan (daha sık) veya azalan (daha az sıklıkla) değerlerine göre popülasyon birimlerinin sıralı dağılımı ve bir ile birim sayısını sayma veya özelliğin başka bir değeri.

Üç çeşit varyasyon serisi vardır: aralıklı, ayrık, aralıklı. Varyasyonel bir seriye genellikle dağıtım serisi denir. Bu terim, hem nicel hem de nicel olmayan özelliklerin varyasyonunu incelerken kullanılır. Dağılım serisi yapısal bir gruplandırmadır (Bölüm 6).

Dereceli bir seri, çalışılan özelliğin artan (azalan) sırasına göre popülasyonun bireysel birimlerinin bir listesidir.

Aşağıda, 01.10.1999 itibariyle öz sermayeye göre sıralanmış, St. Petersburg'un büyük bankaları hakkında bilgiler bulunmaktadır.

Bankanın adı Öz sermaye, milyon ruble

Baltonexim bankası 169

Banka Saint Petersburg 237

Petrovski 268

Baltık 290

Promstroybank 1007

Popülasyon birimlerinin sayısı yeterince büyükse, dereceli seriler hantal hale gelir ve bir bilgisayar yardımıyla bile oluşturulması uzun zaman alır. Bu gibi durumlarda, popülasyon birimleri incelenen özelliğin değerlerine göre gruplanarak varyasyon serisi oluşturulur.

Grup sayısının belirlenmesi

Ayrık bir varyasyon serisindeki grupların sayısı, değişken özelliğinin gerçekte var olan değerlerinin sayısına göre belirlenir. Özellik ayrı değerler alıyorsa, ancak sayıları çok büyükse (örneğin, farklı tarımsal işletmelerde yılın 1 Ocak'ındaki canlı hayvan sayısı sıfırdan on binlerce baş arasında değişebilir), o zaman bir aralık varyasyon serisi oluşturulur. . Var oldukları alanda hem tamsayı hem de kesirli değerleri alabilen özellikleri incelemek için bir aralık varyasyon serisi de oluşturulur. Örneğin, satılan ürünlerin karlılığı, bir üretim biriminin maliyeti, şehir sakini başına gelir, farklı bölgelerin nüfusu arasında yüksek eğitimli insanların oranı ve genel olarak tüm ikincil özellikler, değerlerdir. bir birincil özelliğin değerinin diğerinin değerine bölünmesiyle hesaplanır (bkz. Bölüm 3).

Aralık varyasyon serisi, iki sütundan (veya satırdan) oluşan bir tablodur - varyasyonu incelenen özelliğin aralıkları ve bu aralığa düşen popülasyon birimlerinin sayısı (sıklıklar) veya bu sayının oranı toplam popülasyon (sıklıklar).

En yaygın olarak iki tür aralık varyasyon serisi kullanılır: eşit aralıklı ve eşit frekanslı. Eşit aralıklı seri, özelliğin varyasyonu çok güçlü değilse, yani belirli bir özelliğe göre dağılımı normal yasaya yakın olan homojen bir popülasyon için. (Böyle bir seri Tablo 5.6'da sunulmaktadır.) Özellik varyasyonu çok güçlüyse, ancak dağılım normal değil, örneğin hiperbolik ise, eşit frekanslı bir seri kullanılır (Tablo 5.5).

Eşit aralıklı bir seri oluştururken, grup sayısı, toplamdaki özellik değerlerinin çeşitliliği yeterince yansıtılacak ve aynı zamanda dağılımın düzenliliği, şekli rastgele bozulmayacak şekilde seçilir. frekans dalgalanmaları. Çok az sayıda grup varsa, varyasyon paterni olmayacaktır; çok fazla grup varsa, rastgele frekans atlamaları dağılımın şeklini bozacaktır.


Aralıkların sınırları farklı şekillerde belirtilebilir: Tabloda gösterildiği gibi, bir önceki aralığın üst sınırı bir sonrakinin alt sınırını tekrarlar. 5.5 veya tekrar etmez.

İkinci durumda, ikinci aralık 15.1-20, üçüncü - 20.1-25, vb., yani. tüm verim değerlerinin mutlaka onda bire yuvarlandığı varsayılır. Ek olarak, 15.1-20 aralığının ortasında istenmeyen bir komplikasyon ortaya çıkar ve bu, kesinlikle 17.5'e değil, 17.55'e eşit olacaktır; buna göre 40-60 yuvarlatılmış aralığını 40.1-60 ile değiştirdiğimizde ortadaki 50'nin yuvarlatılmış değeri yerine 50.5 elde ederiz. Bu nedenle, aralıkları yinelenen yuvarlatılmış bir sınırla bırakmak ve aralık sınırına eşit bir karakteristik değere sahip popülasyon birimlerinin bu tam değerin ilk raporlandığı aralığa dahil edilmesini kabul etmek tercih edilir. Böylece hektar başına 15 cent verim sağlayan bir çiftlik birinci gruba, hektar başına 20 cent değerinde bir işletme ikinci gruba dahil edilir ve bu böyle devam eder.

Bir özelliğin çok güçlü bir varyasyonu ile eşit frekanslı bir varyasyon serisi gereklidir, çünkü eşit aralıklı bir dağılımda, popülasyon birimlerinin çoğu

Tablo 5.5

100 Rus bankasının 01.01.2000 tarihi itibariyle aktif bakiye değerlemesine göre dağılımı

Eşit dağılım için aralıkların sınırları birinci, onuncu, onbirinci, yirminci vb. bankaların aktiflerinin gerçek değerleridir.

Varyasyon serisinin grafik gösterimi

Varyasyon serilerinin ve özelliklerinin analizinde önemli yardım, grafik gösterimle sağlanır. Aralık serisi, apsis ekseninde bulunan çubukların tabanlarının, değişen özniteliğin değerlerinin aralıkları olduğu ve çubukların yüksekliğinin, ölçek boyunca ölçeğe karşılık gelen frekanslar olduğu bir çubuk grafik ile temsil edilir. y ekseni. Bölgedeki çiftliklerin tahıl mahsulü verimleri açısından dağılımının grafiksel bir gösterimi, Şekil 2'de gösterilmektedir. 5.1. Bu tür bir diyagrama genellikle histogram (gr. histos - doku) denir.

Tablo verileri. 5.6 ve şek. 5.1, birçok özelliğin dağılım özelliğini gösterir: özelliğin ortalama aralıklarının değerleri daha yaygındır, daha az sıklıkla özelliğin aşırı, küçük ve büyük değerleridir. Bu dağılımın şekli, matematiksel istatistik dersinde ele alınan normal dağılım yasasına yakındır. Büyük Rus matematikçi A. M. Lyapunov (1857-1918) normal olduğunu kanıtladı.

Tablo 5.6 Bölgedeki çiftliklerin tahıl verimine göre dağılımı

Bir değişken, hiçbiri baskın bir etkiye sahip olmayan çok sayıda faktörden etkilendiğinde küçük bir dağılım oluşur. Hem doğal hem de agroteknik, ekonomik tahıl mahsullerinin verim varyasyonlarını etkileyen yaklaşık olarak eşit birçok faktörün rastgele bir kombinasyonu, bölge çiftliklerinin verim açısından normal dağılım yasasına yakın bir dağılımını oluşturur.

Pirinç. 5.2. Çiftliklerin verime göre kümülatif ve genel dağılımı

Böyle bir seriye kümülatif denir. "Daha az değil" veya "daha büyük" bir kümülatif dağıtım oluşturabilirsiniz. İlk durumda, kümülatif dağılımın grafiğine kümülatif denir, ikinci durumda - ogive (Şekil 5.2).

dağıtım yoğunluğu

Eşit olmayan aralıklara sahip bir varyasyon serisiyle uğraşmak zorundaysanız, karşılaştırılabilirlik için frekansı veya frekansı aralığın birimine getirmeniz gerekir. Ortaya çıkan orana dağıtım yoğunluğu denir:

Dağılım yoğunluğu, hem genelleştirici göstergeleri hesaplamak hem de eşit olmayan aralıklarla varyasyon serilerinin grafik gösterimi için kullanılır.

patates üretimi sıralanmış istatistiksel

Tablo 2'deki göstergelere dayanarak, 100 hektar ekilebilir arazi başına patates üretimi için sıralanmış sıraları derliyoruz; patates veriminde; maliyetli. Bu göstergeler arasındaki ilişki grafiksel olarak gösterilmiştir.

Varyasyonun istatistiksel çalışmasında ilk adım, bir varyasyon serisinin inşasıdır - bir özelliğin artan (daha sık) veya azalan (daha az sıklıkla) değerlerine göre popülasyon birimlerinin düzenli bir dağılımı.

Bir varyasyon serisinin üç biçimi vardır: aralıklı seri, ayrık seri, aralıklı seri. Varyasyonel bir seriye genellikle dağıtım serisi denir.

Dereceli bir seri, çalışılan özelliğin artan (azalan) düzeninde popülasyonun bireysel birimlerinin bir listesidir.

Sıralama, tercih temelinde gerçekleştirilen çalışma nesnelerini sıralamak için bir prosedürdür. Varyasyon aralığı, popülasyonun birimleri arasındaki farkın ne kadar büyük olduğunu gösterir.

Derece, değerlerinin artan veya azalan sırasına göre düzenlenmiş öznitelik değerlerinin sıra sayısıdır. Özelliğin değeri aynı nicel değerlendirmeye sahipse, tüm bu değerlerin sıralaması, belirlenen yerlerin karşılık gelen sayılarının aritmetik ortalamasına eşit alınır. Bu sıralara bağlı denir.

İstatistikteki grafikler, istatistiksel göstergeleri geometrik şekiller ve işaretler, çizimler veya şematik haritalar biçiminde görselleştirmenin bir yoludur. Görsel bir görüntü, bilgilerin algılanmasını kolaylaştırır, birbiriyle bağlantılı bir dizi göstergeyi kapsamanıza, gelişme eğilimlerini ve tipik gösterge oranlarını belirlemenize olanak tanır.

Dinamik göstergeleri görüntülemek için çizgi grafikler veya çubuk grafikler kullanılması tavsiye edilir. Grafik görsel, anlaşılır, okunması kolay ve mümkünse dikkatleri üzerine çekecek sanatsal tasarımlı olmalıdır.

Dağılım grafikleri oluşturulurken, grafik örnekleri olarak bir dizi nokta kullanılır; doğrusal çizgiler oluştururken. Grafik oluşturma her zaman yaratıcı bir süreçtir. Burada biraz arama yapmak gerekiyor. Yalnızca birkaç taslak sürümü derledikten ve karşılaştırdıktan sonra, grafiğin doğru bileşimini belirlemek, grafik alanındaki işaretlerin ölçeğini ve konumunu ayarlamak mümkündür.

100 hektar ekilebilir arazi başına patates üretimi için sıralanan seriden, en düşük üretimin Balagansky bölgesinde gözlemlendiği ve Angarsky bölgesinin 100 hektar ekilebilir araziden en yüksek patates verimliliğine sahip olduğu sonucuna varabiliriz.

En düşük verim Kachugsky bölgesinde - 10 cent / ha ve en yüksek Usolsky - 195,5 cent / ha.

100 hektarlık ekilebilir arazi başına yüksek patates üretimine sahip Chunsky bölgesinde, en düşük maliyet 1 c. Maksimum maliyet Nizhne-Ilimsk bölgesinde görülmektedir. Bir sentlik patatesin maliyetindeki değişim aralığı çok büyük ve 1161.01 rubleye eşit.

Diğer yayınlar

İşletmenin ekonomik faaliyetinin analizi
Piyasa ekonomisine geçiş, bir işletmenin etkin ekonomik yönetim ve üretim yönetimi biçimlerinin getirilmesi, bilimsel ve teknolojik ilerlemenin başarıları ve ...

JSC TransContainer'ın mali ve ekonomik faaliyetlerinin analizi
Finansal analiz, gelecekteki koşulları ve performansı değerlendirmek için işletmenin finansal durumu ve geçmişteki faaliyetlerinin sonuçları hakkındaki verilerin incelenmesine dayanan bir süreçtir. Bu nedenle, finansal analizin asıl görevi ...

KATEGORİLER

POPÜLER MAKALELER

2023 "kingad.ru" - insan organlarının ultrason muayenesi