Variációs sorozat. átlagos értékek

Nevezzük a különböző mintaértékeket lehetőségekértéksorokat és jelölje: x 1 , x 2,…. Először is gyártunk körű opciók, pl. elrendezésüket növekvő vagy csökkenő sorrendben. Mindegyik opciónál fel van tüntetve a saját súlya, pl. egy szám, amely egy adott opció hozzájárulását jellemzi a teljes népességhez. A frekvenciák vagy frekvenciák súlyként működnek.

Frekvencia n i választási lehetőség x i egy szám, amely megmutatja, hogy egy adott opció hányszor fordul elő a vizsgált mintapopulációban.

Frekvencia vagy relatív gyakoriság w i választási lehetőség x i egy olyan szám, amely egyenlő egy változat gyakoriságának az összes változat gyakoriságának összegéhez viszonyított arányával. A gyakoriság azt mutatja meg, hogy a mintapopuláció egységeinek hányadában van egy adott változat.

Az opciók sorozatát a hozzájuk tartozó súlyokkal (frekvenciákkal vagy frekvenciákkal), növekvő (vagy csökkenő) sorrendben felírva az ún. variációs sorozat.

A variációs sorozatok diszkrétek és intervallumúak.

Egy diszkrét variációs sorozatnál a jellemző pontértékei vannak megadva, egy intervallumsorozatnál a jellemző értékek intervallumok formájában vannak megadva. A variációs sorozatok a frekvenciák vagy a relatív frekvenciák (frekvenciák) eloszlását mutathatják meg, attól függően, hogy az egyes opciókhoz milyen érték van megadva - frekvencia vagy frekvencia.

Frekvenciaeloszlás diszkrét variációs sorozata a következő formában van:

A frekvenciákat a következő képlettel találjuk meg: i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

Példa 4.1. Adott számkészlethez

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

frekvencia és frekvenciaeloszlás diszkrét variációs sorozatát szerkeszteni.

Megoldás . A lakosság mennyisége egyenlő n= 10. A diszkrét frekvenciaeloszlási sorozat alakja

Az intervallumsorozatoknak hasonló a rögzítési formája.

Frekvenciaeloszlás intervallum variációs sorozataígy van írva:

Az összes gyakoriság összege egyenlő a megfigyelések teljes számával, azaz. teljes hangerő: n = n 1 +n 2 + … + n m.

A relatív gyakoriságok (frekvenciák) eloszlásának intervallumvariációs sorozatai a következő formában van:

A frekvenciát a következő képlet határozza meg: i = 1, 2, …, m.

Az összes frekvencia összege eggyel egyenlő: w 1 +w 2 + … + w m = 1.

A gyakorlatban leggyakrabban intervallumsorokat alkalmaznak. Ha sok a statisztikai mintaadat, és értékeik tetszőlegesen eltérnek egymástól, akkor ezeknek az adatoknak a diszkrét sorozata meglehetősen nehézkes és kényelmetlen lesz a további kutatáshoz. Ebben az esetben adatcsoportosítást alkalmazunk, azaz. Az attribútum összes értékét tartalmazó intervallumot több részintervallumra osztjuk, és az egyes intervallumok gyakoriságának kiszámításával intervallumsorozatot kapunk. Írjuk le részletesebben az intervallumsorozat felépítésének sémáját, feltételezve, hogy a részintervallumok hossza azonos lesz.

2.2 Intervallumsorozat felépítése

Intervallumsorozat készítéséhez a következőkre lesz szüksége:

Határozza meg az intervallumok számát;

Határozza meg az intervallumok hosszát;

Határozza meg az intervallumok helyét a tengelyen!

Meghatározására intervallumok száma k Létezik Sturges képlete, amely szerint

,

Ahol n- a teljes aggregátum térfogata.

Például, ha egy jellemzőnek (változatnak) 100 értéke van, akkor ajánlatos az intervallumokkal megegyező számú intervallumot venni egy intervallumsorozat felépítéséhez.

A gyakorlatban azonban nagyon gyakran maga a kutató választja meg az intervallumok számát, figyelembe véve, hogy ez a szám ne legyen túl nagy, hogy a sorozat ne legyen nehézkes, de ne legyen túl kicsi is, hogy ne veszítse el a sorozat bizonyos tulajdonságait. terjesztés.

Intervallum hossza h a következő képlettel határozzuk meg:

,

Ahol x max és x min az opciók legnagyobb és legkisebb értéke.

Méret hívott hatálya sor.

Maguk az intervallumok létrehozásához különböző módon járnak el. Az egyik legegyszerűbb módszer a következő. Az első intervallum kezdetét úgy tekintjük
. Ezután az intervallumok fennmaradó határait a képlet találja meg. Nyilvánvalóan az utolsó intervallum vége a m+1-nek meg kell felelnie a feltételnek

Miután megtaláltuk az intervallumok határait, meghatározzuk ezen intervallumok gyakoriságát (vagy frekvenciáit). A probléma megoldásához tekintse át az összes lehetőséget, és határozza meg az adott intervallumba eső opciók számát. Nézzük meg egy intervallumsorozat teljes felépítését egy példa segítségével.

Példa 4.2. A következő, növekvő sorrendben rögzített statisztikai adatokhoz állítson össze egy intervallumsort 5-tel egyenlő intervallumokkal:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Megoldás. Teljes n=50 változat érték.

Az intervallumok számát a problémafelvetésben adjuk meg, pl. k=5.

Az intervallumok hossza a
.

Határozzuk meg az intervallumok határait:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Az intervallumok gyakoriságának meghatározásához megszámoljuk az adott intervallumba eső opciók számát. Például a 2,5 és 19,5 közötti első intervallum a 11, 12, 12, 14, 14, 15 opciókat tartalmazza. Számuk 6, ezért az első intervallum gyakorisága n 1 = 6. Az első intervallum gyakorisága a . A 19,5 és 36,5 közötti második intervallum a 21, 21, 22, 23, 25 opciókat tartalmazza, amelyek száma 5. Ezért a második intervallum gyakorisága n 2 =5, és a gyakoriság . Miután minden intervallumhoz hasonló módon megtaláltuk a frekvenciákat és a frekvenciákat, a következő intervallumsorozatot kapjuk.

A gyakorisági eloszlás intervallumsorozatának alakja:

A frekvenciák összege 6+5+9+11+8+11=50.

A gyakorisági eloszlás intervallumsorozatának alakja:

A frekvenciák összege 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Az intervallumsorok készítésekor a vizsgált probléma konkrét feltételeitől függően más szabályok is alkalmazhatók, nevezetesen

1. Az intervallumvariációs sorozatok különböző hosszúságú részintervallumokból állhatnak. Az egyenlőtlen intervallumok lehetővé teszik egy statisztikai sokaság tulajdonságainak kiemelését a jellemző egyenetlen eloszlásával. Például, ha az intervallumok határai határozzák meg a városok lakosainak számát, akkor ebben a feladatban célszerű nem egyenlő hosszúságú intervallumokat használni. Nyilvánvalóan a kisvárosok számára fontos a lakosságszám kis különbsége, de a nagyvárosoknál a több tíz-száz lakos különbség nem jelentős. Az egyenlőtlen hosszúságú részintervallumokkal rendelkező intervallumsorokat főként a statisztika általános elmélete tanulmányozza, és ezek figyelembevétele meghaladja a jelen kézikönyv kereteit.

2. A matematikai statisztikában időnként olyan intervallumsorokat is figyelembe vesznek, amelyeknél az első intervallum bal határát –∞-nek, az utolsó intervallum jobb oldali határát pedig +∞-nek tételezzük fel. Ez azért történik, hogy a statisztikai eloszlást közelebb hozzuk az elméletihez.

3. Intervallumsorok felépítésénél kiderülhet, hogy valamelyik opció értéke pontosan egybeesik az intervallum határával. Ebben az esetben a legjobb teendő a következő. Ha csak egy ilyen egybeesés van, akkor vegye figyelembe, hogy a szóban forgó lehetőség a gyakoriságával az intervallumsor közepéhez közelebb eső intervallumba esett; ha több ilyen lehetőség van, akkor vagy mindegyiket hozzárendeljük az intervallumokhoz ezek közül a lehetőségek közül jobbra, vagy mindegyik a bal oldalhoz van hozzárendelve.

4. Az intervallumok számának és hosszának meghatározása után az intervallumok elrendezése más módon is elvégezhető. Keresse meg az opciók összes figyelembe vett értékének számtani átlagát x Házasodik és építsük fel az első intervallumot úgy, hogy ez a mintaátlag valamilyen intervallumon belül legyen. Így az intervallumot kapjuk x Házasodik – 0,5 h előtt xátl.. ​​+ 0,5 h. Majd balra és jobbra az intervallum hosszát összeadva a fennmaradó intervallumokat addig építjük x min és x max nem fog beleesni az első és az utolsó intervallumba.

5. A nagy számú intervallumot tartalmazó intervallumsorokat kényelmesen függőlegesen írjuk, azaz. az intervallumokat ne az első sorba, hanem az első oszlopba írja be, a második oszlopba pedig a gyakoriságokat (vagy frekvenciákat).

A mintaadatok valamilyen valószínűségi változó értékeinek tekinthetők x. A valószínűségi változónak saját eloszlási törvénye van. Valószínűségelméletből ismert, hogy egy diszkrét valószínűségi változó eloszlási törvénye eloszlási sorozat formájában adható meg, a folytonosé pedig - az eloszlássűrűség függvény segítségével. Van azonban egy univerzális eloszlási törvény, amely mind a diszkrét, mind a folytonos valószínűségi változókra érvényes. Ez az eloszlási törvény eloszlásfüggvényként van megadva F(x) = P(x<x). A mintaadatokhoz megadhatja az eloszlásfüggvény analógját - az empirikus eloszlásfüggvényt.


Kapcsolódó információ.


Variációs sorozat egy jellemző számértékeinek sorozata.

A variációs sorozat főbb jellemzői: v – változat, p – előfordulásának gyakorisága.

A variációs sorozatok típusai:

    az opciók előfordulási gyakorisága szerint: egyszerű - az opció egyszer fordul elő, súlyozott - az opció kétszer vagy többször fordul elő;

    az opciók elhelyezkedése szerint: rangsorolt ​​- az opciók csökkenő és növekvő sorrendben vannak elrendezve, nem rangsorolt ​​- az opciók nincsenek meghatározott sorrendben felírva;

    egy opció csoportokba kombinálásával: csoportosítva - az opciók csoportokba kerülnek, nem csoportosítva - az opciók nem kerülnek csoportokba;

    méret szerint opciók: folyamatos - az opciókat egész és tört számként fejezzük ki, diszkrét - az opciókat egész számként fejezzük ki, komplex - az opciókat relatív vagy átlagos értékkel ábrázoljuk.

Az átlagértékek kiszámításához egy variációs sorozatot állítanak össze és formalizálnak.

Variációs sorozat rögzítési formája:

8. Átlagértékek, típusok, számítási módszerek, alkalmazás az egészségügyben

Átlagos értékek– a mennyiségi jellemzők halmozott általánosító jellemzője. Átlagok alkalmazása:

1. Az egészségügyi intézmények munkaszervezésének jellemzése, tevékenységük értékelése:

a) a rendelőben: az orvosok leterheltségének mutatói, átlagos vizitek száma, átlagos lakosok száma a területen;

b) kórházban: egy ágy átlagosan nyitva tartási napjai évente; átlagos kórházi tartózkodási idő;

c) a higiéniai, járványügyi és közegészségügyi központban: egy főre jutó átlagos terület (vagy űrtartalom), átlagos táplálkozási normák (fehérjék, zsírok, szénhidrátok, vitaminok, ásványi sók, kalória), egészségügyi normák és szabványok stb.;

2. A testi fejlődés jellemzése (főbb antropometriai jellemzők, morfológiai és funkcionális);

3. A szervezet orvosi és élettani paramétereinek meghatározása normál és kóros állapotokban klinikai és kísérleti vizsgálatokban.

4. Speciális tudományos kutatásokban.

Az átlagértékek és a mutatók közötti különbség:

1. Az együtthatók a statisztikai sokaságnak csak egy bizonyos részében előforduló alternatív jellemzőt jellemeznek, amely előfordulhat, de előfordulhat, hogy nem.

Az átlagértékek olyan jellemzőket takarnak, amelyek a csapat minden tagjára jellemzőek, de eltérő mértékben (súly, magasság, kórházi kezelési napok).

2. A minőségi jellemzők mérésére együtthatókat használunk. Átlagértékek – változó mennyiségi jellemzőkre.

Az átlagok típusai:

    számtani átlag, jellemzői a szórás és az átlaghiba

    mód és medián. Divat (hétfő)– az adott populációban másoknál gyakrabban előforduló jellemző értékének felel meg. Medián (én)– egy adott populáció mediánértékét elfoglaló jellemző értéke. A sorozatot a megfigyelések száma szerint 2 egyenlő részre osztja. Számtani átlag (M)– a módustól és a mediántól eltérően minden megfigyelésen alapul, ezért a teljes eloszlásra nézve fontos jellemző.

    más típusú átlagok, amelyeket speciális vizsgálatokban használnak: négyzetgyök, köbös, harmonikus, geometriai, progresszív.

Számtani átlaga a statisztikai sokaság átlagos szintjét jellemzi.

Egy egyszerű sorozathoz hol

∑v – összeg opció,

n – megfigyelések száma.

súlyozott sorozathoz, ahol

∑vр – az egyes opciók szorzatainak összege és előfordulásuk gyakorisága

n – megfigyelések száma.

Szórás a számtani átlag vagy szigma (σ) egy jellemző diverzitását jellemzi

- egy egyszerű sorozathoz

Σd 2 – a számtani átlag és az egyes opciók közötti különbség négyzeteinek összege (d = │M-V│)

n – megfigyelések száma

- mérlegelt sorozathoz

∑d 2 p – a számtani átlag és az egyes opciók közötti különbség négyzeteinek szorzata, valamint előfordulási gyakorisága,

n – megfigyelések száma.

A diverzitás mértéke a variációs koefficiens nagyságából ítélhető meg
. Több mint 20% erős diverzitás, 10-20% közepes, 10% alatti gyenge diverzitás.

Ha a számtani középértékhez hozzáadunk és kivonunk egy szigmát (M ± 1σ), akkor normális eloszlás mellett az összes változat (megfigyelés) legalább 68,3%-a ezeken a határokon belül lesz, ami a vizsgált jelenség normájának tekinthető. . Ha k 2 ± 2σ, akkor az összes megfigyelés 95,5%-a, ha pedig k M ± 3σ, akkor az összes megfigyelés 99,7%-a ezeken a határokon belül lesz. Így a szórás olyan szórás, amely lehetővé teszi számunkra, hogy előre jelezzük a vizsgált jellemző olyan értékének előfordulási valószínűségét, amely a meghatározott határokon belül van.

A számtani átlag átlagos hibája vagy reprezentativitási torzítás. Egy egyszerű, súlyozott sorozathoz és a pillanatok szabályához:

.

Az átlagos értékek kiszámításához szükséges: az anyag homogenitása, elegendő számú megfigyelés. Ha a megfigyelések száma kevesebb, mint 30, akkor n-1-et használunk a σ és m számítási képletekben.

Az átlagos hiba nagyságával kapott eredmény értékelésénél konfidencia együtthatót használunk, amely lehetővé teszi a helyes válasz valószínűségének meghatározását, vagyis azt jelzi, hogy a mintavételi hiba eredő értéke nem lesz nagyobb, mint a folyamatos megfigyelés eredményeként elkövetett tényleges hiba. Következésképpen a konfidenciavalószínűség növekedésével a konfidenciaintervallum szélessége nő, ami viszont növeli az ítélet megbízhatóságát és a kapott eredmény alátámaszthatóságát.

Variációs sorozat - ez egy statisztikai sorozat, amely a vizsgált jelenség megoszlását mutatja bármely mennyiségi jellemző értéke szerint. Például a betegek életkora, a kezelés időtartama, az újszülöttek súlya stb.

választási lehetőség - a jellemző egyéni értékei, amelyek alapján a csoportosítás történik (jelölve V ) .

Frekvencia- egy szám, amely azt mutatja, hogy egy adott opció milyen gyakran fordul elő (jelölve P ) . Az összes frekvencia összege mutatja teljes szám megfigyeléseket és kijelölik n . A variációs sorozat legnagyobb és legkisebb változata közötti különbséget ún span vagy amplitúdó .

Vannak variációs sorozatok:

1. Nem folytonos (diszkrét) és folyamatos.

Folyamatosnak tekinthető egy sorozat, ha a csoportosítási jellemző tört értékekkel fejezhető ki (súly, magasság stb.), nem folytonosnak, ha a csoportosítási jellemzőt csak egész számként fejezzük ki (rokkantsági napok, pulzusok száma stb.) .

2. Egyszerű és kiegyensúlyozott.

Egy egyszerű variációs sorozat olyan sorozat, amelyben egy változó jellemző mennyiségi értéke egyszer fordul elő. Egy súlyozott variációs sorozatban egy változó jellemző mennyiségi értékei bizonyos gyakorisággal ismétlődnek.

3. Csoportosított (intervallum) és csoportosítatlan.

A csoportosított sorozatok olyan csoportokba kombinált opciókat tartalmaznak, amelyek egy bizonyos intervallumon belül egyesítik őket méretük szerint. Egy csoportosítatlan sorozatban minden egyes opció egy bizonyos gyakoriságnak felel meg.

4. Páros és páratlan.

A páros variációs sorozatokban a gyakoriságok összegét vagy a megfigyelések teljes számát páros számmal, a páratlanban pedig páratlan számmal fejezzük ki.

5. Szimmetrikus és aszimmetrikus.

Egy szimmetrikus variációs sorozatban minden típusú átlagérték egybeesik vagy nagyon közel van egymáshoz (módus, medián, számtani átlag).

A vizsgált jelenségek természetétől, a statisztikai kutatás konkrét feladataitól és céljaitól, valamint a forrásanyag tartalmától függően az egészségügyi statisztikában. A következő típusú átlagokat használják:

szerkezeti eszközök (mód, medián);

számtani átlaga;

harmonikus átlag;

geometriai átlag;

átlagos progresszív.

Divat (M O ) - a vizsgált populációban gyakrabban előforduló változó jellemző értéke, pl. a legmagasabb frekvenciának megfelelő opciót. Közvetlenül a variációs sorozat szerkezetéből találják meg, számítások nélkül. Általában a számtani átlaghoz nagyon közeli érték, és a gyakorlatban nagyon kényelmes.

Medián (M e ) - a variációs sorozat felosztása (rangsorolva, azaz az opció értékei növekvő vagy csökkenő sorrendben vannak elrendezve) két egyenlő részre. A medián kiszámítása az úgynevezett páratlan sorozat segítségével történik, amelyet a frekvenciák szekvenciális összegzésével kapunk. Ha a gyakoriságok összege páros számnak felel meg, akkor a két átlagérték számtani középértékét tekintjük mediánnak.

A módozatot és a mediánt nyitott populáció esetén használjuk, azaz. amikor a legnagyobb vagy legkisebb opciók nem rendelkeznek pontos mennyiségi jellemzővel (például 15 éves korig, 50 év felettiek stb.). Ebben az esetben a számtani átlag (paraméteres jellemzők) nem számítható ki.

Átlagos aritmetikus vagyok - a leggyakoribb érték. A számtani átlagot gyakran jelölik M.

Vannak egyszerű és súlyozott számtani átlagok.

Egyszerű számtani átlag számított:

- azokban az esetekben, amikor a sokaságot egy-egy jellemző tudásának egyszerű listája képviseli minden egységre vonatkozóan;

- ha az egyes opciók ismétlésének száma nem határozható meg;

- ha az egyes opciók ismétlésszáma közel van egymáshoz.

Az egyszerű számtani átlag kiszámítása a következő képlettel történik:

ahol V - a jellemző egyedi értékei; n - egyedi értékek száma;
- összegző jel.

Így az egyszerű átlag a változatok összegének a megfigyelések számához viszonyított aránya.

Példa: határozza meg 10 tüdőgyulladásban szenvedő beteg átlagos ágyban tartózkodási idejét:

16 nap - 1 beteg; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

ágy-nap

Súlyozott számtani átlag akkor kerül kiszámításra, ha egy jellemző egyedi értékei ismétlődnek. Kétféleképpen számítható ki:

1. Közvetlenül (számtani átlag vagy közvetlen módszer) a következő képlet szerint:

,

ahol P az egyes opciók megfigyelésének gyakorisága (esetek száma).

Így a súlyozott számtani átlag a változat és a gyakoriság szorzata összegének a megfigyelések számához viszonyított aránya.

2. A feltételes átlagtól való eltérések kiszámításával (momentumok módszerével).

A súlyozott számtani átlag kiszámításának alapja:

― egy mennyiségi jellemző változatai szerint csoportosított anyag;

— az összes lehetőséget az attribútum értékének növekvő vagy csökkenő sorrendjében kell elrendezni (rangsorolt ​​sorozat).

A momentum módszerrel történő kiszámítás előfeltétele az összes intervallum azonos méretű.

A nyomatékok módszerével a számtani átlag kiszámítása a következő képlettel történik:

,

ahol M o a feltételes átlag, amit gyakran a legmagasabb frekvenciának megfelelő karakterisztika értékének vesznek, azaz. ami gyakrabban ismétlődik (Divat).

i az intervallum értéke.

a az átlag feltételeitől való feltételes eltérés, amely számok sorozata (1, 2 stb.) + jellel a nagy feltételes átlagok változatainál és – előjellel (–1, –2 stb. .) a hagyományos átlag alatti változatokra. A feltételes átlagnak vett változattól való feltételes eltérés 0.

P - frekvenciák.

- a megfigyelések teljes száma vagy n.

Példa: határozzák meg közvetlenül a 8 éves fiúk átlagos magasságát (1. táblázat).

Asztal 1

Magasság cm-ben

fiúk P

Központi

V. lehetőség

A központi opció - az intervallum közepe - két szomszédos csoport kezdeti értékének félösszegeként van meghatározva:

;
stb.

A VP szorzatot úgy kapjuk meg, hogy a központi változatokat megszorozzuk a frekvenciákkal
;
stb. Ezután a kapott termékeket hozzáadjuk és előállítjuk
, amelyet elosztunk a megfigyelések számával (100), és megkapjuk a súlyozott számtani átlagot.

cm.

Ugyanezt a problémát a momentumok módszerével oldjuk meg, amelyre a következő 2. táblázatot állítjuk össze:

2. táblázat

Magasság cm-ben (V)

fiúk P

n=100

122-t veszünk M o-nak, mert 100 megfigyelésből 33 ember 122 cm magas volt. A feltételes átlagtól (a) feltételes eltéréseket találunk a fentieknek megfelelően. Ezután megkapjuk a feltételes eltérések szorzatát a frekvenciákkal (aP), és összeadjuk a kapott értékeket (
). Az eredmény 17. Végül behelyettesítjük az adatokat a képletbe:

Változó jellemzők vizsgálatakor nem korlátozódhatunk csak az átlagértékek kiszámítására. Ki kell számítani a vizsgált jellemzők diverzitásának mértékét jellemző mutatókat is. Egyik vagy másik mennyiségi jellemző értéke nem azonos a statisztikai sokaság minden egységénél.

Egy variációs sorozat jellemzője a szórás ( ), amely a vizsgált jellemzők szórását (szórását) mutatja a számtani átlaghoz viszonyítva, azaz. a variációs sorozat változékonyságát jellemzi. Közvetlenül a képlet segítségével határozható meg:

A szórás egyenlő az egyes opciók számtani átlagától (V–M) 2 kapott négyzetes eltérések szorzatának négyzetgyökével, a gyakoriságok osztva a gyakoriságok összegével (
).

Számítási példa: határozza meg a rendelőintézetben kiadott betegszabadság átlagos napi számát (3. táblázat).

3. táblázat

Betegnapok száma

kiadott lapokat

orvos naponta (V)

Orvosok száma (P)

;

A nevezőben, ha a megfigyelések száma kevesebb, mint 30, től kell
kivonni egyet.

Ha a sorozatokat egyenlő időközönként csoportosítjuk, akkor a szórás a nyomatékok módszerével határozható meg:

,

ahol i az intervallum értéke;

- feltételes eltérés a feltételes átlagtól;

P - a megfelelő intervallumok frekvenciaváltozata;

- a megfigyelések teljes száma.

Példa számítás : Határozza meg a betegek terápiás ágyon való tartózkodásának átlagos időtartamát (pillanatok módszerével) (4. táblázat):

4. táblázat

Napok száma

ágyban maradni (V)

beteg (P)

;

A. Quetelet belga statisztikus felfedezte, hogy a tömegjelenségek változásai engedelmeskednek a hibaeloszlás törvényének, amelyet K. Gauss és P. Laplace szinte egyszerre fedezett fel. Az ezt az eloszlást ábrázoló görbe harang alakú. A normál eloszlási törvény szerint egy jellemző egyedi értékeinek változékonysága a határokon belül van
, amely a lakosság összes egységének 99,73%-át fedi le.

Kiszámították, hogy ha a számtani átlaghoz hozzáadunk és kivonunk 2-t , akkor a variációs sorozat összes tagjának 95,45%-a a kapott értékeken belül van, és végül, ha a számtani átlaghoz hozzáadunk és kivonunk 1-et , akkor a variációs sorozat összes tagjának 68,27%-a a kapott értékeken belül lesz. Az orvostudományban nagyságrenddel
1a norma fogalmához kapcsolódik. A számtani átlagtól való eltérés nagyobb, mint 1 , de kevesebb, mint 2 szubnormális, és az eltérés nagyobb, mint 2 kóros (normál feletti vagy alatti).

Az egészségügyi statisztikákban a három szigma szabályt a testi fejlettség vizsgálatakor, az egészségügyi intézmények teljesítményének felmérésekor, valamint a lakosság egészségi állapotának felmérésekor alkalmazzák. Ugyanezt a szabályt széles körben alkalmazzák a nemzetgazdaságban a szabványok meghatározásakor.

Így a szórás a következőkre szolgál:

— a változási sorozatok szórásának mérése;

— a jellemzők diverzitási fokának jellemzői, amelyeket a variációs együttható határoz meg:

Ha a variációs együttható több mint 20% - erős diverzitás, 20-10% - átlagos, kevesebb, mint 10% - gyenge diverzitás. A variációs együttható bizonyos mértékig kritériuma a számtani átlag megbízhatóságának.

A fejezet elsajátítása eredményeként a hallgatónak: tud

  • változási mutatók és ezek kapcsolata;
  • a jellemzők eloszlásának alapvető törvényei;
  • a hozzájárulási kritériumok lényege; képesnek lenni
  • kiszámítja a variációs indexeket és az illeszkedési kritériumokat;
  • meghatározza az eloszlási jellemzőket;
  • értékeli a statisztikai eloszlássorok alapvető numerikus jellemzőit;

saját

  • eloszlási sorozatok statisztikai elemzésének módszerei;
  • varianciaanalízis alapjai;
  • technikák a statisztikai eloszlássorok ellenőrzésére, hogy megfelelnek-e az eloszlás alapvető törvényeinek.

Változási mutatók

A különböző statisztikai sokaságok jellemzőinek statisztikai vizsgálata során nagy érdeklődésre tart számot a sokaság egyes statisztikai egységei jellemzőinek változása, valamint az egységek e jellemző szerinti eloszlásának jellege. Változat - ezek egy jellemző egyéni értékeinek különbségei a vizsgált populáció egységei között. A variáció tanulmányozása nagy gyakorlati jelentőséggel bír. A variáció mértéke alapján meg lehet ítélni egy jellemző variációs határait, a sokaság homogenitását egy adott jellemző mellett, az átlag tipikusságát, valamint a változást meghatározó tényezők kapcsolatát. A variációs mutatókat a statisztikai sokaságok jellemzésére és rendszerezésére használják.

A statisztikai megfigyelési anyagok összesítésének és csoportosításának statisztikai eloszlási sorok formájában bemutatott eredményei a vizsgált sokaság egységeinek csoportosítási (változó) szempontok szerinti csoportokba rendezett eloszlását jelentik. Ha egy minőségi jellemzőt veszünk a csoportosítás alapjául, akkor egy ilyen eloszlássorozatot nevezünk jelző(szakma, nem, szín stb. megoszlása). Ha egy eloszlássorozatot mennyiségi alapon szerkesztünk, akkor egy ilyen sorozatot ún variációs(magasság, súly, fizetés stb. szerinti megoszlás). Variációs sorozat felépítése azt jelenti, hogy a populációs egységek mennyiségi eloszlását jellemző értékek alapján megszervezzük, megszámoljuk az ezekkel az értékekkel rendelkező populációs egységek számát (gyakorisága), és az eredményeket táblázatba rendezzük.

Egy változat gyakorisága helyett a megfigyelések teljes mennyiségéhez viszonyított arányát használhatjuk, amelyet gyakoriságnak (relatív gyakoriságnak) nevezünk.

Kétféle variációs sorozat létezik: diszkrét és intervallum. Diszkrét sorozat- Ez egy variációs sorozat, amelynek felépítése nem folytonos változású karakterisztikákon (diszkrét karakterisztikák) alapul. Ez utóbbiak közé tartozik a vállalkozásnál foglalkoztatottak száma, tarifakategória, a családban élő gyermekek száma stb. A diszkrét variációs sorozat két oszlopból álló táblázatot jelent. Az első oszlop az attribútum konkrét értékét, a második oszlop pedig a sokaság egységek számát jelzi az attribútum adott értékével. Ha egy jellemzőnek folyamatos változása van (jövedelem összege, szolgálati idő, a vállalkozás tárgyi eszközeinek bekerülési értéke stb., ami bizonyos határok között tetszőleges értéket felvehet), akkor erre a jellemzőre lehet konstruálni intervallum variációs sorozat. Intervallumváltozat-sorozat felépítésénél a táblázatnak is két oszlopa van. Az első az attribútum értékét jelzi a „-tól” intervallumban (opciók), a második az intervallumban lévő egységek számát (gyakoriság). Frekvencia (ismétlési gyakoriság) - az attribútumértékek egy adott változatának ismétlődéseinek száma. Az intervallumok zártak vagy nyitottak lehetnek. A zárt intervallumok mindkét oldalon korlátozottak, pl. alsó („from”) és felső („to”) határa is van. A nyitott intervallumoknak egy határa van: felső vagy alsó. Ha az opciók növekvő vagy csökkenő sorrendben vannak elrendezve, akkor a sorok meghívásra kerülnek rangsorolt.

A variációs sorozatokhoz kétféle frekvenciaválasz-opció létezik: a halmozott frekvencia és a felhalmozott frekvencia. A felhalmozott gyakoriság azt mutatja, hogy a jellemző értéke hány megfigyelésnél vett kisebb értéket egy adott értéknél. A felhalmozott frekvenciát úgy határozzuk meg, hogy egy adott csoportra jellemző frekvenciaértékeket összeadjuk az előző csoportok összes frekvenciájával. A halmozott gyakoriság azon megfigyelési egységek arányát jellemzi, amelyek attribútumértékei nem haladják meg az adott csoport felső határát. Így a felhalmozott gyakoriság azt mutatja meg, hogy az összességben milyen arányban vannak az adottnál nem nagyobb értékű opciók. A frekvencia, a frekvencia, az abszolút és relatív sűrűségek, a halmozott frekvencia és a frekvencia a változat nagyságának jellemzői.

A sokaság statisztikai egységeinek jellemzőinek változásait, valamint az eloszlás jellegét a variációs sorok mutatóival és jellemzőivel vizsgálják, amelyek magukban foglalják a sorozat átlagos szintjét, az átlagos lineáris eltérést, a szórást, a szórást. , oszcillációs együtthatók, variáció, aszimmetria, kanyarodás stb.

Az átlagos értékeket az elosztóközpont jellemzésére használják. Az átlag egy általánosító statisztikai jellemző, amelyben a vizsgált sokaság tagjai által birtokolt jellemző tipikus szintjét számszerűsítik. Előfordulhatnak azonban az eltérő eloszlási mintázatú aritmetikai átlagok egybeesésének esetei, ezért a variációs sorozatok statisztikai jellemzőiként az úgynevezett strukturális átlagokat számítják ki - módus, medián, valamint kvantilisek, amelyek az eloszlássorozatot egyenlőre osztják. részek (kvartilisek, decilisek, százalékosok stb.).

Divat - Ez egy olyan jellemző értéke, amely gyakrabban fordul elő az eloszlási sorozatban, mint a többi értéke. A diszkrét sorozatoknál ez a legmagasabb frekvenciájú opció. Az intervallumvariációs sorozatokban a módus meghatározásához először meg kell határozni azt az intervallumot, amelyben ez található, az úgynevezett modális intervallumot. Egyenlő intervallumú variációs sorozatban a modális intervallumot a legmagasabb frekvencia, az egyenlőtlen intervallumú sorozatoknál - de a legnagyobb eloszlássűrűség - határozza meg. Ezután a képlet segítségével meghatározzuk a módot egyenlő időközönként sorokban

ahol Mo a divatérték; xMo - a modális intervallum alsó határa; h- modális intervallum szélessége; / Mo - a modális intervallum gyakorisága; / Mo j a premodális intervallum gyakorisága; / Mo+1 a posztmodális intervallum gyakorisága, és ebben a számítási képletben nem egyenlő intervallumú sorozatoknál a / Mo, / Mo, / Mo gyakoriságok helyett az eloszlási sűrűségeket kell használni. Ész 0 _| , Ész 0> UMO+"

Ha egyetlen módus van, akkor a valószínűségi változó valószínűségi eloszlását unimodálisnak nevezzük; ha több mód van, akkor multimodálisnak (polimodális, multimodális), két mód esetén bimodálisnak nevezzük. A multimodalitás általában azt jelzi, hogy a vizsgált eloszlás nem engedelmeskedik a normál eloszlási törvénynek. A homogén populációkat általában egy-csúcsos eloszlás jellemzi. A Multivertex a vizsgált populáció heterogenitását is jelzi. Két vagy több csúcs megjelenése szükségessé teszi az adatok átcsoportosítását a homogénebb csoportok azonosítása érdekében.

Egy intervallumvariáció-sorozatban a módus grafikusan meghatározható egy hisztogram segítségével. Ehhez húzzon két metsző vonalat a hisztogram legmagasabb oszlopának felső pontjaitól két szomszédos oszlop felső pontjaiig. Ezután a metszéspontjukból egy merőlegest engedünk le az abszcissza tengelyére. Az x tengelyen a merőlegesnek megfelelő jellemző értéke a módus. Sok esetben, amikor egy populációt általánosított mutatóként jellemeznek, a számtani átlag helyett a módozatot részesítik előnyben.

Medián - Ez az attribútum központi értéke, az eloszlás rangsorolt ​​sorozatának központi tagja birtokolja. A diszkrét sorozatokban a medián értékének meghatározásához először annak sorszámát kell meghatározni. Ehhez, ha az egységek száma páratlan, az összes frekvencia összegéhez hozzáadunk egyet, és a számot elosztjuk kettővel. Ha páros számú egység van egy sorban, akkor két medián egység lesz, tehát ebben az esetben a medián a két medián egység értékeinek átlaga. Így a diszkrét variációs sorozat mediánja az az érték, amely a sorozatot két részre osztja, amelyek ugyanannyi opciót tartalmaznak.

Az intervallumsorokban a medián sorszámának meghatározása után a felhalmozott gyakoriságok (frekvenciák) segítségével megkeresik a mediális intervallumot, majd a medián számítási képletével meghatározzák magának a mediánnak az értékét:

ahol Me a medián érték; x én - a medián intervallum alsó határa; h- a medián intervallum szélessége; - az eloszlási sorozatok gyakoriságainak összege; /D - a pre-medián intervallum halmozott gyakorisága; / Me - a medián intervallum gyakorisága.

A medián grafikusan, kumulátum segítségével található meg. Ehhez a kumulátum halmozott frekvenciáinak (frekvenciáinak) skáláján a medián sorszámának megfelelő ponttól az abszcissza tengellyel párhuzamos egyenest húzunk, amíg az nem metszi a kumulátumot. Ezután a jelzett egyenes és a kumulátum metszéspontjától egy merőlegest leeresztünk az abszcissza tengelyére. A megrajzolt ordinátának megfelelő (merőleges) attribútum értéke az x tengelyen a medián.

A mediánt a következő tulajdonságok jellemzik.

  • 1. Nem függ azoktól az attribútumértékektől, amelyek mindkét oldalán találhatók.
  • 2. Minimális tulajdonsággal rendelkezik, ami azt jelenti, hogy az attribútumértékek mediántól való abszolút eltéréseinek összege minimális értéket jelent az attribútumértékek bármely más értéktől való eltéréséhez képest.
  • 3. Ha két eloszlást kombinálunk ismert mediánokkal, lehetetlen előre megjósolni az új eloszlás mediánjának értékét.

A medián ezen tulajdonságait széles körben alkalmazzák a közszolgáltatási pontok - iskolák, klinikák, benzinkutak, vízszivattyúk stb. Például, ha a város egy tömbjében rendelőt terveznek építeni, akkor célszerűbb lenne a tömb olyan pontján elhelyezni, ahol nem a háztömb hosszát, hanem a lakók számát a felére csökkentik.

A módusz, a medián és a számtani átlag aránya jelzi a jellemző eloszlásának jellegét az aggregátumban, és lehetővé teszi az eloszlás szimmetriájának felmérését. Ha x Me akkor van a sorozat jobb oldali aszimmetriája. Normál eloszlással X - Memo.

K. Pearson különböző típusú görbék egymáshoz igazítása alapján megállapította, hogy mérsékelten aszimmetrikus eloszlások esetén a számtani átlag, medián és módus között a következő közelítő összefüggések érvényesek:

ahol Me a medián érték; Mo - a divat jelentése; x aritm - a számtani átlag értéke.

Ha szükséges a variációs sorozat szerkezetének részletesebb tanulmányozása, akkor számítson ki a mediánhoz hasonló jellemző értékeket. Az ilyen jellemző értékek minden eloszlási egységet egyenlő számokra osztanak, ezeket kvantilisoknak vagy gradienseknek nevezik. A kvantilisokat kvartilisekre, decilisekre, százalékokra stb.

A kvartilisek a sokaságot négy egyenlő részre osztják. Az első kvartilis kiszámítása a mediánhoz hasonlóan történik az első kvartilis kiszámításának képletével, miután előzetesen meghatároztuk az első negyedéves intervallumot:

ahol Qi az első kvartilis értéke; xQ^- az első kvartilis tartomány alsó határa; h- az első negyed intervallum szélessége; /, - az intervallumsorozat gyakoriságai;

kumulatív gyakoriság az első kvartilis intervallumot megelőző intervallumban; Jq ( - az első kvartilis intervallum gyakorisága.

Az első kvartilis azt mutatja, hogy a népességegységek 25%-a kisebb, mint az értéke, 75%-a pedig több. A második kvartilis egyenlő a mediánnal, azaz. Q 2 = Nekem.

Analógia útján a harmadik kvartilist számítjuk ki, miután először megtaláltuk a harmadik negyedéves intervallumot:

ahol a harmadik kvartilis tartomány alsó határa; h- a harmadik kvartilis intervallum szélessége; /, - az intervallumsorozat gyakoriságai; /X" - felhalmozott frekvencia a megelőző intervallumban

G

harmadik kvartilis intervallum; Jq a harmadik kvartilis intervallum gyakorisága.

A harmadik kvartilis azt mutatja, hogy a népességegységek 75%-a kisebb, mint az értéke, 25%-a pedig több.

A harmadik és az első kvartilis közötti különbség az interkvartilis tartomány:

ahol Aq az interkvartilis tartomány értéke; Q3 - harmadik kvartilis érték; Q, az első kvartilis értéke.

A decilisek a sokaságot 10 egyenlő részre osztják. A decilis egy eloszlási sorozat jellemzőjének értéke, amely a populáció méretének tizedeinek felel meg. A kvartilisekkel analóg módon az első decilis azt mutatja, hogy a populációs egységek 10%-a kisebb az értékénél, és 90%-a nagyobb, a kilencedik decilis pedig azt, hogy a populációs egységek 90%-a kisebb, mint az értéke, és 10%-a nagyobb. A kilencedik és az első decilis aránya, i.e. A decilis együtthatót széles körben használják a jövedelmi differenciálódás vizsgálatában a legtehetősebb népesség 10%-a és a legkevésbé jómódú népesség 10%-a jövedelmi szintjének arányának mérésére. A százalékosok a rangsorolt ​​sokaságot 100 egyenlő részre osztják. A percentilisek számítása, jelentése és alkalmazása hasonló a decilisekhez.

A kvartilisek, decilisek és egyéb szerkezeti jellemzők grafikusan határozhatók meg a mediánnal analóg módon kumulátumok segítségével.

A szórás mértékének mérésére a következő mutatókat használjuk: variációs tartomány, átlagos lineáris eltérés, szórás, szórás. A variációs tartomány nagysága teljes mértékben függ a sorozat szélső tagjainak eloszlásának véletlenszerűségétől. Ez a mutató olyan esetekben érdekes, amikor fontos tudni, hogy mekkora egy jellemző értékének ingadozásának amplitúdója:

Ahol R- a variációs tartomány értéke; x max - az attribútum maximális értéke; x tt - az attribútum minimális értéke.

A variációs tartomány kiszámításakor a sorozattagok túlnyomó többségének értékét nem veszik figyelembe, míg a variációt a sorozattag minden értékéhez társítják. Azoknak a mutatóknak, amelyek egy jellemző egyedi értékeinek az átlagos értéküktől való eltéréseiből nyert átlagok, nincs ez a hátrányuk: az átlagos lineáris eltérés és a szórás. Közvetlen kapcsolat van az átlagtól való egyéni eltérések és egy adott tulajdonság változékonysága között. Minél erősebb a fluktuáció, annál nagyobb az átlagtól való eltérés abszolút nagysága.

Az átlagos lineáris eltérés az egyes opciók átlagos értékétől való eltéréseinek abszolút értékének számtani átlaga.

Átlagos lineáris eltérés csoportosítatlan adatok esetén

ahol /pr az átlagos lineáris eltérés értéke; x, - az attribútum értéke; X - P - egységek száma a lakosságban.

A csoportosított sorozat átlagos lineáris eltérése

ahol / vz - az átlagos lineáris eltérés értéke; x az attribútum értéke; X - a jellemző átlagos értéke a vizsgált sokaságra; / - a lakossági egységek száma külön csoportban.

Ebben az esetben az eltérések előjeleit figyelmen kívül hagyjuk, ellenkező esetben az összes eltérés összege nulla lesz. Az átlagos lineáris eltérést az elemzett adatok csoportosításától függően különböző képletekkel számítjuk ki: csoportosított és csoportosítatlan adatok esetén. Konvenciójából adódóan az átlagos lineáris eltérést – elkülönülten a többi ingadozási mutatótól – viszonylag ritkán alkalmazzák a gyakorlatban (különösen a szállítási egységességre vonatkozó szerződéses kötelezettségek teljesítésének jellemzésére, a külkereskedelmi forgalom elemzésekor a forgalom összetételére, a alkalmazottak, a termelés ritmusa, a termék minősége, figyelembe véve a gyártás technológiai sajátosságait stb.).

A szórás azt jellemzi, hogy a vizsgált jellemző egyedi értékei átlagosan mennyivel térnek el a sokaság átlagértékétől, és a vizsgált jellemző mértékegységeiben fejezik ki. A szórást, mint a szórás egyik fő mérőszámát, széles körben használják egy homogén populációban egy jellemző variációs határainak felmérésére, a normál eloszlási görbe ordinátaértékeinek meghatározására, valamint a vele kapcsolatos számítások során. a minta megfigyelésének megszervezése és a mintajellemzők pontosságának megállapítása. A csoportosítatlan adatok szórását a következő algoritmussal számítjuk ki: az átlagtól való minden eltérést négyzetre emelünk, az összes négyzetet összeadjuk, majd a négyzetösszeget elosztjuk a sorozat tagjainak számával, és a négyzetgyököt kivonjuk a hányados:

ahol az Iip a szórás értéke; Xj- attribútum értéke; x- a jellemző átlagos értéke a vizsgált sokaságra; P - egységek száma a lakosságban.

Csoportosított elemzett adatok esetén az adatok szórását a súlyozott képlet segítségével számítjuk ki

Ahol - szórásérték; Xj- attribútum értéke; X - a jellemző átlagos értéke a vizsgált sokaságra; f x - egy adott csoport népességegységeinek száma.

A gyökér alatti kifejezést mindkét esetben varianciának nevezzük. Így a diszperziót az attribútumértékek átlagos értékétől való eltéréseinek átlagos négyzeteként számítják ki. Súlyozatlan (egyszerű) attribútumértékek esetén az eltérést a következőképpen határozzuk meg:

Súlyozott jellemző értékekhez

Van egy speciális egyszerűsített módszer is a variancia kiszámítására: általában

súlyozatlan (egyszerű) jellemző értékekre súlyozott jellemző értékekhez
nulla alapú módszerrel

ahol a 2 a diszperziós érték; x, - az attribútum értéke; X - a jellemző átlagos értéke, h- csoport intervallum értéke, t 1 - súly (A =

A diszperziónak megvan a maga kifejezése a statisztikában, és ez a változás egyik legfontosabb mutatója. Mérése a vizsgált jellemző mértékegységeinek négyzetének megfelelő egységekben történik.

A diszperzió a következő tulajdonságokkal rendelkezik.

  • 1. Egy állandó érték varianciája nulla.
  • 2. Egy jellemző összes értékének azonos A értékkel való csökkentése nem változtatja meg a diszperzió értékét. Ez azt jelenti, hogy az eltérések átlagos négyzete nem egy jellemző adott értékéből számítható ki, hanem azok eltéréseiből valamilyen állandó számtól.
  • 3. Bármilyen jellemző érték csökkentése k alkalommal csökkenti a diszperziót k 2-szer, és a szórás benne van k alkalommal, azaz. az attribútum összes értéke elosztható valamilyen állandó számmal (mondjuk a sorozat intervallumának értékével), kiszámítható a szórás, majd megszorozható egy állandó számmal.
  • 4. Ha bármely értéktől kiszámítjuk az eltérések átlagos négyzetét És a számtani átlagtól valamilyen mértékben eltér, akkor mindig nagyobb lesz, mint a számtani átlagból számított eltérések átlagos négyzete. Az eltérések átlagos négyzete egy nagyon bizonyos mértékkel nagyobb lesz - az átlag és a konvencionálisan vett érték közötti különbség négyzetével.

Egy alternatív jellemző variációja a vizsgált tulajdonság meglétében vagy hiányában áll a sokaság egységeiben. Mennyiségileg egy alternatív attribútum változását két érték fejezi ki: a vizsgált tulajdonság egy egységének meglétét eggyel (1), a hiányát pedig nullával (0) jelöljük. A vizsgált tulajdonsággal rendelkező egységek arányát jelöli P, és azon egységek arányát, amelyek nem rendelkeznek ezzel a tulajdonsággal. G.Így egy alternatív attribútum varianciája egyenlő az ezzel a tulajdonsággal rendelkező egységek arányának (P) és az ezzel a tulajdonsággal nem rendelkező egységek arányának szorzatával. (G). A népesség legnagyobb változatossága azokban az esetekben érhető el, amikor a népesség összvolumenének 50%-át kitevő népesség egy része rendelkezik ezzel a tulajdonsággal, és a népesség egy másik része, szintén 50%-a nem rendelkezik ezzel a tulajdonsággal, és a diszperzió eléri a 0,25 maximális értéket, t .e. P = 0,5, G= 1 - P = 1 - 0,5 = 0,5 és o 2 = 0,5 0,5 = 0,25. Ennek a mutatónak az alsó határa nulla, ami egy olyan helyzetnek felel meg, amelyben nincs változás az aggregátumban. Egy alternatív jellemző varianciájának gyakorlati alkalmazása a konfidenciaintervallumok felépítése a minta megfigyelések során.

Minél kisebb a szórás és a szórás, annál homogénebb a sokaság és annál jellemzőbb lesz az átlag. A statisztika gyakorlatában gyakran van szükség a különböző jellemzők variációinak összehasonlítására. Például érdekes összehasonlítani a munkavállalók életkora és képzettsége, a szolgálati idő és a bérek, a költségek és a nyereség, a szolgálati idő és a munkatermelékenység stb. változásait. Az ilyen összehasonlításokhoz a jellemzők abszolút változékonyságának mutatói nem alkalmasak: nem lehet összehasonlítani a munkatapasztalat években kifejezett változékonyságát a rubelben kifejezett bérek változásával. Az ilyen összehasonlítások elvégzéséhez, valamint ugyanazon jellemző variabilitásának összehasonlításához több populációban, különböző számtani átlagokkal, variációs mutatókat használnak - az oszcillációs együtthatót, a lineáris variációs együtthatót és a variációs együtthatót, amelyek megmutatják a mértéket. szélsőséges értékek átlag körüli ingadozásairól.

Oszcillációs együttható:

Ahol V R - oszcillációs együttható értéke; R- a variációs tartomány értéke; X -

Lineáris variációs együttható".

Ahol Vj- a lineáris variációs együttható értéke; én - az átlagos lineáris eltérés értéke; X - a jellemző átlagos értéke a vizsgált sokaságra.

A variációs együttható:

Ahol V a - variációs együttható értéke; a a szórás értéke; X - a jellemző átlagos értéke a vizsgált sokaságra.

Az oszcillációs együttható a változási tartomány és a vizsgált jellemző átlagos értékének százalékos aránya, a lineáris variációs együttható pedig az átlagos lineáris eltérés és a vizsgált jellemző átlagos értékének aránya. százalék. A variációs együttható a vizsgált jellemző átlagos értékéhez viszonyított szórás százalékos aránya. Százalékban kifejezett relatív értékként a variációs együtthatót használják a különböző jellemzők variációs fokának összehasonlítására. A variációs együttható segítségével értékeljük a statisztikai sokaság homogenitását. Ha a variációs együttható kisebb, mint 33%, akkor a vizsgált populáció homogén és a szórás gyenge. Ha a variációs együttható meghaladja a 33%-ot, akkor a vizsgált sokaság heterogén, a szórás erős, az átlagérték atipikus, és nem használható általános mutatóként ennek a sokaságnak. Ezenkívül variációs együtthatókat használnak egy tulajdonság variabilitásának összehasonlítására a különböző populációkban. Például, hogy értékelje a munkavállalók szolgálati idejének változását két vállalatnál. Minél nagyobb az együttható értéke, annál jelentősebb a jellemző változása.

A számított kvartilisek alapján a képlet segítségével kiszámítható a negyedéves ingadozás relatív mutatója is

ahol Q 2 És

Az interkvartilis tartományt a képlet határozza meg

A variációs tartomány helyett a kvartilis eltérést használjuk, hogy elkerüljük a szélsőséges értékek használatával járó hátrányokat:

Egyenlőtlen intervallumú variációs sorozatok esetén az eloszlássűrűséget is kiszámítjuk. Ez a megfelelő frekvencia vagy frekvencia hányadosa osztva az intervallum értékével. Az egyenlőtlen intervallumú sorozatokban abszolút és relatív eloszlássűrűségeket használunk. Az abszolút eloszlássűrűség az intervallum egységnyi hosszára eső frekvencia. Relatív eloszlási sűrűség – gyakoriság egységnyi intervallumhosszonként.

A fentiek mindegyike igaz azokra az eloszlási sorozatokra, amelyek eloszlási törvényét jól leírja a normál eloszlási törvény, vagy közel áll ahhoz.

Variációs sorozatok: meghatározás, típusok, főbb jellemzők. Számítási módszer
módus, medián, számtani átlag az orvosi és statisztikai kutatásokban
(feltételes példával mutassa meg).

A variációs sorozat a vizsgált jellemző számértékeinek sorozata, amelyek nagyságrendjükben különböznek egymástól, és bizonyos sorrendben vannak elrendezve (növekvő vagy csökkenő sorrendben). Egy sorozat minden számértékét változatnak (V) nevezzük, azokat a számokat pedig, amelyek azt mutatják, hogy egy adott változat milyen gyakran fordul elő egy adott sorozatban, gyakoriságnak (p).

A variációs sorozatot alkotó megfigyelési esetek teljes számát n betűvel jelöljük. A vizsgált jellemzők jelentésének különbségét variációnak nevezzük. Ha egy változó jellemzőnek nincs mennyiségi mérőszáma, a változást kvalitatívnak, az eloszlási sorozatot pedig attribútumnak (például betegség kimenetel, egészségi állapot stb. szerinti megoszlás) nevezzük.

Ha egy változó jellemzőnek kvantitatív kifejezése van, akkor ezt a változást kvantitatívnak, az eloszlássorozatot pedig variációsnak nevezzük.

A variációs sorozatokat - a mennyiségi jellemző jellege alapján - nem folytonosra és folyamatosra, a változat előfordulási gyakorisága alapján egyszerűre és súlyozottra osztják.

Egy egyszerű variációs sorozatban minden opció csak egyszer fordul elő (p=1), egy súlyozott sorozatban ugyanaz az opció többször (p>1). Az ilyen sorozatok példáit a szövegben tovább tárgyaljuk. Ha a mennyiségi jellemző folytonos, pl. Az egész mennyiségek között vannak köztes törtmennyiségek, a variációs sorozatot folytonosnak nevezzük.

Például: 10.0 – 11.9

14,0 – 15,9 stb.

Ha a mennyiségi jellemző nem folytonos, pl. egyedi értékei (változatai) egy egész számmal különböznek egymástól, és nincs köztes törtértékük, a variációs sorozatot nem folytonosnak vagy diszkrétnek nevezzük.

Az előző példa pulzusszámadatainak felhasználása

21 tanuló esetén variációs sorozatot készítünk (1. táblázat).

Asztal 1

Az orvostanhallgatók pulzusszám szerinti megoszlása ​​(bpm)

Így egy variációs sorozat felépítése a rendelkezésre álló számértékek (változatok) rendszerezését és rendszerezését jelenti, pl. meghatározott sorrendbe (növekvő vagy csökkenő sorrendbe) rendezik a hozzájuk tartozó frekvenciákkal. A vizsgált példában az opciók növekvő sorrendbe vannak rendezve, és egész nem folytonos (diszkrét) számok formájában vannak kifejezve, minden opció többször előfordul, pl. súlyozott, nem folytonos vagy diszkrét variációs sorozattal van dolgunk.

Általános szabály, hogy ha az általunk vizsgált statisztikai sokaságban a megfigyelések száma nem haladja meg a 30-at, akkor elegendő a vizsgált jellemző összes értékét növekvő variációs sorozatba rendezni, a táblázat szerint. 1, vagy csökkenő sorrendben.

Nagy számú megfigyelés esetén (n>30) az előforduló változatok száma nagyon nagy lehet, ilyenkor intervallum- vagy csoportos variációs sorozatot állítunk össze, amelyben a későbbi feldolgozás egyszerűsítése és az eloszlás jellegének tisztázása érdekében a változatokat csoportokba vonják.

A csoportopciók száma általában 8 és 15 között van.

Legalább 5 legyen belőle, mert... ellenkező esetben túl durva, túlzott nagyítás lesz, ami torzítja az összképet a szórásról és nagyban befolyásolja az átlagértékek pontosságát. Ha a csoportváltozatok száma meghaladja a 20-25-öt, az átlagértékek számításának pontossága megnő, de a jellemző variációjának jellemzői jelentősen torzulnak, és bonyolultabbá válik a matematikai feldolgozás.

A csoportosított sorozat összeállításakor figyelembe kell venni

− az opciócsoportokat meghatározott sorrendbe kell rendezni (növekvő vagy csökkenő);

− az opciócsoportokban az intervallumoknak azonosaknak kell lenniük;

− az intervallumhatárok értékei nem eshetnek egybe, mert nem lesz világos, hogy az egyes változatokat mely csoportokba soroljuk;

− az intervallumhatárok meghatározásakor figyelembe kell venni az összegyűjtött anyag minőségi jellemzőit (például a felnőttek súlyának vizsgálatakor 3-4 kg-os intervallum elfogadható, a gyermekeknél az élet első hónapjaiban nem haladhatja meg a 100 g-ot)

Készítsünk 55 orvostanhallgató vizsga előtti pulzusszámának (ütés/perc) adatait jellemző csoportos (intervallum) sorozatot: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Csoportosított sorozat készítéséhez szüksége lesz:

1. Határozza meg az intervallum méretét;

2. Határozza meg a variációs sorozat csoportjainak közepét, elejét és végét!

● Az (i) intervallum méretét a feltételezett csoportok száma (r) határozza meg, amelyek számát a megfigyelések számától függően (n) egy speciális táblázat alapján állítjuk be.

Csoportok száma a megfigyelések számától függően:

Esetünkben 55 tanuló számára 8-10 csoportot lehet létrehozni.

Az (i) intervallum értékét a következő képlet határozza meg:

i = V max-V min/r

Példánkban az intervallum értéke 82-58/8= 3.

Ha az intervallum értéke tört, akkor az eredményt a legközelebbi egész számra kell kerekíteni.

Többféle átlag létezik:

● számtani átlag,

● geometriai átlag,

● harmonikus átlag,

● négyzetes középérték,

● átlagos progresszív,

● medián

Az orvosi statisztikákban leggyakrabban számtani átlagokat használnak.

A számtani átlag (M) egy általánosító érték, amely meghatározza, hogy mi jellemző a teljes sokaságra. Az M kiszámításának fő módszerei: a számtani átlag módszere és a nyomatékok (feltételes eltérések) módszere.

Az egyszerű számtani átlag és a súlyozott számtani átlag kiszámításához az aritmetikai átlag módszerét használják. A számtani átlag számítási módszerének megválasztása a variációs sorozat típusától függ. Egy egyszerű variációs sorozat esetén, amelyben minden opció csak egyszer fordul elő, az egyszerű számtani átlagot a következő képlet határozza meg:

ahol: M – számtani középérték;

V – a változó jellemző értéke (változatai);

Σ – a cselekvést jelzi – összegzés;

n – a megfigyelések teljes száma.

Példa az egyszerű számtani átlag kiszámítására. Légzési frekvencia (légzési mozgások száma percenként) 9 férfinál, 35 éves korban: 20, 22, 19, 15, 16, 21, 17, 23, 18.

A 35 éves férfiak légzésszámának átlagos szintjének meghatározásához szükséges:

1. Készítsen variációs sorozatot, minden opciót növekvő vagy csökkenő sorrendbe rendezve, így kaptunk egy egyszerű variációs sorozatot, mert opcióértékek csak egyszer fordulnak elő.

M = ∑V/n = 171/9 = 19 légzés percenként

Következtetés. A 35 éves férfiak légzésszáma átlagosan 19 légzési mozgás percenként.

Ha egy változat egyedi értékei ismétlődnek, nem kell minden változatot egy sorba felírni, elég, ha felsoroljuk a változat előforduló méreteit (V), és mellette feltüntetjük az ismétlődések számát (p ). Az ilyen variációs sorozatot, amelyben az opciókat mintegy súlyozzák a hozzájuk tartozó gyakoriságok számával, súlyozott variációs sorozatnak nevezzük, a számított átlagérték pedig a súlyozott számtani átlag.

A súlyozott számtani átlagot a következő képlet határozza meg: M= ∑Vp/n

ahol n a megfigyelések száma megegyezik a gyakoriságok összegével – Σр.

Példa a számtani súlyozott átlag kiszámítására.

A tárgyév első negyedévében a helyi orvos által kezelt 35 akut légúti megbetegedésben (ARI) szenvedő beteg rokkantságának időtartama (napokban) a következő volt: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 nap .

Az akut légúti fertőzésben szenvedő betegek rokkantságának átlagos időtartamának meghatározására szolgáló módszer a következő:

1. Készítsünk súlyozott variációs sorozatot, mert Az opció egyedi értékei többször megismétlődnek. Ehhez az összes opciót növekvő vagy csökkenő sorrendbe rendezheti a megfelelő frekvenciákkal.

Esetünkben a lehetőségek növekvő sorrendben vannak elrendezve

2. Számítsa ki az aritmetikai súlyozott átlagot a következő képlet segítségével: M = ∑Vp/n = 233/35 = 6,7 nap

Az akut légúti fertőzésben szenvedők megoszlása ​​a rokkantság időtartama szerint:

A rokkantság időtartama (V) Betegek száma (p) Vp
∑p = n = 35 ∑Vp = 233

Következtetés. Az akut légúti betegségben szenvedő betegek rokkantságának időtartama átlagosan 6,7 nap volt.

A mód (Mo) a leggyakoribb opció a variációs sorozatban. A táblázatban bemutatott eloszlás esetén a mód egy 10-es opciónak felel meg; gyakrabban fordul elő, mint mások - 6-szor.

A betegek megoszlása ​​a kórházi ágyban töltött idő szerint (napokban)

V
p

Néha nehéz meghatározni egy módus pontos nagyságát, mert több „leggyakoribb” megfigyelés is lehet a vizsgált adatokban.

A medián (Me) egy nem paraméteres mutató, amely a variációs sorozatot két egyenlő felére osztja: ugyanannyi változat található a medián mindkét oldalán.

Például a táblázatban látható eloszlásnál a medián 10, mert ennek az értéknek mindkét oldalán 14 lehetőség van, i.e. a 10-es szám központi helyet foglal el ebben a sorozatban, és a mediánja.

Tekintettel arra, hogy ebben a példában a megfigyelések száma páros (n=34), a medián a következőképpen határozható meg:

én = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Ez azt jelenti, hogy a sorozat közepe a tizenhetedik opcióra esik, ami 10-es mediánnak felel meg. A táblázatban bemutatott eloszlásnál a számtani átlag egyenlő:

M = ∑Vp/n = 334/34 = 10,1

Tehát 34 megfigyeléshez a táblázatból. 8, kaptuk: Mo=10, Me=10, a számtani átlag (M) 10,1. Példánkban mindhárom mutató egyenlőnek vagy egymáshoz közelinek bizonyult, bár teljesen eltérőek.

A számtani átlag az összes hatás eredő összege, amelynek kialakításában kivétel nélkül minden lehetőség, beleértve a szélsőségeseket is, amelyek gyakran atipikusak egy adott jelenségre vagy populációra.

A módus és a medián, ellentétben a számtani átlaggal, nem függ a változó jellemző összes egyedi értékének értékétől (a szélső változatok értékei és a sorozat szórásának mértéke). A számtani átlag a megfigyelések teljes tömegét jellemzi, a módus és a medián a tömeget.

KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2024 „kingad.ru” - az emberi szervek ultrahangvizsgálata