V. Serii de variații, valori medii, variabilitate a trăsăturilor

Seria de variații este o serie de valori numerice ale unei caracteristici.

Principalele caracteristici ale seriei de variații: v - variantă, p - frecvența de apariție a acesteia.

Tipuri de serie de variații:

    după frecvența de apariție a variantelor: simplă - varianta apare o dată, ponderată - varianta apare de două sau de mai multe ori;

    opțiuni în funcție de locație: clasate - opțiunile sunt aranjate în ordine descrescătoare și crescătoare, neclasate - opțiunile sunt scrise fără o ordine anume;

    prin gruparea opțiunii în grupuri: grupate - opțiunile sunt combinate în grupuri, negrupate - opțiunile nu sunt grupate;

    opțiuni după valoare: continuu - opțiunile sunt exprimate ca număr întreg și număr fracționar, discrete - opțiunile sunt exprimate ca număr întreg, complexe - opțiunile sunt reprezentate printr-o valoare relativă sau medie.

Se întocmește și se întocmește o serie variațională pentru a calcula valorile medii.

Forma de notare a seriei de variații:

8. Valori medii, tipuri, modalitate de calcul, aplicare în domeniul sănătăţii

Valori medii- caracteristica generalizantă totală a caracteristicilor cantitative. Aplicarea mediilor:

1. Să caracterizeze organizarea activității instituțiilor medicale și să evalueze activitățile acestora:

a) în policlinică: indicatori ai volumului de muncă al medicilor, numărul mediu de vizite, numărul mediu de rezidenți din zonă;

b) într-un spital: numărul mediu de zile de pat pe an; durata medie de spitalizare;

c) în centrul igienei, epidemiologiei și sănătății publice: suprafața medie (sau capacitatea cubică) la 1 persoană, standardele nutriționale medii (proteine, grăsimi, carbohidrați, vitamine, săruri minerale, calorii), norme și standarde sanitare etc. ;

2. Să caracterizeze dezvoltarea fizică (principalele trăsături antropometrice ale morfologice și funcționale);

3. Să determine parametrii medicali și fiziologici ai organismului în condiții normale și patologice în studii clinice și experimentale.

4. În cercetarea științifică specială.

Diferența dintre valorile medii și indicatori:

1. Coeficienții caracterizează o trăsătură alternativă care apare doar într-o anumită parte a echipei statistice, care poate sau nu are loc.

Valorile medii acoperă semnele inerente tuturor membrilor echipei, dar în grade diferite (greutate, înălțime, zile de tratament în spital).

2. Coeficienții sunt utilizați pentru a măsura caracteristicile calitative. Valorile medii sunt pentru diferite trăsături cantitative.

Tipuri de medii:

    media aritmetică, caracteristicile sale - abaterea standard și eroarea medie

    mod și mediană. Moda (lună)- corespunde valorii trasaturii care se intalneste cel mai des la aceasta populatie. Mediană (eu)- valoarea atributului, care ocupă valoarea mediană în această populație. Împarte seria în 2 părți egale în funcție de numărul de observații. Valoarea medie aritmetică (M)- spre deosebire de mod și mediană, se bazează pe toate observațiile făcute, de aceea este o caracteristică importantă pentru întreaga distribuție.

    alte tipuri de medii care sunt utilizate în studiile speciale: rădăcină medie pătrată, cubică, armonică, geometrică, progresivă.

Media aritmetică caracterizează nivelul mediu al populaţiei statistice.

Pentru o serie simplă unde

∑v – opțiunea sumă,

n este numărul de observații.

pentru o serie ponderată, unde

∑vr este suma produselor fiecărei opțiuni și frecvența apariției acesteia

n este numărul de observații.

Deviație standard media aritmetică sau sigma (σ) caracterizează diversitatea caracteristicii

- pentru un simplu rând

Σd 2 - suma pătratelor diferenței dintre media aritmetică și fiecare opțiune (d = │M-V│)

n este numărul de observații

- pentru serii ponderate

∑d 2 p este suma produselor pătratelor diferenței dintre media aritmetică și fiecare opțiune și frecvența apariției acesteia,

n este numărul de observații.

Gradul de diversitate poate fi judecat după valoarea coeficientului de variație
. Mai mult de 20% - diversitate puternică, 10-20% - diversitate medie, mai puțin de 10% - diversitate slabă.

Dacă se adaugă și se scade o sigma (M ± 1σ) din media aritmetică, atunci cu o distribuție normală, cel puțin 68,3% din toate variantele (observațiile) se vor încadra în aceste limite, ceea ce este considerat norma pentru fenomenul studiat. . Dacă k 2 ± 2σ, atunci 95,5% din toate observațiile vor fi în aceste limite, iar dacă k M ± 3σ, atunci 99,7% din toate observațiile vor fi în aceste limite. Astfel, abaterea standard este abaterea standard, ceea ce face posibilă prezicerea probabilității apariției unei astfel de valori a trăsăturii studiate, care se află în limitele specificate.

Eroarea medie a mediei aritmetice sau eroare de reprezentativitate. Pentru serii simple, ponderate și după regula momentelor:

.

Pentru a calcula valorile medii, este necesar: omogenitatea materialului, un număr suficient de observații. Dacă numărul de observații este mai mic de 30, n-1 este utilizat în formulele pentru calcularea σ și m.

La evaluarea rezultatului obținut prin dimensiunea erorii medii, se utilizează un coeficient de încredere, care face posibilă determinarea probabilității unui răspuns corect, adică indică faptul că eroarea eșantionului rezultată nu va fi mai mare decât eroarea reală. realizate ca urmare a observarii continue. În consecință, odată cu creșterea probabilității de încredere, lățimea intervalului de încredere crește, ceea ce, la rândul său, crește încrederea judecății, susținerea rezultatului obținut.

Serii de variații - o serie în care sunt comparate (în ordine crescătoare sau descrescătoare) Opțiuniși respectivul lor frecvente

Variantele sunt expresii cantitative separate ale unei trăsături. Desemnat cu o literă latină V . Înțelegerea clasică a termenului „variantă” presupune că fiecare valoare unică a unei caracteristici este numită variantă, indiferent de numărul de repetări.

De exemplu, într-o serie variațională de indicatori ai tensiunii arteriale sistolice măsurate la zece pacienți:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

doar 6 valori sunt opțiuni:

110, 120, 130, 140, 160, 170.

Frecvența este un număr care indică de câte ori se repetă o opțiune. Notat printr-o literă latină P . Suma tuturor frecvențelor (care, desigur, este egală cu numărul tuturor celor studiate) se notează ca n.

    În exemplul nostru, frecvențele vor lua următoarele valori:
  • pentru varianta 110 frecvența P = 1 (valoarea 110 apare la un pacient),
  • pentru varianta 120 frecvența P = 2 (valoarea 120 apare la doi pacienți),
  • pentru varianta 130 frecvența P = 3 (valoarea 130 apare la trei pacienți),
  • pentru varianta 140 frecvența P = 2 (valoarea 140 apare la doi pacienți),
  • pentru varianta 160 frecvența P = 1 (valoarea 160 apare la un pacient),
  • pentru varianta 170 frecvența P = 1 (valoarea 170 apare la un pacient),

Tipuri de serie de variații:

  1. simplu- aceasta este o serie în care fiecare opțiune apare o singură dată (toate frecvențele sunt egale cu 1);
  2. suspendat- o serie în care una sau mai multe opțiuni apar în mod repetat.

Seria de variații este utilizată pentru a descrie matrice mari de numere; în această formă sunt prezentate inițial datele colectate ale majorității studiilor medicale. Pentru a caracteriza seria de variații se calculează indicatori speciali, inclusiv valori medii, indicatori de variabilitate (așa-numita dispersie), indicatori ai reprezentativității datelor eșantionului.

Indicatori de serie de variații

1) Media aritmetică este un indicator generalizator care caracterizează mărimea trăsăturii studiate. Media aritmetică se notează ca M , este cel mai comun tip de medie. Media aritmetică este calculată ca raportul dintre suma valorilor indicatorilor tuturor unităților de observare și numărul tuturor examinate. Metoda de calcul a mediei aritmetice diferă pentru o serie de variații simple și ponderate.

Formula de calcul medie aritmetică simplă:

Formula de calcul medie aritmetică ponderată:

M = Σ(V * P)/ n

​ 2) Mod - o altă valoare medie a seriei de variații, corespunzătoare variantei cel mai frecvent repetate. Sau, altfel spus, aceasta este opțiunea care corespunde frecvenței celei mai înalte. Desemnat ca Lu . Modul este calculat numai pentru seriile ponderate, deoarece în seria simplă niciuna dintre opțiuni nu se repetă și toate frecvențele sunt egale cu una.

De exemplu, în seria de variații a valorilor ritmului cardiac:

80, 84, 84, 86, 86, 86, 90, 94;

valoarea modului este 86, deoarece această variantă apare de 3 ori, prin urmare frecvența sa este cea mai mare.

3) Mediană - valoarea opțiunii, împărțind seria de variații la jumătate: pe ambele părți ale acesteia există un număr egal de opțiuni. Mediana, precum și media aritmetică și modul, se referă la valori medii. Desemnat ca Pe mine

4) Abaterea standard (sinonime: abatere standard, abatere sigma, sigma) - o măsură a variabilității seriei de variații. Este un indicator integral care combină toate cazurile de abatere a unei variante de la medie. De fapt, răspunde la întrebarea: cât de departe și cât de des înseamnă opțiunile răspândite din media aritmetică. Notat printr-o literă greacă σ ("sigma").

Când dimensiunea populației este mai mare de 30 de unități, abaterea standard este calculată folosind următoarea formulă:

Pentru populații mici - 30 de unități de observare sau mai puțin - abaterea standard este calculată folosind o formulă diferită:

Metoda de grupare vă permite, de asemenea, să măsurați variație(variabilitate, fluctuație) semnelor. Cu un număr relativ mic de unități de populație, variația se măsoară pe baza unei serii ordonate de unități care alcătuiesc populația. Rândul este numit clasat dacă unitățile sunt aranjate în caracteristică ascendentă (descrescătoare).

Cu toate acestea, seriile clasificate sunt mai degrabă orientative atunci când este necesară o caracteristică comparativă a variației. În plus, în multe cazuri se are de-a face cu agregate statistice formate dintr-un număr mare de unități, care sunt practic greu de reprezentat sub forma unei serii specifice. În acest sens, pentru familiarizarea generală inițială cu datele statistice și mai ales pentru a facilita studiul variației semnelor, fenomenele și procesele studiate sunt de obicei combinate în grupuri, iar rezultatele grupării sunt întocmite sub formă de tabele de grup. .

Dacă în tabelul de grupuri sunt doar două coloane - grupuri în funcție de caracteristica selectată (opțiuni) și numărul de grupuri (frecvențe sau frecvențe), se numește aproape de distribuție.

Interval de distribuție - cel mai simplu tip de grupare structurală în funcție de un atribut, afișat într-un tabel de grup cu două coloane care conțin variante și frecvențe ale atributului. În multe cazuri, cu o astfel de grupare structurală, i.e. odata cu alcatuirea seriilor de distributie incepe studiul materialului statistic initial.

Gruparea structurală sub forma unei serii de distribuție poate fi transformată într-o adevărată grupare structurală dacă grupurile selectate sunt caracterizate nu numai prin frecvențe, ci și prin alți indicatori statistici. Scopul principal al seriei de distribuție este de a studia variația caracteristicilor. Teoria distribuției seriilor este dezvoltată în detaliu prin statistici matematice.

Serii de distribuție sunt împărțite în atributiv(gruparea după caracteristici atributive, de exemplu, împărțirea populației pe sex, naționalitate, stare civilă etc.) și variațională(gruparea după caracteristici cantitative).

Seria de variații este un tabel de grup care conține două coloane: o grupare de unități în funcție de un atribut cantitativ și numărul de unități din fiecare grup. Intervalele din seria de variații sunt de obicei formate egale și închise. Seria de variații este următoarea grupare a populației ruse în termeni de venit mediu în numerar pe cap de locuitor (Tabelul 3.10).

Tabelul 3.10

Distribuția populației Rusiei în funcție de venitul mediu pe cap de locuitor în perioada 2004-2009

Grupuri de populație după venitul mediu pe cap de locuitor, rub./lună

Populația din grup, în % din total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Peste 25.000,0

Toată populația

Serii variaționale, la rândul lor, sunt împărțite în discrete și interval. Discret serii de variații combină variante de caracteristici discrete care variază în limite înguste. Un exemplu de serie de variații discrete este distribuția familiilor rusești în funcție de numărul de copii pe care îi au.

Interval seria variațională combină variante fie ale caracteristicilor continue, fie ale caracteristicilor discrete care se schimbă într-o gamă largă. Seria de intervale este seria variațională a distribuției populației ruse în ceea ce privește venitul în numerar mediu pe cap de locuitor.

Serii variaționale discrete nu sunt folosite foarte des în practică. Între timp, compilarea lor nu este dificilă, întrucât componența grupurilor este determinată de variantele specifice pe care le posedă de fapt caracteristicile grupării studiate.

Serii variaționale de intervale sunt mai răspândite. La compilarea lor, se pune problema dificilă a numărului de grupuri, precum și a mărimii intervalelor care ar trebui stabilite.

Principiile pentru rezolvarea acestei probleme sunt expuse în capitolul privind metodologia de construire a grupărilor statistice (vezi paragraful 3.3).

Seriile de variații sunt un mijloc de colaps sau comprimare a diverselor informații într-o formă compactă; ele pot fi folosite pentru a face o judecată destul de clară asupra naturii variației, pentru a studia diferențele de semne ale fenomenelor incluse în setul studiat. Însă cea mai importantă semnificație a seriei variaționale este că pe baza lor se calculează caracteristicile de generalizare speciale ale variației (vezi capitolul 7).

variațională numită serie de distribuţie construită pe o bază cantitativă. Valorile caracteristicilor cantitative în unitățile individuale ale populației nu sunt constante, diferă mai mult sau mai puțin unele de altele.

Variație- fluctuaţia, variabilitatea valorii atributului în unităţi ale populaţiei. Se numesc valori numerice separate ale trăsăturii care apar în populația studiată Opțiuni valorile. Insuficiența valorii medii pentru o caracterizare completă a populației face necesară completarea valorilor medii cu indicatori care să permită evaluarea tipicității acestor medii prin măsurarea fluctuației (variației) trăsăturii studiate.

Prezența variației se datorează influenței unui număr mare de factori asupra formării nivelului de trăsătură. Acești factori acționează cu forță inegală și în direcții diferite. Indicatorii de variație sunt utilizați pentru a descrie măsura variabilității trăsăturilor.

Sarcinile studiului statistic al variației:

  • 1) studiul naturii și gradului de variație a semnelor în unități individuale ale populației;
  • 2) determinarea rolului factorilor individuali sau grupurilor acestora în variaţia anumitor trăsături ale populaţiei.

În statistică, se folosesc metode speciale de studiere a variației, bazate pe utilizarea unui sistem de indicatori, Cu prin care se măsoară variaţia.

Studiul variației este esențial. Măsurarea variațiilor este necesară atunci când se efectuează observarea eșantionului, analiza de corelație și varianță etc. Ermolaev O.Yu. Statistici matematice pentru psihologi: Manual [Text] / O.Yu. Ermolaev. - M.: Editura Flint a Institutului Psihologic și Social din Moscova, 2012. - 335p.

În funcție de gradul de variație, se poate judeca omogenitatea populației, stabilitatea valorilor individuale ale caracteristicilor și tipicitatea mediei. Pe baza acestora, sunt dezvoltați indicatori ai strângerii relației dintre semne, indicatori pentru evaluarea acurateței observației selective.

Există variații în spațiu și variații în timp.

Variația în spațiu este înțeleasă ca fluctuația valorilor unei trăsături în unități ale populației reprezentând teritorii separate. Prin variația în timp se înțelege modificarea valorilor atributului în diferite perioade de timp.

Pentru a studia variația seriei de distribuție, toate variantele valorilor atributelor sunt aranjate în ordine crescătoare sau descrescătoare. Acest proces se numește clasare în serie.

Cele mai simple semne de variație sunt minim si maxim- cea mai mică și cea mai mare valoare a atributului în agregat. Numărul de repetări ale variantelor individuale ale valorilor caracteristicilor se numește frecvența de repetare (fi). Este convenabil să înlocuiți frecvențele cu frecvențe - wi. Frecvență - un indicator relativ al frecvenței, care poate fi exprimat în fracții de unitate sau procent și vă permite să comparați serii de variații cu un număr diferit de observații. Exprimat prin formula:

unde Xmax, Xmin - valorile maxime și minime ale atributului în agregat; n este numărul de grupuri.

Pentru a măsura variația unei trăsături, se folosesc diverși indicatori absoluti și relativi. Indicatorii absoluti de variație includ intervalul de variație, abaterea liniară medie, varianța, abaterea standard. Indicatorii relativi de fluctuație includ coeficientul de oscilație, deviația liniară relativă, coeficientul de variație.

Un exemplu de găsire a unei serii de variații

Exercițiu. Pentru această probă:

  • a) Găsiți o serie de variații;
  • b) Construiți funcția de distribuție;

Nr.=42. Exemple de articole:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Soluţie.

  • a) construirea unei serii variaționale ordonate:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) construirea unei serii variaţionale discrete.

Să calculăm numărul de grupuri din seria de variații folosind formula Sturgess:

Să luăm numărul de grupuri egal cu 7.

Cunoscând numărul de grupuri, calculăm valoarea intervalului:

Pentru comoditatea construcției tabelului, vom lua numărul de grupuri egal cu 8, intervalul va fi 1.

Orez. unu Volumul vânzărilor de mărfuri de către magazin pentru o anumită perioadă de timp

(definiția unei serii variaționale; componentele unei serii variaționale; trei forme ale unei serii variaționale; oportunitatea construirii unei serii de intervale; concluzii care pot fi trase din seria construită)

O serie variațională este o succesiune a tuturor elementelor unei probe aranjate în ordine nedescrescătoare. Se repetă aceleași elemente

Variaționale - acestea sunt serii construite pe o bază cantitativă.

Seriile de distribuție variațională constau din două elemente: variante și frecvențe:

Variantele sunt valorile numerice ale unei trăsături cantitative din seria de variații a distribuției. Ele pot fi pozitive sau negative, absolute sau relative. Deci, atunci când se grupează întreprinderile în funcție de rezultatele activității economice, opțiunile sunt pozitive - acesta este profit, iar numere negative - aceasta este o pierdere.

Frecvențele sunt numerele de variante individuale sau fiecare grup al seriei de variații, adică. acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor se numește volumul populației și este determinată de numărul de elemente ale întregii populații.

Frecvențele sunt frecvențe exprimate ca valori relative (fracții de unități sau procente). Suma frecvențelor este egală cu unu sau 100%. Înlocuirea frecvențelor cu frecvențe face posibilă compararea seriilor variaționale cu numere diferite de observații.

Există trei forme de serie de variații: serii clasificate, serii discrete și serii cu intervale.

O serie clasificată este distribuția unităților individuale ale populației în ordine crescătoare sau descrescătoare a trăsăturii studiate. Clasificarea facilitează împărțirea datelor cantitative în grupuri, detectează imediat cele mai mici și mai mari valori ale unei caracteristici, evidențiază valorile care se repetă cel mai des.

Alte forme ale seriei de variații sunt tabele de grup compilate în funcție de natura variației valorilor trăsăturii studiate. Prin natura variației, se disting semne discrete (discontinue) și continue.

O serie discretă este o astfel de serie variațională, a cărei construcție se bazează pe semne cu schimbare discontinuă (semne discrete). Acestea din urmă includ categoria tarifară, numărul de copii din familie, numărul de angajați din întreprindere etc. Aceste semne pot lua doar un număr finit de anumite valori.

O serie variațională discretă este un tabel care constă din două coloane. Prima coloană indică valoarea specifică a atributului, iar a doua - numărul de unități de populație cu o anumită valoare a atributului.

Dacă un semn are o schimbare continuă (valoarea venitului, experiența de muncă, costul mijloacelor fixe ale unei întreprinderi etc., care poate lua orice valoare în anumite limite), atunci trebuie construită o serie de variații de interval pentru acest semn.



Tabelul de grup de aici are și două coloane. Primul indică valoarea caracteristicii în intervalul „de la - la” (opțiuni), al doilea - numărul de unități incluse în interval (frecvență).

Frecvența (frecvența de repetare) - numărul de repetări ale unei anumite variante a valorilor atributului, notat fi, și suma frecvențelor egală cu volumul populației studiate, notat

Unde k este numărul de opțiuni de valoare de atribut

Foarte des, tabelul este completat cu o coloană în care se calculează frecvențele acumulate S, care arată câte unități ale populației au o valoare caracteristică nu mai mare decât această valoare.

O serie de distribuție variațională discretă este o serie în care grupurile sunt compuse în funcție de o caracteristică care variază discret și ia doar valori întregi.

Seria de variație a intervalului de distribuție este o serie în care atributul de grupare, care formează baza grupării, poate lua orice valori într-un anumit interval, inclusiv cele fracționale.

O serie variațională de interval este un set ordonat de intervale de variație a valorilor unei variabile aleatoare cu frecvențele corespunzătoare sau frecvențele valorilor cantității care se încadrează în fiecare dintre ele.

Este oportun să se construiască o serie de distribuție de intervale, în primul rând, cu o variație continuă a unei trăsături și, de asemenea, dacă o variație discretă se manifestă pe o gamă largă, de ex. numărul de opțiuni pentru o caracteristică discretă este destul de mare.

Din această serie se pot trage deja câteva concluzii. De exemplu, elementul mediu al unei serii de variații (mediana) poate fi o estimare a rezultatului cel mai probabil al unei măsurători. Primul și ultimul element al seriei variaționale (adică elementul minim și maxim al eșantionului) arată răspândirea elementelor eșantionului. Uneori, dacă primul sau ultimul element este foarte diferit de restul eșantionului, atunci ele sunt excluse din rezultatele măsurătorii, având în vedere că aceste valori au fost obținute ca urmare a unui fel de defecțiune gravă, de exemplu, tehnologie.

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane