V. Serii de variații, valori medii, variabilitate a trăsăturilor

Seria de variații este o serie de valori numerice ale unei caracteristici.

Principalele caracteristici ale seriei de variații: v – variantă, p – frecvența apariției acesteia.

Tipuri de serie de variații:

    în funcție de frecvența de apariție a opțiunilor: simplă - opțiunea apare o dată, ponderată - opțiunea apare de două sau de mai multe ori;

    după locația opțiunilor: clasate - opțiunile sunt aranjate în ordine descrescătoare și crescătoare, neclasate - opțiunile sunt scrise fără o ordine anume;

    prin combinarea unei opțiuni în grupuri: grupate - opțiunile sunt combinate în grupuri, negrupate - opțiunile nu sunt combinate în grupuri;

    opțiuni după dimensiune: continuu - opțiunile sunt exprimate ca număr întreg și fracționar, discrete - opțiunile sunt exprimate ca număr întreg, complexe - opțiunile sunt reprezentate printr-o valoare relativă sau medie.

O serie de variații este compilată și formalizată în scopul calculării valorilor medii.

Formular de înregistrare a seriei de variații:

8. Valori medii, tipuri, metode de calcul, aplicare în sănătate

Valori medii– o caracteristică generalizantă cumulativă a caracteristicilor cantitative. Aplicarea mediilor:

1. Să caracterizeze organizarea muncii instituțiilor medicale și să evalueze activitățile acestora:

a) în clinică: indicatori ai volumului de muncă al medicilor, numărul mediu de vizite, numărul mediu de rezidenți din zonă;

b) într-un spital: numărul mediu de zile în care un pat este deschis pe an; durata medie de spitalizare;

c) în centrul igienei, epidemiologiei și sănătății publice: suprafața medie (sau capacitatea cubică) pe persoană, standardele medii de nutriție (proteine, grăsimi, glucide, vitamine, săruri minerale, calorii), norme și standarde sanitare etc.;

2. Să caracterizeze dezvoltarea fizică (principalele caracteristici antropometrice, morfologice și funcționale);

3. Să determine parametrii medicali și fiziologici ai organismului în condiții normale și patologice în studii clinice și experimentale.

4. În cercetarea științifică specială.

Diferența dintre valorile medii și indicatori:

1. Coeficienții caracterizează o caracteristică alternativă care apare doar într-o anumită parte a populației statistice, care poate să apară sau nu.

Valorile medii acoperă caracteristici comune tuturor membrilor echipei, dar în grade diferite (greutate, înălțime, zile de tratament în spital).

2. Coeficienții sunt utilizați pentru măsurarea caracteristicilor calitative. Valori medii – pentru diferite caracteristici cantitative.

Tipuri de medii:

    media aritmetică, caracteristicile sale sunt abaterea standard și eroarea medie

    mod și mediană. Moda (lună)– corespunde valorii caracteristicii care apare mai des decât altele într-o anumită populație. Mediană (eu)– valoarea unei caracteristici care ocupă valoarea mediană într-o populație dată. Împarte seria în 2 părți egale în funcție de numărul de observații. Media aritmetică (M)– spre deosebire de mod și mediană, se bazează pe toate observațiile făcute, prin urmare este o caracteristică importantă pentru întreaga distribuție.

    alte tipuri de medii care sunt utilizate în studiile speciale: rădăcină medie pătrată, cubică, armonică, geometrică, progresivă.

Media aritmetică caracterizează nivelul mediu al populaţiei statistice.

Pentru o serie simplă, unde

∑v – opțiune de sumă,

n – numărul de observații.

pentru o serie ponderată, unde

∑vр – suma produselor fiecărei opțiuni și frecvența apariției acesteia

n – numărul de observații.

Deviație standard media aritmetică sau sigma (σ) caracterizează diversitatea unei caracteristici

- pentru o serie simplă

Σd 2 – suma pătratelor diferenței dintre media aritmetică și fiecare opțiune (d = │M-V│)

n – numărul de observații

- pentru un rând cântărit

∑d 2 p – suma produselor pătratelor diferenței dintre media aritmetică și fiecare opțiune și frecvența apariției acesteia,

n – numărul de observații.

Gradul de diversitate poate fi judecat după mărimea coeficientului de variație
. Mai mult de 20% este o diversitate puternică, 10-20% este o diversitate medie, mai puțin de 10% este o diversitate slabă.

Dacă adunăm și scădem o sigma (M ± 1σ) la valoarea medie aritmetică, atunci cu o distribuție normală, cel puțin 68,3% din toate variantele (observațiile) se vor încadra în aceste limite, ceea ce este considerat norma pentru fenomenul studiat. . Dacă k 2 ± 2σ, atunci 95,5% din toate observațiile vor fi în aceste limite, iar dacă k M ± 3σ, atunci 99,7% din toate observațiile vor fi în aceste limite. Astfel, abaterea standard este o abatere standard care ne permite să anticipăm probabilitatea apariției unei astfel de valori a caracteristicii studiate care se află în limitele specificate.

Eroarea medie a mediei aritmetice sau părtinire de reprezentativitate. Pentru o serie simplă, ponderată și regula momentelor:

.

Pentru a calcula valorile medii, este necesar: omogenitatea materialului, un număr suficient de observații. Dacă numărul de observații este mai mic de 30, n-1 este utilizat în formulele pentru calcularea σ și m.

La evaluarea rezultatului obținut prin mărimea erorii medii, se utilizează un coeficient de încredere, care face posibilă determinarea probabilității unui răspuns corect, adică indică faptul că valoarea rezultată a erorii de eșantionare nu va fi mai mare decât eroarea reală făcută ca urmare a observației continue. În consecință, odată cu creșterea probabilității de încredere, lățimea intervalului de încredere crește, ceea ce, la rândul său, crește încrederea judecății și suportabilitatea rezultatului obținut.

Serii de variații - o serie în care sunt comparate (în funcție de gradul de creștere sau scădere) Opțiuni si corespunzatoare frecvente

Opțiunile sunt expresii cantitative individuale ale unei caracteristici. Indicat printr-o literă latină V . Înțelegerea clasică a termenului „variantă” presupune că fiecare valoare unică a unei caracteristici se numește variantă, fără a ține cont de numărul de repetări.

De exemplu, în seria de variații a indicatorilor tensiunii arteriale sistolice măsurate la zece pacienți:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Sunt disponibile doar 6 valori:

110, 120, 130, 140, 160, 170.

Frecvența este un număr care indică de câte ori se repetă o opțiune. Notat printr-o literă latină P . Suma tuturor frecvențelor (care, desigur, este egală cu numărul tuturor celor studiate) se notează ca n.

    În exemplul nostru, frecvențele vor lua următoarele valori:
  • pentru opțiunea 110 frecvența P = 1 (valoarea 110 apare la un pacient),
  • pentru opțiunea 120 frecvența P = 2 (valoarea 120 apare la doi pacienți),
  • pentru opțiunea 130 frecvența P = 3 (valoarea 130 apare la trei pacienți),
  • pentru opțiunea 140 frecvența P = 2 (valoarea 140 apare la doi pacienți),
  • pentru opțiunea 160 frecvența P = 1 (valoarea 160 apare la un pacient),
  • pentru opțiunea 170 frecvența P = 1 (valoarea 170 apare la un pacient),

Tipuri de serie de variații:

  1. simplu- aceasta este o serie în care fiecare opțiune apare o singură dată (toate frecvențele sunt egale cu 1);
  2. suspendat- o serie în care una sau mai multe opțiuni apar de mai multe ori.

Seria de variații este utilizată pentru a descrie matrice mari de numere; în această formă sunt prezentate inițial datele colectate ale majorității studiilor medicale. Pentru a caracteriza seria de variații se calculează indicatori speciali, inclusiv valori medii, indicatori de variabilitate (așa-numita dispersie) și indicatori ai reprezentativității datelor eșantionului.

Indicatori de serie de variații

1) Media aritmetică este un indicator general care caracterizează mărimea caracteristicii studiate. Media aritmetică se notează ca M , este cel mai comun tip de medie. Media aritmetică se calculează ca raportul dintre suma valorilor indicatorului tuturor unităților de observare și numărul tuturor subiecților studiati. Metoda de calcul a mediei aritmetice diferă pentru o serie de variații simple și ponderate.

Formula de calcul medie aritmetică simplă:

Formula de calcul medie aritmetică ponderată:

M = Σ(V * P)/ n

2) Mode este o altă valoare medie a seriei de variații, corespunzătoare opțiunii cel mai frecvent repetate. Sau, altfel spus, aceasta este opțiunea care corespunde frecvenței celei mai înalte. Notat ca Lu . Modul este calculat numai pentru seriile ponderate, deoarece în seria simplă niciuna dintre opțiuni nu se repetă și toate frecvențele sunt egale cu una.

De exemplu, în seria de variații a valorilor ritmului cardiac:

80, 84, 84, 86, 86, 86, 90, 94;

valoarea modului este 86, deoarece această opțiune apare de 3 ori, prin urmare frecvența sa este cea mai mare.

3) Mediană - valoarea opțiunii care împarte seria de variații la jumătate: pe ambele părți ale acesteia există un număr egal de opțiuni. Mediana, ca și media aritmetică și modul, se referă la valori medii. Notat ca Pe mine

4) Abaterea standard (sinonime: abatere standard, abatere sigma, sigma) - o măsură a variabilității seriei de variații. Este un indicator integral care combină toate cazurile de abatere de la medie. De fapt, răspunde la întrebarea: cât de departe și cât de des se răspândesc variantele din media aritmetică. Notat printr-o literă greacă σ ("sigma").

Dacă dimensiunea populației este mai mare de 30 de unități, abaterea standard se calculează folosind următoarea formulă:

Pentru populații mici - 30 de unități de observare sau mai puțin - abaterea standard este calculată folosind o formulă diferită:

Metoda de grupare vă permite, de asemenea, să măsurați variație(variabilitate, fluctuație) semnelor. Când numărul de unități dintr-o populație este relativ mic, variația este măsurată pe baza numărului clasat de unități care alcătuiesc populația. Serialul se numește clasat, dacă unităţile sunt dispuse în ordinea crescătoare (descrescătoare) a caracteristicii.

Cu toate acestea, seriile clasificate sunt destul de indicative atunci când este necesară o caracteristică comparativă a variației. În plus, în multe cazuri avem de-a face cu populații statistice formate dintr-un număr mare de unități, care sunt practic greu de reprezentat sub forma unei serii specifice. În acest sens, pentru o primă cunoaștere generală a datelor statistice și mai ales pentru a facilita studiul variației caracteristicilor, fenomenele și procesele studiate sunt de obicei combinate în grupuri, iar rezultatele grupării sunt prezentate sub formă de tabele de grup.

Dacă un tabel de grup are doar două coloane - grupuri după o caracteristică selectată (opțiuni) și numărul de grupuri (frecvență sau frecvență), se numește aproape de distribuție.

Interval de distribuție - cel mai simplu tip de grupare structurală bazată pe o caracteristică, afișată într-un tabel de grup cu două coloane care conțin variante și frecvențe ale caracteristicii. În multe cazuri, cu o astfel de grupare structurală, i.e. Odată cu compilarea seriilor de distribuție începe studiul materialului statistic inițial.

O grupare structurală sub forma unei serii de distribuție poate fi transformată într-o veritabilă grupare structurală dacă grupurile selectate sunt caracterizate nu numai prin frecvențe, ci și prin alți indicatori statistici. Scopul principal al seriei de distribuție este de a studia variația caracteristicilor. Teoria distribuției seriilor este dezvoltată în detaliu prin statistici matematice.

Serii de distribuție sunt împărțite în atributiv(gruparea în funcție de caracteristicile atributive, de exemplu, împărțirea populației pe gen, naționalitate, stare civilă etc.) și variațională(gruparea după caracteristici cantitative).

Seria de variații este un tabel de grup care conține două coloane: gruparea unităților în funcție de o caracteristică cantitativă și numărul de unități din fiecare grupă. Intervalele din seria de variații sunt de obicei formate egale și închise. Seria de variații este următoarea grupare a populației ruse după venitul monetar mediu pe cap de locuitor (Tabelul 3.10).

Tabelul 3.10

Distribuția populației Rusiei în funcție de venitul mediu pe cap de locuitor în perioada 2004-2009.

Grupuri de populație după venitul mediu pe cap de locuitor, rub./lună

Populația din grup, % din total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Peste 25.000,0

Întreaga populație

Serii de variații, la rândul lor, sunt împărțite în discrete și interval. Discret serii de variații combină variante de caracteristici discrete care variază în limite înguste. Un exemplu de serie de variații discrete este distribuția familiilor rusești după numărul de copii pe care îi au.

Interval serii de variații combină variante fie ale caracteristicilor continue, fie ale caracteristicilor discrete care variază într-o gamă largă. Intervalul este seria de variații a distribuției populației ruse în funcție de venitul monetar mediu pe cap de locuitor.

Serii de variații discrete nu sunt folosite foarte des în practică. Între timp, compilarea lor nu este dificilă, întrucât componența grupurilor este determinată de variantele specifice pe care le au de fapt caracteristicile de grupare studiate.

Serii de variații de intervale sunt mai răspândite. La compilarea acestora, apare o întrebare dificilă cu privire la numărul de grupuri, precum și la dimensiunea intervalelor care ar trebui stabilite.

Principiile pentru rezolvarea acestei probleme sunt expuse în capitolul privind metodologia de construire a grupărilor statistice (vezi paragraful 3.3).

Seriile de variații sunt un mijloc de colaps sau comprimare a diverselor informații într-o formă compactă; din ele se poate face o judecată destul de clară asupra naturii variației și se poate studia diferențele dintre caracteristicile fenomenelor incluse în setul studiat. Dar cea mai importantă semnificație a seriei de variații este aceea că pe baza lor sunt calculate caracteristicile de generalizare speciale ale variației (vezi capitolul 7).

Variațională se numesc serii de distribuţie construite pe o bază cantitativă. Valorile caracteristicilor cantitative în unitățile individuale ale populației nu sunt constante și diferă mai mult sau mai puțin unele de altele.

Variație- fluctuația, variabilitatea valorii unei caracteristici între unitățile populației. Se numesc valori numerice individuale ale unei caracteristici găsite în populația studiată Opțiuni valorile. Insuficiența valorii medii pentru a caracteriza pe deplin populația ne obligă să suplimentăm valorile medii cu indicatori care ne permit să apreciem tipicitatea acestor medii prin măsurarea variabilității (variației) caracteristicii studiate.

Prezența variației se datorează influenței unui număr mare de factori asupra formării nivelului trăsăturii. Acești factori acționează cu forță inegală și în direcții diferite. Indicii de variație sunt utilizați pentru a descrie măsura variabilității trăsăturilor.

Obiectivele studiului statistic al variației:

  • 1) studiul naturii și gradului de variație a caracteristicilor în unitățile individuale ale populației;
  • 2) determinarea rolului factorilor individuali sau grupurilor acestora în variaţia anumitor caracteristici ale populaţiei.

În statistică, se folosesc metode speciale de studiere a variației, bazate pe utilizarea unui sistem de indicatori, Cu prin care se măsoară variaţia.

Cercetarea variației este importantă. Măsurarea variațiilor este necesară atunci când se efectuează observarea eșantionului, analiza de corelație și varianță etc. Ermolaev O.Yu. Statistici matematice pentru psihologi: Manual [Text]/ O.Yu. Ermolaev. - M.: Editura Flint a Institutului Psihologic și Social din Moscova, 2012. - 335 p.

După gradul de variație se poate judeca omogenitatea populației, stabilitatea valorilor individuale ale caracteristicilor și tipicitatea mediei. Pe baza acestora, se elaborează indicatori ai strângerii relației dintre caracteristici și indicatorii pentru evaluarea acurateței observării eșantionului.

Se face o distincție între variația în spațiu și variația în timp.

Variația în spațiu este înțeleasă ca fluctuația valorilor atributelor între unitățile de populație reprezentând teritorii individuale. Variația de timp se referă la modificări ale valorilor unei caracteristici pe diferite perioade de timp.

Pentru a studia variația rândurilor de distribuție, toate variantele valorilor atributelor sunt aranjate în ordine crescătoare sau descrescătoare. Acest proces se numește clasare pe rând.

Cele mai simple semne de variație sunt minim si maxim- cea mai mică și cea mai mare valoare a atributului în agregat. Numărul de repetări ale variantelor individuale ale valorilor caracteristicilor se numește frecvență de repetiție (fi). Este convenabil să înlocuiți frecvențele cu frecvențe - wi. Frecvența este un indicator relativ al frecvenței, care poate fi exprimat în fracții de unitate sau ca procent și vă permite să comparați serii de variații cu un număr diferit de observații. Exprimat prin formula:

unde Xmax, Xmin sunt valorile maxime și minime ale caracteristicii în agregat; n - numărul de grupuri.

Pentru a măsura variația unei caracteristici, se folosesc diverși indicatori absoluti și relativi. Indicatorii absoluti de variație includ intervalul de variație, abaterea liniară medie, dispersia și abaterea standard. Indicatorii relativi ai oscilației includ coeficientul de oscilație, deviația liniară relativă și coeficientul de variație.

Un exemplu de găsire a unei serii de variații

Exercițiu. Pentru această probă:

  • a) Aflați seria de variații;
  • b) Construiți funcția de distribuție;

Nr.=42. Elemente de probă:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Soluţie.

  • a) construirea unei serii de variații ordonate:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) construirea unei serii de variaţii discrete.

Să calculăm numărul de grupuri din seria de variații folosind formula Sturgess:

Să luăm numărul de grupuri egal cu 7.

Cunoscând numărul de grupuri, calculăm dimensiunea intervalului:

Pentru comoditatea construcției tabelului, vom lua numărul de grupuri egal cu 8, intervalul va fi 1.

Orez. 1 Volumul vânzărilor de mărfuri de către un magazin pentru o anumită perioadă de timp

(definiția unei serii de variații; componentele unei serii de variații; trei forme ale unei serii de variații; fezabilitatea construirii unei serii de intervale; concluzii care pot fi trase din seria construită)

O serie de variații este succesiunea tuturor elementelor eșantionului aranjate în ordine nedescrescătoare. Se repetă elemente identice

Seriile variaționale sunt serii construite pe o bază cantitativă.

Seriile de distribuție variațională constau din două elemente: opțiuni și frecvențe:

Variantele sunt valori numerice ale unei caracteristici cantitative într-o serie de distribuție variațională. Ele pot fi pozitive și negative, absolute și relative. Deci, la gruparea întreprinderilor în funcție de rezultatele activității economice, opțiunile pozitive sunt profitul, iar cifrele negative sunt pierderi.

Frecvențele sunt numerele de variante individuale sau fiecare grup al unei serii de variații, adică Acestea sunt numere care arată cât de des apar anumite opțiuni într-o serie de distribuție. Suma tuturor frecvențelor se numește volumul populației și este determinată de numărul de elemente ale întregii populații.

Frecvențele sunt frecvențe exprimate ca valori relative (fracții de unități sau procente). Suma frecvențelor este egală cu unu sau 100%. Înlocuirea frecvențelor cu frecvențe permite compararea serii de variații cu un număr diferit de observații.

Există trei forme de serie de variații: serii clasificate, serii discrete și serii cu intervale.

O serie clasificată este distribuția unităților individuale ale unei populații în ordinea crescătoare sau descrescătoare a caracteristicii studiate. Clasificarea vă permite să împărțiți cu ușurință datele cantitative în grupuri, să detectați imediat cele mai mici și mai mari valori ale unei caracteristici și să evidențiați valorile care se repetă cel mai adesea.

Alte forme de serie de variații sunt tabele de grup întocmite în funcție de natura variației valorilor caracteristicii studiate. După natura variației, se disting caracteristicile discrete (discontinue) și continue.

O serie discretă este o serie variațională, a cărei construcție se bazează pe caracteristici cu schimbare discontinuă (caracteristici discrete). Acestea din urmă includ categoria tarifară, numărul de copii din familie, numărul de angajați din întreprindere etc. Aceste caracteristici pot lua doar un număr finit de valori specifice.

O serie de variații discrete reprezintă un tabel format din două coloane. Prima coloană indică valoarea specifică a atributului, iar a doua coloană indică numărul de unități din populație cu o anumită valoare a atributului.

Dacă o caracteristică are o schimbare continuă (suma venitului, vechimea în muncă, costul activelor fixe ale unei întreprinderi etc., care poate lua orice valoare în anumite limite), atunci pentru această caracteristică este necesară construirea unui serie de variații de interval.



Tabelul de grup de aici are și două coloane. Primul indică valoarea atributului în intervalul „de la - la” (opțiuni), al doilea indică numărul de unități incluse în interval (frecvență).

Frecvența (frecvența de repetare) - numărul de repetări ale unei anumite variante a valorilor atributelor, se notează fi și se notează suma frecvențelor egală cu volumul populației studiate

Unde k este numărul de opțiuni pentru valorile atributelor

Foarte des, tabelul este completat cu o coloană în care se calculează frecvențele acumulate S, care arată câte unități din populație au o valoare caracteristică nu mai mare decât această valoare.

O serie de distribuție variațională discretă este o serie în care grupurile sunt compuse în funcție de o caracteristică care se modifică discret și ia doar valori întregi.

O serie de distribuție variațională de interval este o serie în care caracteristica de grupare care formează baza grupării poate lua orice valori, inclusiv fracționale, într-un anumit interval.

O serie de variații de interval este un set ordonat de intervale de variare a valorilor unei variabile aleatoare cu frecvențele corespunzătoare sau frecvențele de apariție ale valorii în fiecare dintre ele.

Este recomandabil să se construiască o serie de distribuție de intervale, în primul rând, cu o variație continuă a unei caracteristici și, de asemenea, dacă o variație discretă se manifestă pe o gamă largă, adică. numărul de variante ale unei caracteristici discrete este destul de mare.

Din această serie se pot trage deja câteva concluzii. De exemplu, elementul din mijloc al unei serii de variații (mediana) poate fi o estimare a celui mai probabil rezultat al măsurării. Primul și ultimul element al seriei de variații (adică elementul minim și maxim al eșantionului) arată răspândirea elementelor eșantionului. Uneori, dacă primul sau ultimul element este foarte diferit de restul eșantionului, ele sunt excluse din rezultatele măsurătorilor, având în vedere că aceste valori au fost obținute ca urmare a unui fel de defecțiune gravă, de exemplu, tehnologie.

CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane