Mediana datelor eșantionului. Funcția mediană în Excel pentru a efectua analize statistice

Alături de valorile medii, mediile structurale sunt calculate ca caracteristici statistice ale serii de variații ale distribuțiilor - ModăȘi median.
Modă(Mo) reprezintă valoarea caracteristicii studiate, repetată cu cea mai mare frecvență, i.e. mod – valoarea unei caracteristici care apare cel mai des.
Median(Me) este valoarea atributului care se încadrează în mijlocul populației clasate (ordonate), adică mediana este valoarea centrală a unei serii de variații.
Principala proprietate a mediei este că suma abaterilor absolute ale valorilor atributelor de la mediană este mai mică decât de la orice altă valoare ∑|x i - Me|=min.

Determinarea modului și a mediei din datele negrupate

Sa luam in considerare determinarea modului și a mediei din datele negrupate. Să presupunem că o echipă de lucru formată din 9 persoane are următoarele categorii tarifare: 4 3 4 5 3 3 6 2 6. Întrucât această brigadă are cei mai mulți muncitori din categoria a 3-a, această categorie tarifară va fi modală. Mo = 3.
Pentru a determina mediana, este necesar să se efectueze o clasare: 2 3 3 3 4 4 5 6 6 . Lucrătorul central din această serie este un lucrător din categoria a 4-a, prin urmare, această categorie va fi mediana. Dacă seria clasată include un număr par de unități, atunci mediana este definită ca media celor două valori centrale.
Dacă modul reflectă cea mai comună variantă a valorii atributului, atunci mediana îndeplinește practic funcțiile de medie pentru o populație eterogenă care nu respectă legea normală de distribuție. Să ilustrăm semnificația sa cognitivă cu următorul exemplu.
Să presupunem că trebuie să caracterizăm venitul mediu al unui grup de persoane format din 100 de persoane, dintre care 99 au venituri în intervalul de la 100 la 200 de dolari pe lună, iar venitul lunar al acestora din urmă este de 50.000 de dolari (Tabelul 1).
Tabelul 1 - Venitul lunar al grupului de persoane studiat. Dacă folosim media aritmetică, obținem un venit mediu de aproximativ 600 $ - 700 $, care are puține în comun cu venitul părții principale a grupului. Mediana, egală în acest caz cu Me = 163 de dolari, ne va permite să oferim o descriere obiectivă a nivelului veniturilor a 99% din acest grup de persoane.
Să luăm în considerare determinarea modului și a mediei folosind date grupate (serie de distribuție).
Să presupunem că distribuția lucrătorilor întregii întreprinderi în ansamblu pe categorii tarifare are următoarea formă (Tabelul 2).
Tabelul 2 - Distribuția lucrătorilor întreprinderii pe categorii tarifare

Calculul modului și al medianei pentru o serie discretă

Calculul modului și al mediei pentru serii de intervale

Calculul modului și al mediei pentru o serie de variații

Determinarea modului dintr-o serie de variații discrete

Este utilizată o serie de valori ale atributelor construite anterior, sortate după valoare. Dacă dimensiunea eșantionului este impară, luăm valoarea centrală; dacă dimensiunea eșantionului este pară, luăm media aritmetică a celor două valori centrale.
Determinarea modului dintr-o serie de variații discrete: categoria a 5-a tarifară are cea mai mare frecvență (60 persoane), prin urmare, este modală. Mo = 5.
Pentru a determina valoarea mediană a unei caracteristici, numărul unității mediane a seriei (N Me) se află folosind următoarea formulă: , unde n este volumul populației.
În cazul nostru: .
Valoarea fracțională rezultată, care apare întotdeauna atunci când numărul de unități din populație este par, indică faptul că punctul de mijloc exact se află între 95 și 96 de lucrători. Este necesar să se determine din ce grup aparțin lucrătorii cu aceste numere de serie. Acest lucru se poate face calculând frecvențele acumulate. Nu există lucrători cu aceste cifre în prima grupă, unde sunt doar 12 persoane, și nici în grupa a doua (12+48=60). Lucrătorii al 95-lea și al 96-lea se află în grupa a treia (12+48+56=116), prin urmare, mediana este a 4-a categorie tarifară.

Calculul modului și al mediei în serii de intervale

Spre deosebire de seriile de variații discrete, determinarea modului și a mediei din seria de interval necesită anumite calcule bazate pe următoarele formule:
, (5.6)
Unde x 0– limita inferioară a intervalului modal (intervalul cu cea mai mare frecvență se numește modal);
i– valoarea intervalului modal;
fMo– frecvența intervalului modal;
f Mo -1– frecvența intervalului premergător celui modal;
f Mo +1– frecvenţa intervalului următor celui modal.
(5.7)
Unde x 0– limita inferioară a intervalului median (mediana este primul interval a cărui frecvență acumulată depășește jumătate din suma totală de frecvențe);
i– valoarea intervalului median;
S Me -1– intervalul acumulat care precede mediana;
fMe– frecvența intervalului median.
Să ilustrăm aplicarea acestor formule folosind datele din tabel. 3.
Intervalul cu limitele 60 – 80 în această distribuţie va fi modal, deoarece are cea mai mare frecvență. Folosind formula (5.6), definim modul:

Pentru a stabili intervalul median, este necesar să se determine frecvența acumulată a fiecărui interval ulterior până când aceasta depășește jumătate din suma frecvențelor acumulate (în cazul nostru, 50%) (Tabelul 5.11).
S-a stabilit că mediana este intervalul cu limite de 100 - 120 de mii de ruble. Să determinăm acum mediana:

Tabelul 3 - Distribuția populației Federației Ruse în funcție de nivelul venitului monetar nominal mediu pe cap de locuitor în martie 1994.
Grupuri după nivelul venitului mediu lunar pe cap de locuitor, mii de ruble.Ponderea populației, %
Până la 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Peste 3007,7
Total100,0

Tabelul 4 - Determinarea intervalului median
Astfel, media aritmetică, modul și mediana pot fi utilizate ca o caracteristică generalizată a valorilor unui anumit atribut pentru unitățile unei populații clasate.
Principala caracteristică a centrului de distribuție este media aritmetică, care se caracterizează prin faptul că toate abaterile de la acesta (pozitive și negative) se adună la zero. Mediana se caracterizează prin faptul că suma abaterilor de la ea în modul este minimă, iar modul este valoarea atributului care apare cel mai frecvent.
Raportul dintre mod, mediană și medie aritmetică indică natura distribuției caracteristicii în agregat și ne permite să evaluăm asimetria acesteia. În distribuțiile simetrice, toate cele trei caracteristici coincid. Cu cât discrepanța dintre mod și media aritmetică este mai mare, cu atât seria este mai asimetrică. Pentru seriile moderat asimetrice, diferența dintre mod și media aritmetică este de aproximativ trei ori mai mare decât diferența dintre mediană și medie, adică:
|Mo –`x| = 3 |Me –`x|.

Determinarea modului și a mediei prin metoda grafică

Modul și mediana într-o serie de intervale pot fi determinate grafic. Modul este determinat de histograma distribuției. Pentru a face acest lucru, selectați cel mai înalt dreptunghi, care în acest caz este modal. Apoi conectăm vârful drept al dreptunghiului modal la colțul din dreapta sus al dreptunghiului anterior. Și vârful din stânga dreptunghiului modal - cu colțul din stânga sus al dreptunghiului următor. Din punctul de intersecție a acestora coborâm perpendiculara pe axa absciselor. Abscisa punctului de intersecție al acestor linii va fi modul de distribuție (Fig. 5.3).


Orez. 5.3. Determinarea grafică a modului folosind o histogramă.


Orez. 5.4. Determinarea grafică a mediei prin cumulat
Pentru a determina mediana dintr-un punct de pe scara frecvențelor acumulate (frecvențe) corespunzătoare la 50%, se trasează o linie dreaptă paralelă cu axa absciselor până se intersectează cu cumulul. Apoi, din punctul de intersecție, o perpendiculară este coborâtă pe axa x. Abscisa punctului de intersecție este mediana.

Quartile, decile, percentile

În mod similar, cu găsirea medianei în seria de variații a distribuției, puteți găsi valoarea atributului pentru orice unitate a seriei clasate. Deci, de exemplu, puteți găsi valoarea atributului pentru unitățile care împart o serie în patru părți egale, în 10 sau 100 de părți. Aceste valori sunt numite „cuartile”, „decile”, „percentile”.
Quartilele reprezintă valoarea unei caracteristici care împarte populația clasată în 4 părți egale.
Există o cuartilă inferioară (Q 1), care separă ¼ din populația cu cele mai mici valori ale atributului și o cuartilă superioară (Q 3), care separă ¼ din partea cu cele mai mari valori ale atributului. Aceasta înseamnă că 25% din unitățile din populație vor fi mai mici ca valoare Q 1 ; 25% din unități vor fi cuprinse între Q 1 și Q 2 ; 25% este între Q 2 și Q 3, iar restul de 25% depășește Q 3. Quartila mijlocie a lui Q2 este mediana.
Pentru a calcula cuartile folosind o serie de variații de interval, se folosesc următoarele formule:
, ,
Unde x Q 1– limita inferioară a intervalului care conține quartila inferioară (intervalul este determinat de frecvența acumulată, prima depășind 25%);
x Q 3– limita inferioară a intervalului care conține quartila superioară (intervalul este determinat de frecvența acumulată, prima depășind 75%);
i– dimensiunea intervalului;
S Q 1-1– frecvența acumulată a intervalului care precede intervalul care conține quartila inferioară;
S Q 3-1– frecvența acumulată a intervalului care precede intervalul care conține quartila superioară;
f Q 1– frecvența intervalului care conține quartila inferioară;
f Q 3– frecvența intervalului care conține quartila superioară.
Să luăm în considerare calculul quartilelor inferioare și superioare conform datelor din tabel. 5.10. Quartila inferioară se află în intervalul 60 – 80, a cărei frecvență cumulată este de 33,5%. Quartila superioară se află în intervalul 160 – 180 cu o frecvență acumulată de 75,8%. Ținând cont de asta obținem:
,
.
Pe lângă quartile, decilele pot fi determinate în intervalele de variație ale distribuției - opțiuni care împart seria de variații clasificate în zece părți egale. Prima decilă (d 1) împarte populația în raport de 1/10 la 9/10, a doua decilă (d 1) - în raport de 2/10 la 8/10 etc.
Acestea sunt calculate folosind formulele:
, .
Valorile caracteristice care împart seria în o sută de părți se numesc percentile. Raporturile dintre mediane, quartile, decile și percentile sunt prezentate în Fig. 5.5.

Salariile în diverse sectoare ale economiei, temperatura și nivelurile de precipitații pe același teritoriu pentru perioade comparabile de timp, randamentul culturilor cultivate în diferite regiuni geografice etc. Cu toate acestea, media nu este în niciun caz singurul indicator generalizator - în unele cazuri pentru o evaluare mai precisă o valoare potrivită este mediana. În statistică, este utilizat pe scară largă ca o caracteristică descriptivă auxiliară a distribuției unei caracteristici într-o anumită populație. Să ne dăm seama cum diferă de cel mediu și, de asemenea, de ce este necesar să-l folosești.

Mediana în statistică: definiție și proprietăți

Imaginează-ți următoarea situație: 10 persoane lucrează într-o companie împreună cu directorul. Muncitorii obișnuiți primesc 1.000 UAH, iar managerul lor, care este și proprietarul, primește 10.000 UAH. Dacă calculăm media aritmetică, se dovedește că salariul mediu la această întreprindere este de 1900 UAH. Va fi adevărată această afirmație? Sau să luăm acest exemplu: în aceeași secție de spital sunt nouă persoane cu o temperatură de 36,6 °C și o persoană a cărei temperatură este de 41 °C. Media aritmetică în acest caz este egală cu: (36,6*9+41)/10 = 37,04 °C. Dar asta nu înseamnă că toți cei prezenți sunt bolnavi. Toate acestea sugerează că media singură nu este adesea suficientă și, de aceea, mediana este utilizată în plus față de aceasta. În statistică, acest indicator se numește opțiunea care se află exact la mijlocul seriei de variații ordonate. Dacă îl calculăm pentru exemplele noastre, obținem 1000 UAH, respectiv. și 36,6 °C. Cu alte cuvinte, o mediană în statistică este o valoare care împarte o serie la jumătate în așa fel încât de ambele părți ale acesteia (în jos sau în sus) să existe același număr de unități într-o anumită populație. Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

Cum să găsiți mediana în statistici

Metoda de calcul a acestei valori depinde în mare măsură de ce tip de serie de variații avem: discretă sau interval. În primul caz, mediana se găsește pur și simplu în statistici. Tot ce trebuie să faceți este să găsiți suma frecvențelor, să o împărțiți la 2 și apoi să adăugați ½ la rezultat. Cel mai bine ar fi să explicați principiul de calcul folosind următorul exemplu. Să presupunem că avem date grupate despre fertilitate și dorim să aflăm care este mediana.

Numărul grupului de familie după numărul de copii

Numărul de familii

După câteva calcule simple, constatăm că indicatorul necesar este: 195/2 + ½ = opțiune. Pentru a afla ce înseamnă acest lucru, ar trebui să acumulați secvențial frecvențele, începând cu cele mai mici opțiuni. Deci, suma primelor două linii ne dă 30. Este clar că aici nu există 98 de opțiuni. Dar dacă adăugați frecvența celei de-a treia opțiuni (70) la rezultat, obțineți o sumă egală cu 100. Conține exact a 98-a opțiune, ceea ce înseamnă că mediana va fi o familie care are doi copii.

În ceea ce privește seria de intervale, se utilizează de obicei următoarea formulă:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me, în care:

  • X Me - prima valoare a intervalului median;
  • ∑f - numărul de serie (suma frecvenţelor sale);
  • i Ме - valoarea intervalului median;
  • f Me - frecvența intervalului median;
  • S Ме-1 este suma frecvențelor cumulate din intervalele care preced mediana.

Din nou, este destul de greu de înțeles fără un exemplu. Să presupunem că există date despre valoare

Salariu, mii de ruble.

Frecvențele acumulate

Pentru a folosi formula de mai sus, trebuie mai întâi să determinăm intervalul median. Ca atare interval, alegeți-l pe cel a cărui frecvență acumulată depășește jumătate din suma totală de frecvențe sau este egală cu aceasta. Deci, împărțind 510 la 2, constatăm că acest criteriu corespunde intervalului cu o valoare salarială de 250.000 de ruble. până la 300.000 de ruble. Acum puteți înlocui toate datele în formula:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me = 250 + 50 * (510/2 - 170) / 115 = 286,96 mii ruble.

Sperăm că articolul nostru a fost util și că acum aveți o înțelegere clară a ceea ce este o mediană în statistici și cum ar trebui calculată.

Pentru a calcula mediana în MS EXCEL, există o funcție specială MEDIAN(). În acest articol vom defini mediana și vom învăța cum să o calculăm pentru un eșantion și pentru o anumită lege de distribuție a unei variabile aleatoare.

Sa incepem cu mediane Pentru mostre(adică pentru un set fix de valori).

Mediana eșantionului

Median(mediana) este un număr care este mijlocul unui set de numere: jumătate dintre numerele din mulțime sunt mai mari decât median, iar jumătate din numere sunt mai mici decât median.

A calcula mediane necesar mai întâi (valori în probă). De exemplu, median pentru probă (2; 3; 3; 4 ; 5; 7; 10) va fi 4. Pentru că tocmai in probă 7 valori, trei dintre ele sunt mai mici decât 4 (adică 2; 3; 3) și trei valori sunt mai mari (adică 5; 7; 10).

Dacă setul conține un număr par de numere, atunci se calculează pentru cele două numere din mijlocul setului. De exemplu, median pentru probă (2; 3; 3 ; 6 ; 7; 10) va fi 4,5, deoarece (3+6)/2=4,5.

Pentru determinare medianeîn MS EXCEL există o funcție cu același nume MEDIAN(), versiunea în limba engleză a MEDIAN().

Median nu coincide neapărat cu . O potrivire are loc numai dacă valorile din eșantion sunt distribuite simetric în raport cu in medie. De exemplu, pentru mostre (1; 2; 3 ; 4 ; 5; 6) medianȘi in medie egal cu 3,5.

Daca este cunoscut Funcția de distribuție F(x) sau funcția de densitate de probabilitate p(X), Acea median poate fi găsită din ecuația:

De exemplu, după ce am rezolvat această ecuație analitic pentru distribuția Lognormală lnN(μ; σ 2), obținem că median calculat folosind formula =EXP(μ). Când μ=0, mediana este 1.

Fii atent la subiect Funcții de distribuție, pentru care F(x)=0,5(vezi poza de mai sus) . Abscisa acestui punct este egală cu 1. Aceasta este valoarea mediei, care coincide în mod natural cu valoarea calculată anterior folosind formula em.

În MS EXCEL median Pentru distribuție lognormală LnN(0;1) poate fi calculat folosind formula =LOGNORM.REV(0,5,0,1).

Notă: Amintiți-vă că integrala lui pe întregul domeniu de specificare a variabilei aleatoare este egal cu unu.

Prin urmare, linia mediană (x=mediană) împarte aria de sub grafic funcții de densitate de probabilitateîn două părți egale.

Datorită faptului că cercetătorul nu deține date despre volumul vânzărilor la fiecare casă de schimb valutar, calcularea mediei aritmetice pentru a determina prețul mediu pe dolar este nepractică.

Mediana unei serii de numere

Cu toate acestea, este posibil să se determine valoarea atributului, care se numește mediană (Me). Median

în exemplul nostru

Număr median: NoMe = ;

Modă

Tabelul 3.6.

f— suma frecvențelor seriei;

Frecvențe cumulate

12_

_

S—frecvențe acumulate.

În fig. 3.2. Este prezentată o histogramă a distribuției băncilor în funcție de marja de profit (conform Tabelului 3.6.).

x - suma profitului, milioane de ruble,

f este numărul de bănci.

„MEDIANA SERIE COMANDATĂ”

Versiunea text HTML a publicației


Note de lecție de algebră în clasa a VII-a

Subiectul lecției: „MEDIANUL O SERIE COMANDATĂ.”

profesor al școlii Ozyornaya, filiala școlii secundare MCOU Burkovskaya Eremenko Tatyana Alekseevna
Obiective:
conceptul de mediană ca caracteristică statistică a unei serii ordonate; dezvoltarea capacității de a găsi mediana pentru serii ordonate cu un număr par și impar de termeni; de a dezvolta capacitatea de a interpreta valorile medianei în funcție de situația practică, de a consolida conceptul de medie aritmetică a unui set de numere. Dezvoltați abilitățile de muncă independentă. Dezvoltați interesul pentru matematică.
În timpul orelor

Lucru oral.
Rândurile sunt date: 1) 4; 1; 8; 5; 1; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7,3; 6. Aflați: a) cele mai mari și cele mai mici valori ale fiecărei serii; b) sfera fiecărui rând; c) modul fiecărui rând.
II. Explicarea noului material.
Lucrați conform manualului. 1. Să luăm în considerare problema de la paragraful 10 al manualului. Ce înseamnă seria comandată? Aș dori să subliniez că înainte de a găsi mediana, trebuie întotdeauna să ordonați seriile de date. 2. Pe tablă ne familiarizăm cu regulile de găsire a mediei pentru serii cu un număr par și impar de termeni:
Median

ordonat

rând
numere
Cu

ciudat

număr

membrii

este numărul scris în mijloc și
median

serie comandată
numere
cu un număr par de membri
se numește media aritmetică a două numere scrise în mijloc.
Median

arbitrar

rând
se numește mediana 1 3 1 7 5 4 a seriei ordonate corespunzătoare.
Observ că indicatorii sunt media aritmetică, modul și mediana conform

diferit

caracteriza

date,

primit

rezultat

observatii.

III. Formarea deprinderilor și abilităților.
grupa 1. Exerciții de aplicare a formulelor pentru găsirea medianei unei serii ordonate și neordonate. 1.
№ 186.
Soluţie: a) Numărul de membri ai seriei P= 9; median Meh= 41; b) P= 7, rândul este ordonat, Meh= 207; V) P= 6, rândul este ordonat, Meh= = 21; G) P= 8, rândul este ordonat, Meh= = 2,9. Răspuns: a) 41; b) 207; la 21; d) 2.9. Elevii comentează cum să găsească mediana. 2. Aflați media aritmetică și mediana unei serii de numere: a) 27, 29, 23, 31, 21, 34; V) ; 1. b) 56, 58, 64, 66, 62, 74. Soluţie: Pentru a găsi mediana, este necesar să ordonați fiecare rând: a) 21, 23, 27, 29, 31, 34. P = 6; X = = 27,5; Meh= = 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Cum să găsiți mediana în statistici

P = 6; X = 63,3; Meh= = 63; V) ; 1. P = 5; X = : 5 = 3: 5 = 0,6; Meh = . 3.
№ 188
(oral). Răspuns: da; b) nu; c) nu; d) da. 4. Știind că o serie ordonată conține T numere, unde T– un număr impar, indicați numărul membrului care este mediana dacă T este egal cu: a) 5; b) 17; c) 47; d) 201. Răspuns: a) 3; b) 9; c) 24; d) 101. grupa a 2-a. Sarcini practice privind găsirea medianei seriei corespunzătoare și interpretarea rezultatului obținut. 1.
№ 189.
Soluţie: Numărul de membri ai seriei P= 12. Pentru a găsi mediana, seria trebuie ordonată: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Mediana seriei Meh= = 176. Producția lunară a fost mai mare decât mediana pentru următorii membri ai artelului: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125 ; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 xx++ = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rilov; 3) Antonov; 6) Astafiev. Răspuns: 176. 2.
№ 192.
Soluţie: Să sortăm seria de date: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; numărul de membri ai seriei P= 20. Leagăn A = X max – X min = 42 – 30 = 12. Moda lu= 32 (această valoare apare de 6 ori - mai des decât altele). Median Meh= = 35. În acest caz, intervalul prezintă cea mai mare variație a timpului de prelucrare a piesei; modul arată cea mai tipică valoare a timpului de procesare; median – timpul de prelucrare, care nu a fost depășit de jumătate din strunjitori. Răspuns: 12; 32; 35.
IV. Rezumatul lecției.
– Cum se numește mediana unei serii de numere? – Poate mediana unei serii de numere să nu coincidă cu niciunul dintre numerele din serie? – Ce număr este mediana unei serii ordonate care conține 2 P numere? 2 P– 1 numere? – Cum să găsiți mediana unei serii neordonate?
Teme pentru acasă:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

La secţiunea învăţământ general de bază

Mod și mediană

Valorile medii includ, de asemenea, modul și mediana.

Mediana și modul sunt adesea folosite ca o caracteristică medie în acele populații în care calculul mediei (aritmetică, armonică etc.) este imposibil sau nepractic.

De exemplu, un sondaj prin sondaj a 12 case de schimb valutar comercial din Omsk a făcut posibilă înregistrarea prețurilor diferite pentru dolar la vânzarea acestuia (date din 10 octombrie 1995 la cursul de schimb al dolarului -4493 ruble).

Datorită faptului că cercetătorul nu deține date despre volumul vânzărilor la fiecare casă de schimb valutar, calcularea mediei aritmetice pentru a determina prețul mediu pe dolar este nepractică. Cu toate acestea, este posibil să se determine valoarea atributului, care se numește mediană (Me). Median se află în mijlocul rândului clasat și îl împarte în jumătate.

Calcularea mediei pentru datele negrupate este după cum urmează:

a) aranjați valorile individuale ale caracteristicii în ordine crescătoare:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) determinați numărul ordinal al mediei folosind formula:

în exemplul nostru aceasta înseamnă că mediana în acest caz este situată între a șasea și a șaptea valoare a atributului din seria clasată, deoarece seria are un număr par de valori individuale. Astfel, Me este egal cu media aritmetică a valorilor învecinate: 4550, 4560.

c) luați în considerare procedura de calcul a mediei în cazul unui număr impar de valori individuale.

Să presupunem că observăm nu 12, ci 11 puncte de schimb valutar, atunci seria clasată va arăta astfel (renunțați la al 12-lea punct):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Număr median: NoMe = ;

pe locul șase este = 4560, care este mediana: Me = 4560. Pe ambele părți ale acestuia există același număr de puncte.

Modă— aceasta este valoarea cea mai comună a unei caracteristici între unitățile unei populații date. Ea corespunde unei anumite valori de atribut.

În cazul nostru, prețul modal pe dolar poate fi numit 4560 de ruble: această valoare se repetă de 4 ori, mai des decât toate celelalte.

În practică, modul și mediana sunt de obicei găsite folosind date grupate. În urma grupării s-au obţinut o serie de repartizări ale băncilor în funcţie de valoarea profitului încasat pe anul (Tabelul 3.6.).

Tabelul 3.6.

Gruparea băncilor după valoarea profitului încasat pe anul

Pentru a determina mediana, trebuie să calculați suma frecvențelor cumulate. Creșterea totală continuă până când suma cumulativă a frecvențelor depășește jumătate din suma frecvențelor. În exemplul nostru, suma frecvențelor acumulate (12) depășește jumătate din toate valorile (20:2). Această valoare corespunde intervalului median, care conține mediana (5,5 - 6,4). Să-i determinăm valoarea utilizând formula:

unde este valoarea inițială a intervalului care conține mediana;

— valoarea intervalului median;

f— suma frecvențelor seriei;

— suma frecvențelor cumulate premergătoare intervalului median;

— frecvența intervalului median.

Astfel, 50% dintre bănci au un profit de 6,1 milioane de ruble, iar 50% dintre bănci au un profit de peste 6,1 milioane de ruble.

Cea mai mare frecvență corespunde și intervalului 5,5 - 6,4, adică. modul trebuie să fie în acest interval. Determinăm valoarea acestuia folosind formula:

unde este valoarea inițială a intervalului care conține modul;

— valoarea intervalului modal;

— frecvența intervalului modal;

— frecvența intervalului premergător modalului;

— frecvența intervalului următor celui modal.

Formula de mod dată poate fi utilizată în serii de variații cu intervale egale.

Astfel, în această populație, cea mai comună dimensiune a profitului este de 6,10 milioane de ruble.

Mediana și modul pot fi determinate grafic. Mediana este determinată de cumulat (Fig. 3.1.). Pentru a-l construi, este necesar să se calculeze frecvențele și frecvențele cumulate. Frecvențele cumulate arată câte unități de populație au valori de atribut nu mai mari decât valoarea luată în considerare și sunt determinate prin însumarea secvențială a frecvențelor de interval. La construirea unei serii de distribuție a intervalelor cumulate, limita inferioară a primului interval corespunde unei frecvențe egale cu zero, iar limita superioară corespunde întregii frecvențe a unui interval dat. Limita superioară a celui de-al doilea interval corespunde unei frecvențe cumulate egale cu suma frecvențelor primelor două intervale etc.

Să construim o curbă cumulată conform datelor din tabel. 6 privind repartizarea băncilor după marja de profit.

Frecvențe cumulate

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X profit

Orez. 3.1. Cumulele seriei de distribuție a băncilor în funcție de marja de profit:

x - suma profitului, milioane de ruble,

S—frecvențe acumulate.

Pentru a determina mediana, înălțimea celei mai mari ordonate, care corespunde mărimii totale a populației, este împărțită la jumătate. Prin punctul rezultat se trasează o linie dreaptă, paralelă cu axa absciselor, până când se intersectează cu cumulul. Abscisa punctului de intersecție este mediana.

Modul este determinat de histograma distribuției. Histograma este construită astfel:

Pe axa absciselor sunt trasate segmente egale, care la scara acceptată corespund mărimii intervalelor seriei de variații. Pe segmentele sunt construite dreptunghiuri ale căror zone sunt proporționale cu frecvențele (sau frecvențele) intervalului.

Mediana în statistică

3.2. Este prezentată o histogramă a distribuției băncilor în funcție de marja de profit (conform Tabelului 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X

Orez. 3.2. Distribuția băncilor comerciale în funcție de marja de profit:

x - suma profitului, milioane de ruble,

f este numărul de bănci.

Pentru a determina modul, conectăm vârful drept al dreptunghiului modal la colțul din dreapta sus al dreptunghiului anterior, iar vârful stâng al dreptunghiului modal la colțul din stânga sus al dreptunghiului următor. Abscisa punctului de intersecție al acestor linii va fi modul de distribuție.

Mediană (statistici)

Mediană (statistici), în statistica matematică, un număr care caracterizează un eșantion (de exemplu, un set de numere). Dacă toate elementele eșantionului sunt diferite, atunci mediana este numărul eșantionului astfel încât exact jumătate dintre elementele eșantionului sunt mai mari decât acesta, iar cealaltă jumătate sunt mai mici decât acesta. Mai general, mediana poate fi găsită ordonând elementele unei probe în ordine crescătoare sau descrescătoare și luând elementul din mijloc. De exemplu, eșantionul (11, 9, 3, 5, 5) după ordonare se transformă în (3, 5, 5, 9, 11) iar mediana sa este numărul 5. Dacă eșantionul are un număr par de elemente, mediana poate să nu fie determinată în mod unic: pentru datele numerice, se utilizează cel mai des jumătatea sumei a două valori adiacente (adică mediana setului (1, 3, 5, 7) este luată egală cu 4).

Cu alte cuvinte, o mediană în statistică este o valoare care împarte o serie la jumătate în așa fel încât de ambele părți ale acesteia (în jos sau în sus) să existe același număr de unități într-o anumită populație.

Sarcina nr. 1. Calculul valorilor medii aritmetice, modale și mediane

Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

  • Valoarea medie
  • Median
  • Modă

Mediană (statistici)

Mediană (statistici), în statistica matematică, un număr care caracterizează un eșantion (de exemplu, un set de numere). Dacă toate elementele eșantionului sunt diferite, atunci mediana este numărul eșantionului astfel încât exact jumătate dintre elementele eșantionului sunt mai mari decât acesta, iar cealaltă jumătate sunt mai mici decât acesta. Mai general, mediana poate fi găsită ordonând elementele unei probe în ordine crescătoare sau descrescătoare și luând elementul din mijloc. De exemplu, eșantionul (11, 9, 3, 5, 5) după ordonare se transformă în (3, 5, 5, 9, 11) iar mediana sa este numărul 5.

5.5 Mod și mediană. Calculul lor în serii de variații discrete și interval

Dacă există un număr par de elemente în eșantion, mediana poate să nu fie determinată în mod unic: pentru datele numerice, se utilizează cel mai des jumătatea sumei a două valori adiacente (adică mediana mulțimii (1, 3, 5, 7) se ia egal cu 4).

Cu alte cuvinte, o mediană în statistică este o valoare care împarte o serie la jumătate în așa fel încât de ambele părți ale acesteia (în jos sau în sus) să existe același număr de unități într-o anumită populație. Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

Mediana este folosită în locul mediei aritmetice atunci când opțiunile extreme ale seriei clasate (cel mai mic și cel mai mare) în comparație cu restul se dovedesc a fi excesiv de mari sau excesiv de mici.

Funcția MEDIAN măsoară tendința centrală, care este centrul unui set de numere într-o distribuție statistică. Există trei modalități cele mai comune de a determina tendința centrală:

  • Valoarea medie- media aritmetică, care se calculează prin adăugarea unui set de numere și apoi împărțirea sumei rezultate la numărul acestora.
    De exemplu, media numerelor 2, 3, 3, 5, 7 și 10 este 5, care este rezultatul împărțirii sumei lor de 30 la suma lor de 6.
  • Median- un număr care este mijlocul unui set de numere: jumătate dintre numere au valori mai mari decât mediana, iar jumătate dintre numere au valori mai mici.
    De exemplu, mediana numerelor 2, 3, 3, 5, 7 și 10 ar fi 4.
  • Modă- numărul cel mai des întâlnit într-un anumit set de numere.
    De exemplu, modul pentru numerele 2, 3, 3, 5, 7 și 10 ar fi 3.

Lecție de algebră în clasa a VII-a.

Subiect: „Media ca caracteristică statistică.”

Profesorul Egorova N.I.

Scopul lecției: de a forma la elevi o idee despre mediana unui set de numere și capacitatea de a o calcula pentru mulțimi numerice simple, de a consolida conceptul de medie aritmetică a unui set de numere.

Tipul lecției: explicația materialului nou.

În timpul orelor

1. Moment organizatoric.

Informați subiectul lecției și formulați-i obiectivele.

2. Actualizarea cunoștințelor anterioare.

Întrebări pentru studenți:

Care este media aritmetică a unui set de numere?

Unde se află media aritmetică într-un set de numere?

Ce caracterizează media aritmetică a unui set de numere?

Unde se folosește des media aritmetică a unui set de numere?

Sarcini orale:

Aflați media aritmetică a unui set de numere:

Verificarea temelor.

Manual: Nr. 169, Nr. 172.

3. Studierea materialelor noi.

În lecția anterioară, ne-am familiarizat cu o astfel de caracteristică statistică precum media aritmetică a unui set de numere. Astăzi vom dedica o lecție unei alte caracteristici statistice - mediana.

Nu numai media aritmetică arată unde pe linia numerică sunt situate numerele oricărei mulțimi și unde este centrul lor. Un alt indicator este mediana.

Mediana unui set de numere este numărul care împarte mulțimea în două părți egale. În loc de „mediană”, ați putea spune „mijloc”.

Mai întâi, să ne uităm la exemple despre cum să găsim mediana și apoi să dăm o definiție strictă.

Luați în considerare următorul exemplu oral folosind un proiector

La sfârșitul anului școlar, 11 elevi de clasa a VII-a au trecut standardul de alergare de 100 de metri. Au fost înregistrate următoarele rezultate:

După ce băieții au alergat pe distanță, Petya s-a apropiat de profesor și l-a întrebat care a fost rezultatul lui.

„Rezultatul cel mai mediu: 16,9 secunde”, a răspuns profesorul.

"De ce?" – Petya a fost surprinsă. – La urma urmei, media aritmetică a tuturor rezultatelor este de aproximativ 18,3 secunde și am alergat cu mai mult de o secundă mai bine. Și, în general, rezultatul Katya (18,4) este mult mai aproape de medie decât al meu.”

„Rezultatul tău este mediu, deoarece cinci persoane au alergat mai bine decât tine și cinci - mai rău. Adică ești chiar la mijloc”, a spus profesoara.

Scrieți un algoritm pentru găsirea medianei unui set de numere:

Aranjați un set de numere (faceți o serie clasată).

Tăiați simultan cele „mai mari” și „mai mici” ale unui anumit set de numere până când rămân unul sau două numere.

Dacă a mai rămas un număr, atunci acesta este mediana.

Dacă au mai rămas două numere, atunci mediana va fi media aritmetică a celor două numere rămase.

Invitați cursanții să formuleze în mod independent definiția medianei unui set de numere, apoi citiți definiția medianei din manual (pag. 40), apoi rezolvați nr. 186 (a, b), nr. 187 (a) din manualul (pag. 41).

Cometariu:

Atrageți atenția elevilor asupra unui fapt important: mediana este practic insensibilă la abaterile semnificative ale valorilor individuale extreme ale seturilor de numere. În statistică, această proprietate se numește stabilitate. Stabilitatea unui indicator statistic este o proprietate foarte importantă; ne asigură împotriva erorilor aleatorii și a datelor individuale nesigure.

4. Consolidarea materialului studiat.

Rezolvarea problemelor.

Să notăm x-media aritmetică, Me-mediană.

Set de numere: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Set de numere: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Set de numere: 3,4,11,17,21

b) Set de numere: 17,18,19,25,28

c) Set de numere: 25, 25, 27, 28, 29, 40, 50

Concluzie: mediana unui set de numere format dintr-un număr impar de membri este egală cu numărul din mijloc.

a) Un set de numere: 2, 4, 8, 9.

Eu = (4+8):2=12:2=6

b) Un set de numere: 1,3,5,7,8,9.

Eu = (5+7):2=12:2=6

Mediana unui set de numere care conține un număr par de termeni este egală cu jumătate din suma celor două numere din mijloc.

Elevul a primit următoarele note la algebră în timpul trimestrului:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Găsiți media și mediana acestui set.

Să găsim scorul mediu, adică media aritmetică:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Să găsim mediana acestui set de numere:

Să ordonăm setul de numere: 2,4,4,4,5,5,5,5,5,5

Există doar 10 numere, pentru a găsi mediana trebuie să luați cele două numere din mijloc și să găsiți jumătatea lor.

Eu = (5+5):2 = 5

Întrebare pentru elevi: Dacă ai fi profesor, ce notă i-ai da acestui elev pentru trimestrul? Justificati raspunsul.

Președintele companiei primește un salariu de 300.000 de ruble. trei dintre adjuncții săi primesc câte 150.000 de ruble fiecare, patruzeci de angajați - câte 50.000 de ruble fiecare. iar salariul doamnei de curățenie este de 10.000 de ruble. Aflați media aritmetică și mediana salariilor din companie. Care dintre aceste caracteristici este mai benefică pentru președinte să le folosească în scopuri publicitare?

x = (300000+3·150000+40·50000+10000):(1+3+40+1) = 2760000:45=61333,33 (frec.)

Nr. 6. Oral.

A) Câte numere sunt într-o mulțime dacă al nouălea termen este mediana?

B) Câte numere sunt într-o mulțime dacă mediana ei este media aritmetică a termenilor 7 și 8?

C) Într-un set de șapte numere, cel mai mare număr este mărit cu 14. Va schimba acest lucru media aritmetică și mediana?

D) Fiecare dintre numerele din mulțime se mărește cu 3. Ce se întâmplă cu media aritmetică și cu mediana?

Dulciurile din magazin se vând la greutate. Pentru a afla câte bomboane sunt conținute într-un kilogram, Masha a decis să găsească greutatea unei bomboane. Ea a cântărit mai multe bomboane și a obținut următoarele rezultate:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Ambele caracteristici sunt potrivite pentru estimarea greutății unei bomboane, deoarece nu sunt foarte diferiți unul de celălalt.

Deci, pentru a caracteriza informațiile statistice, se folosesc media aritmetică și mediana. În multe cazuri, una dintre caracteristici poate să nu aibă vreo semnificație semnificativă (de exemplu, având informații despre momentul accidentelor rutiere, nu are sens să vorbim despre media aritmetică a acestor date).

Tema pentru acasă: paragraful 10, nr. 186 (c, d), nr. 190.

5. Rezumatul lecției. Reflecţie.

  1. „Cercetarea statistică: colectarea și gruparea datelor statistice”

    Lecţie

    Subiecte, propus pentru a șaptea clasă. PLANIFICARE TEMATICĂ. § 1. Statisticcaracteristici. P 1. Media aritmetică, interval și mod 1h. P 2. MedianCumstatisticcaracteristică

  2. Programul de lucru al curriculumului de algebră în clasa a VII-a (nivel de bază) notă explicativă

    Program de lucru

    ... clauza 10 MedianCumstatisticcaracteristică 23 p.9 Media aritmetică, interval și mod 24 Examenul nr. 2 pe subiect

  3. Program de lucru. Matematică. clasa a V-a p. Kanashi. 2011

    Program de lucru

    ... ecuații. Media aritmetică, interval și mod. MedianCumstatisticcaracteristică. Scopul este de a sistematiza și rezuma informații despre ... și abilitățile dobândite la lectii conform subiecte(bine algebră 10 clasă). 11 Clasă(4 ore pe săptămână...

  4. Ordinul nr. 51 din „30” august 2012 Program de lucru algebră clasa a VII-a

    Program de lucru

    ... material educațional MedianCumstatisticcaracteristică Cunoașteți definiția mediei aritmetice, intervalului, modului și medianeCumstatisticcaracteristici Frontal si individual...

  5. Program de lucru la matematică clasa a 7-a nivel II nivel de bază (1)

    Program de lucru

    Cum să găsiți mediana unei serii

    la fel, Cum la 6 clasă. Studiu Subiecte se termină prin familiarizarea elevilor cu cele mai simple statisticcaracteristici: medie... M.: Editura „Genzher”, 2009. 3. Zhokhov, V.I. Lecțiialgebră la 7 clasă: carte pentru profesor / V. I. Zhokhov ...

Alte documente similare...

În 1906, marele om de știință și celebrul eugenic Francis Galton a vizitat expoziția anuală a realizărilor în creșterea animalelor și a păsărilor din vestul Angliei, unde, din întâmplare, a condus un experiment interesant.

După cum notează James Surowiecki, autorul cărții The Wisdom of Crowds, la târg, Galton a fost interesat de o competiție în care oamenii trebuiau să ghicească greutatea unui bou sacrificat. Cel care a numit numărul cel mai apropiat de cel adevărat a fost declarat câștigător.

Galton era cunoscut pentru disprețul său față de abilitățile intelectuale ale oamenilor obișnuiți. El credea că numai experții adevărați ar fi capabili să facă afirmații exacte despre greutatea unui bou. Și 787 de participanți la competiție nu erau experți.

Omul de știință urma să demonstreze incompetența mulțimii calculând media răspunsurilor participanților. Imaginează-ți surpriza când s-a dovedit că rezultatul pe care l-a obținut corespundea aproape exact cu greutatea reală a taurului!

Medie - Invenție târzie

Desigur, acuratețea răspunsului l-a uimit pe cercetător. Dar și mai remarcabil este faptul că Galton s-a gândit chiar să folosească valoarea medie.

În lumea de astăzi, medii și așa-numitele medii se găsesc la fiecare cotitură: temperatura medie în New York în aprilie este de 52 de grade Fahrenheit; Stephen Curry are o medie de 30 de puncte pe joc; Venitul mediu al familiei în SUA este de 51.939 USD/an.

Cu toate acestea, ideea că multe rezultate diferite pot fi reprezentate printr-un singur număr este destul de nouă. Până în secolul al XVII-lea, mediile nu au fost folosite deloc.

Cum a apărut și s-a dezvoltat conceptul de medii și mediane? Și cum a reușit să devină principala tehnică de măsurare în timpul nostru?

Dominanța mediilor asupra mediilor a avut consecințe de amploare asupra înțelegerii noastre a informațiilor. Și deseori i-a dus pe oameni în rătăcire.

Valorile medii și mediane

Imaginează-ți că spui o poveste despre patru persoane care au luat cina cu tine la un restaurant aseară. I-ai da unuia dintre ei 20 de ani, altul 30, al treilea 40 și al patrulea 50. Ce ai spune despre vârsta lor în povestea ta?

Cel mai probabil le-ai numi vârstă mijlocie.

O medie este adesea folosită pentru a transmite informații despre ceva, precum și pentru a descrie un set de măsurători. Din punct de vedere tehnic, media este ceea ce matematicienii numesc „media aritmetică” - suma tuturor măsurătorilor împărțită la numărul de măsurători.

Deși cuvântul medie este adesea folosit ca sinonim pentru mediană, acesta din urmă se referă mai des la mijlocul a ceva. Acest cuvânt provine din latinescul „medianus”, care înseamnă „mijloc”.

Valoarea mediană în Grecia Antică

Istoria valorii medii începe cu învățăturile matematicianului grec antic Pitagora. Pentru Pitagora și școala sa, mediana avea o definiție clară și era foarte diferită de modul în care înțelegem media astăzi. A fost folosit doar în matematică, nu în analiza datelor.

În școala pitagoreică, valoarea mediană era numărul mijlociu dintr-o succesiune de numere de trei termeni, în raport „egal” cu termenii săi vecini. O relație „egale” ar putea însemna distanță egală. De exemplu, numărul 4 din seria 2,4,6. Cu toate acestea, ar putea exprima și o progresie geometrică, cum ar fi 10 în secvența 1,10,100.

Statisticianul Churchill Eisenhart explică că în Grecia antică, valoarea mediană nu era folosită pentru a reprezenta sau înlocui niciun set de numere. Pur și simplu a indicat mijlocul și a fost adesea folosit în dovezile matematice.

Eisenhart a petrecut zece ani studiind media și mediana. Inițial, el a încercat să găsească funcția reprezentativă a medianei în construcțiile științifice timpurii. În schimb, el a descoperit că majoritatea fizicienilor și astronomilor timpurii se bazau pe măsurători unice și inteligente și nu aveau o metodologie pentru selectarea celui mai bun rezultat dintre multe observații.

Cercetătorii moderni își bazează concluziile pe colectarea unor cantități mari de date, cum ar fi biologii care studiază genomul uman. Oamenii de știință antici puteau să facă mai multe măsurători, dar au ales doar cele mai bune pentru a-și construi teoriile.

După cum a scris istoricul astronomiei Otto Neugebauer, „Acest lucru este în concordanță cu dorința conștientă a oamenilor antici de a minimiza cantitatea de date empirice din știință, deoarece ei nu credeau în acuratețea observațiilor directe”.

De exemplu, matematicianul și astronomul grec Ptolemeu a calculat diametrul unghiular al Lunii folosind metode de observație și teoria mișcării Pământului. Rezultatul lui a fost 31'20. Astăzi știm că diametrul Lunii variază de la 29’20 la 34’6, în funcție de distanța sa de Pământ. Ptolemeu a folosit puține date în calculele sale, dar avea toate motivele să creadă că acestea erau exacte.

Eisenhart scrie: „Trebuie să ținem cont de faptul că relația dintre observație și teorie era diferită în antichitate decât este astăzi. Rezultatele observațiilor au fost înțelese nu ca fapte la care teoria ar trebui adaptată, ci ca cazuri specifice care pot fi utile doar ca exemple ilustrative ale adevărului teoriei.”

Oamenii de știință se vor îndrepta în cele din urmă către măsuri reprezentative ale datelor, dar inițial nu au fost folosite nici mijloacele, nici medianele în acest rol. Din antichitate până în zilele noastre, un alt concept matematic a fost folosit ca mijloc reprezentativ: jumătatea sumei valorilor extreme.

Jumătate de suma valorilor extreme

Noile instrumente științifice apar aproape întotdeauna din necesitatea de a rezolva o problemă specifică într-o anumită disciplină. Necesitatea de a găsi cea mai bună valoare dintre măsurătorile multiple a apărut din necesitatea de a determina cu exactitate locația geografică.

Gigantul intelectual al secolului al XI-lea Al-Biruni este cunoscut ca unul dintre primii oameni care au folosit metodologia semnificațiilor reprezentative. Al-Biruni a scris că, atunci când a avut multe măsurători la dispoziție și a vrut să găsească cele mai bune dintre ele, a folosit următoarea „regulă”: trebuie să găsiți numărul corespunzător mijlocului dintre două valori extreme. La calcularea semisumei valorilor extreme, toate numerele dintre valorile maxime și minime nu sunt luate în considerare, dar se găsește doar media acestor două numere.

Al-Biruni a folosit această metodă în diferite domenii, inclusiv în calcularea longitudinei orașului Ghazni, care se află în Afganistanul modern, precum și în studiile sale asupra proprietăților metalelor.

Cu toate acestea, în ultimele secole, jumătatea sumei valorilor extreme a fost folosită din ce în ce mai puțin. De fapt, în știința modernă nu este deloc relevant. Jumătatea sumei a fost înlocuită cu valoarea mediană.

Trecerea la medii

Până la începutul secolului al XIX-lea, utilizarea valorii medii/medie a devenit o metodă comună de a găsi cea mai precisă valoare reprezentativă dintr-un grup de date. Friedrich von Gauss, un matematician remarcabil al timpului său, scria în 1809: „Se credea că, dacă un anumit număr a fost determinat de mai multe observații directe făcute în aceleași condiții, atunci media aritmetică este cea mai adevărată valoare. Dacă nu este în întregime strict, atunci cel puțin este aproape de realitate și, prin urmare, te poți baza întotdeauna pe ea.”

De ce a avut loc această schimbare a metodologiei?

La această întrebare este destul de greu de răspuns. În studiul său, Churchill Eisenhart sugerează că metoda de găsire a mediei aritmetice s-ar putea să fi avut originea în domeniul măsurării deviației magnetice, adică în găsirea diferenței dintre direcția acului busolei îndreptată spre nord și nordul real. Această dimensiune a fost extrem de importantă în timpul Epocii Marii Descoperiri Geografice.

Eisenhart a descoperit că până la sfârșitul secolului al XVI-lea, majoritatea oamenilor de știință care măsurau deviația magnetică foloseau metoda ad-hoc (în latină pentru „asta, pentru această ocazie, în acest scop”) pentru a alege cea mai precisă măsurătoare.

Dar în 1580, omul de știință William Borough a abordat problema diferit. El a luat opt ​​măsurători diferite ale deflexiunii și, după ce le-a comparat, a concluzionat că cea mai precisă valoare era între 11 ⅓ și 11 ¼ de grade. Probabil a calculat o medie aritmetică care se afla în acest interval. Cu toate acestea, Boro însuși nu a numit în mod deschis abordarea sa o nouă metodă.

Înainte de 1635, nu existau cazuri clare de utilizare a mediei ca număr reprezentativ. Cu toate acestea, atunci astronomul englez Henry Gellibrand a luat două măsurători diferite ale deviației magnetice. Unul dintre ei a fost luat dimineața (11 grade), iar celălalt după-amiaza (11 grade și 32 de minute). Calculând cea mai adevărată valoare, el a scris:

„Dacă găsim media aritmetică, putem spune cu mare probabilitate că rezultatul unei măsurători precise ar trebui să fie de aproximativ 11 grade 16 minute.”

Este probabil că aceasta a fost prima dată când valoarea medie a fost folosită ca fiind cea mai apropiată de valoarea adevărată!

Cuvântul „medie” a fost folosit în engleză la începutul secolului al XVI-lea pentru a desemna pierderea financiară din cauza daunelor suferite de o navă sau încărcătura acesteia în timpul unei călătorii. În următoarea sută de ani, a desemnat tocmai aceste pierderi, care au fost calculate ca medie aritmetică. De exemplu, dacă o navă a fost avariată în timpul unei călătorii și echipajul ar trebui să arunce unele mărfuri peste bord pentru a menține greutatea navei, investitorii ar suferi pierderi financiare echivalente cu valoarea investiției lor - aceste pierderi au fost calculate în același mod ca și media aritmetică. Deci, treptat, valorile mediei și ale mediei aritmetice s-au apropiat.

Valoarea mediană

În zilele noastre, media sau media aritmetică este utilizată ca metodă principală pentru selectarea unei valori reprezentative pentru un set de măsurători. Cum sa întâmplat asta? De ce nu a fost dat acest rol valorii medii?

Francis Galton a fost campionul medianei

Termenul „mediană” – termenul de mijloc dintr-o serie de numere care împarte seria în jumătate – a apărut aproximativ în același timp cu media aritmetică. În 1599, matematicianul Edward Wright, lucrând la problema deviației normale a busolei, a propus pentru prima dată utilizarea valorii medii.

„...Să presupunem că mulți arcași trag la o anumită țintă. Ținta este eliminată ulterior. Cum poți afla unde a fost ținta? Trebuie să găsiți locul de mijloc între toate săgețile. La fel, dintre multe rezultate observaționale, cel din mijloc va fi cel mai aproape de adevăr.”

Mediana a fost utilizată pe scară largă în secolul al XIX-lea, devenind o parte necesară a oricărei analize a datelor la acea vreme. A fost folosit și de Francis Galton, un analist remarcabil al secolului al XIX-lea. În povestea cântăririi bouului spusă la începutul acestui articol, Galton a folosit inițial valoarea mediană ca reprezentând opinia mulțimii.

Mulți analiști, inclusiv Galton, au preferat mediana, deoarece este mai ușor de calculat pentru seturi mici de date.

Cu toate acestea, mediana nu a fost niciodată mai populară decât media. Acest lucru sa datorat cel mai probabil proprietăților statistice speciale inerente mediei, precum și relației sale cu distribuția normală.

Relația dintre distribuția medie și normală

Când luăm multe măsurători, rezultatele sunt, așa cum spun statisticienii, „distribuite normal”. Aceasta înseamnă că, dacă aceste date sunt reprezentate pe un grafic, punctele de pe el vor reprezenta ceva similar cu un clopot. Dacă le conectați, obțineți o curbă „în formă de clopot”. Multe statistici corespund unei distribuții normale, cum ar fi înălțimea oamenilor, inteligența și cea mai ridicată temperatură anuală.

Când datele sunt distribuite în mod normal, media va fi foarte aproape de cel mai înalt punct al curbei clopot, iar un număr foarte mare de măsurători va fi aproape de medie. Există chiar și o formulă care prezice câte măsurători vor scădea la o anumită distanță de medie.

Astfel, calcularea mediei oferă cercetătorilor o mulțime de informații suplimentare.

Legătura dintre valoarea medie și abaterea standard îi conferă un mare avantaj, deoarece valoarea mediană nu are o astfel de legătură. Această conexiune este o parte importantă a analizei datelor experimentale și a procesării statistice a informațiilor. Acesta este motivul pentru care media a devenit nucleul statisticilor și al tuturor științelor care se bazează pe date multiple pentru a-și trage concluziile.

Avantajul mediei se datorează și faptului că este ușor de calculat de computere. Deși valoarea mediană pentru un grup mic de date este destul de ușor de calculat pe cont propriu, este mult mai ușor să scrieți un program de calculator care să găsească media. Dacă utilizați Microsoft Excel, probabil că știți că funcția mediană nu este la fel de ușor de calculat ca funcția medie.

Drept urmare, datorită importanței sale științifice mari și ușurinței de utilizare, valoarea medie a devenit principala valoare reprezentativă. Cu toate acestea, această opțiune nu este întotdeauna cea mai bună.

Avantajele valorii medii

În multe cazuri când dorim să calculăm valoarea centrală a unei distribuții, valoarea mediană este o măsură mai bună. Acest lucru se datorează faptului că valoarea medie este determinată în mare măsură de rezultatele măsurătorilor extreme.

Mulți analiști cred că utilizarea necugetă a mediilor are un impact negativ asupra înțelegerii noastre a informațiilor cantitative. Oamenii se uită la medie și cred că este „norma”. Dar, de fapt, poate fi determinat de orice membru care iese puternic dintr-o serie omogenă.

Imaginați-vă un analist care dorește să cunoască o valoare reprezentativă pentru cinci case. Patru case valorează 100.000 de dolari, iar a cincea valorează 900.000 de dolari. Prin urmare, media ar fi de 200.000 USD, iar mediana ar fi de 100.000 USD. În aceasta, ca și în multe alte cazuri, valoarea mediană oferă o mai bună înțelegere a ceea ce poate fi numit „standard”.

Recunoscând cât de mult pot afecta valorile extreme media, mediana este utilizată pentru a reflecta modificările venitului gospodăriei din SUA.

Medianele sunt, de asemenea, mai puțin sensibile la datele murdare cu care se ocupă analiștii astăzi. Mulți statisticieni și analiști colectează informații prin sondajul oamenilor de pe Internet. Dacă utilizatorul adaugă accidental un zero suplimentar la răspuns, care transformă 100 în 1000, atunci această eroare va avea un impact mult mai puternic asupra mediei decât asupra mediei.

Medie sau mediană?

Alegerea dintre mediană și medie are consecințe de anvergură, de la înțelegerea noastră a efectelor medicamentelor asupra sănătății până la cunoștințele noastre despre ceea ce ar trebui să fie un buget standard al gospodăriei.

Pe măsură ce colectarea și analiza datelor modelează din ce în ce mai mult modul în care înțelegem lumea, la fel și valoarea cantităților pe care le folosim. Într-o lume ideală, analiștii ar folosi atât media, cât și mediana pentru a exprima datele grafic.

Dar trăim în condiții de timp și atenție limitate. Din cauza acestor limitări, adesea trebuie să alegem un singur lucru. Și în multe cazuri, valoarea mediană este de preferat.

CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane