Mediana datelor eșantionului. Funcția mediană în Excel pentru a efectua analize statistice

Alături de valorile medii, mediile structurale sunt calculate ca caracteristici statistice ale seriei de distribuție variațională - Modăși median.
Modă(Mo) reprezintă valoarea trăsăturii studiate, repetată cu cea mai mare frecvență, i.e. modul este valoarea caracteristicii care apare cel mai des.
median(Me) este valoarea caracteristicii care se încadrează în mijlocul populației clasate (ordonate), adică mediană - valoarea centrală a seriei de variații.
Proprietatea principală a mediei este că suma abaterilor absolute ale valorilor atributelor de la mediană este mai mică decât de la orice altă valoare ∑|x i - Me|=min.

Determinarea modului și a mediei din datele negrupate

Considera determinarea modului și a mediei din datele negrupate. Să presupunem că echipajele de muncă, formate din 9 persoane, au următoarele categorii salariale: 4 3 4 5 3 3 6 2 6 . Deoarece această echipă are cei mai mulți lucrători din categoria a 3-a, această categorie tarifară va fi modală. Mo = 3.
Pentru a determina mediana, este necesar să se claseze: 2 3 3 3 4 4 5 6 6 . Central în această serie este lucrătorul din categoria a 4-a, prin urmare, această categorie va fi mediana. Dacă seria clasată include un număr par de unități, atunci mediana este definită ca media celor două valori centrale.
Dacă modul reflectă cea mai comună variantă a valorii atributului, atunci mediana îndeplinește practic funcțiile unei medii pentru o populație eterogenă care nu respectă legea normală de distribuție. Să ilustrăm semnificația sa cognitivă cu următorul exemplu.
Să presupunem că trebuie să caracterizăm venitul mediu al unui grup de oameni numărând 100 de persoane, dintre care 99 au venituri în intervalul de la 100 la 200 USD pe lună, iar venitul lunar al acestora din urmă este de 50.000 USD (Tabelul 1).
Tabelul 1 - Veniturile lunare ale grupului de persoane studiat. Dacă folosim media aritmetică, obținem un venit mediu de aproximativ 600 - 700 de dolari, care are puține în comun cu venitul părții principale a grupului. Mediana, în acest caz egală cu Me = 163 de dolari, ne va permite să oferim o descriere obiectivă a nivelului veniturilor a 99% din acest grup de persoane.
Luați în considerare definiția modului și a mediei prin date grupate (serie de distribuție).
Să presupunem că distribuția lucrătorilor întregii întreprinderi în ansamblu conform categoriei tarifare are următoarea formă (Tabelul 2).
Tabelul 2 - Repartizarea lucrătorilor întreprinderii în funcție de categoria tarifară

Calculul modului și al medianei pentru o serie discretă

Calculul modului și al mediei pentru o serie de intervale

Calculul modului și al mediei pentru o serie de variații

Determinarea modului dintr-o serie de variații discrete

Se utilizează seria de valori ale caracteristicilor construite mai devreme, sortate după valoare. Dacă dimensiunea eșantionului este impară, luați valoarea centrală; dacă dimensiunea eșantionului este pară, luăm media aritmetică a celor două valori centrale.
Determinarea modului dintr-o serie de variații discrete: categoria a 5-a tarifară are cea mai mare frecvență (60 persoane), prin urmare, este modală. Mo = 5.
Pentru a determina valoarea mediană a atributului, numărul unității mediane a seriei (N Me) se găsește folosind următoarea formulă: , unde n este volumul populației.
În cazul nostru: .
Valoarea fracțională rezultată, care apare întotdeauna cu un număr par de unități de populație, indică faptul că mijlocul exact este între 95 și 96 de lucrători. Este necesar să se determine din ce grup aparțin lucrătorii cu aceste numere de serie. Acest lucru se poate face calculând frecvențele acumulate. Nu există lucrători cu aceste cifre în prima grupă, unde sunt doar 12 persoane, și nu sunt în a doua grupă (12+48=60). Lucrătorii al 95-lea și al 96-lea se află în grupa a treia (12+48+56=116), prin urmare, a 4-a categorie salarială este mediana.

Calculul modului și al mediei într-o serie de intervale

Spre deosebire de seriile variaționale discrete, determinarea modului și a mediei din seria de interval necesită anumite calcule bazate pe următoarele formule:
, (5.6)
Unde x0- limita inferioară a intervalului modal (intervalul cu cea mai mare frecvență se numește modal);
i este valoarea intervalului modal;
fMo este frecvența intervalului modal;
fMo-1 este frecvența intervalului care precedă modalul;
f Mo +1 este frecvența intervalului care urmează modalului.
(5.7)
Unde x0– limita inferioară a intervalului median (mediana este primul interval, a cărui frecvență acumulată depășește jumătate din suma totală de frecvențe);
i este valoarea intervalului median;
S Me-1- intervalul acumulat precedând mediana;
f Eu este frecvența intervalului median.
Ilustram aplicarea acestor formule folosind datele din tabel. 3.
Intervalul cu limitele 60 - 80 în această distribuție va fi modal, deoarece are cea mai mare frecvență. Folosind formula (5.6), determinăm modul:

Pentru a stabili intervalul median, este necesar să se determine frecvența acumulată a fiecărui interval ulterior până când aceasta depășește jumătate din suma frecvențelor acumulate (în cazul nostru, 50%) (Tabelul 5.11).
S-a constatat că mediana este intervalul cu limitele de 100 - 120 de mii de ruble. Acum definim mediana:

Tabelul 3 - Distribuția populației Federației Ruse după nivelul venitului nominal mediu pe cap de locuitor în martie 1994
Grupuri după nivelul venitului mediu lunar pe cap de locuitor, mii de rublePonderea populației, %
până la 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Peste 3007,7
Total100,0

Tabelul 4 - Definiția intervalului median
Astfel, media aritmetică, modul și mediana pot fi utilizate ca o caracteristică generalizată a valorilor unui anumit atribut pentru unitățile unei populații clasate.
Principala caracteristică a centrului de distribuție este media aritmetică, care se caracterizează prin faptul că toate abaterile de la acesta (pozitive și negative) se adună la zero. Este tipic pentru mediană ca suma abaterilor de la aceasta în modul este minimă, iar modul este valoarea caracteristicii care apare cel mai des.
Raportul dintre mod, mediană și medie aritmetică indică natura distribuției trăsăturii în agregat, ne permite să evaluăm asimetria acesteia. În distribuțiile simetrice, toate cele trei caracteristici sunt aceleași. Cu cât discrepanța dintre mod și media aritmetică este mai mare, cu atât seria este mai asimetrică. Pentru seriile moderat deformate, diferența dintre mod și media aritmetică este de aproximativ trei ori diferența dintre mediană și medie, adică:
|Mo–`x| = 3 |Me –`x|.

Determinarea modului și a mediei printr-o metodă grafică

Modul și mediana într-o serie de intervale pot fi determinate grafic. Modul este determinat din histograma distribuției. Pentru a face acest lucru, este selectat cel mai înalt dreptunghi, care în acest caz este modal. Apoi conectăm vârful drept al dreptunghiului modal cu colțul din dreapta sus al dreptunghiului anterior. Iar vârful din stânga dreptunghiului modal este cu colțul din stânga sus al dreptunghiului următor. Din punctul de intersecție a acestora, coborâm perpendiculara pe axa absciselor. Abscisa punctului de intersecție al acestor drepte va fi modul de distribuție (Fig. 5.3).


Orez. 5.3. Definiție grafică a modei prin histogramă.


Orez. 5.4. Determinarea grafică a mediei prin cumulat
Pentru a determina mediana dintr-un punct de pe scara frecvențelor acumulate (frecvențe) corespunzătoare la 50%, se trasează o linie dreaptă paralelă cu axa absciselor până la intersecția cu cumulul. Apoi, din punctul de intersecție, o perpendiculară este coborâtă pe axa absciselor. Abscisa punctului de intersecție este mediana.

Quartile, Decile, Percentile

În mod similar, găsind mediana în seria variațională de distribuție, puteți găsi valoarea unei caracteristici pentru orice unitate a seriei clasate în ordine. Deci, de exemplu, puteți găsi valoarea unei caracteristici în unități care împart seria în patru părți egale, în 10 sau 100 de părți. Aceste valori sunt numite „cuartile”, „decile”, „percentile”.
Quartilele sunt valoarea unei caracteristici care împarte populația în 4 părți egale.
Distingeți între quartila inferioară (Q 1), care separă ¼ din populația cu cele mai mici valori ale atributului, și quartila superioară (Q 3), care decupează ¼ partea cu cele mai mari valori ale atributului . Aceasta înseamnă că 25% din unitățile populației vor fi mai mici de Q 1 ; 25% unități vor fi cuprinse între Q 1 și Q 2 ; 25% - între Q 2 și Q 3, iar restul de 25% sunt superioare Q 3. Quartila mijlocie a lui Q 2 este mediana.
Pentru a calcula quartilele după seria de variație a intervalului, se folosesc următoarele formule:
, ,
Unde x Q 1– limita inferioară a intervalului care conține quartila inferioară (intervalul este determinat de frecvența acumulată, prima depășind 25%);
x Q 3– limita inferioară a intervalului care conține quartila superioară (intervalul este determinat de frecvența acumulată, prima depășind 75%);
i– valoarea intervalului;
S Q 1-1 este frecvența cumulativă a intervalului care precede intervalul care conține quartila inferioară;
S Q 3-1 este frecvența cumulativă a intervalului care precede intervalul care conține quartila superioară;
f Q 1 este frecvența intervalului care conține quartila inferioară;
f Q 3 este frecvența intervalului care conține quartila superioară.
Luați în considerare calculul quartilelor inferioare și superioare conform tabelului. 5.10. Quartila inferioară se află în intervalul 60 - 80, a cărei frecvență cumulată este de 33,5%. Quartila superioară se află în intervalul 160 - 180 cu o frecvență acumulată de 75,8%. Având în vedere acest lucru, obținem:
,
.
În plus față de quartile, decilele pot fi determinate în rangurile de distribuție variațională - opțiuni care împart seria variațională clasificată în zece părți egale. Prima decilă (d 1) împarte populația 1/10 la 9/10, a doua decilă (d 1) 2/10 la 8/10 și așa mai departe.
Acestea sunt calculate după formulele:
, .
Valorile caracteristicilor care împart seria în o sută de părți se numesc percentile. Rapoartele medianei, quartilelor, decilelor și percentilelor sunt prezentate în Fig. 5.5.

Salariile în diverse sectoare ale economiei, temperatura și precipitațiile în aceeași zonă pentru perioade de timp comparabile, recoltele recoltelor în diferite regiuni geografice etc. Cu toate acestea, media nu este în niciun caz singurul indicator de generalizare - în unele cazuri pentru o mai precisă evaluarea unei valori precum mediana este adecvată. În statistică, este utilizat pe scară largă ca o caracteristică descriptivă auxiliară a distribuției unei caracteristici într-o singură populație. Să vedem cum diferă de medie și, de asemenea, ce a cauzat nevoia de a-l folosi.

Mediana în statistică: definiție și proprietăți

Imaginează-ți următoarea situație: 10 persoane lucrează împreună cu directorul într-o companie. Angajații obișnuiți primesc câte 1.000 de grivne fiecare, iar managerul lor, care, de altfel, este proprietar, primește 10.000 de grivne. Dacă calculăm media aritmetică, se dovedește că salariul mediu la această întreprindere este de 1900 UAH. Va fi adevărată această afirmație? Sau ca să luăm acest exemplu, în aceeași cameră de spital sunt nouă persoane cu temperatura de 36,6°C și o persoană cu temperatura de 41°C. Media aritmetică în acest caz este: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. Dar asta nu înseamnă că toți cei prezenți sunt bolnavi. Toate acestea sugerează că media singură nu este adesea suficientă și, de aceea, mediana este utilizată în plus față de aceasta. În statistică, acest indicator se numește o variantă care se află exact în mijlocul unei serii de variații ordonate. Dacă îl calculezi pentru exemplele noastre, primești, respectiv, 1000 UAH. și 36,6 °С. Cu alte cuvinte, mediana în statistică este valoarea care împarte seria la jumătate în așa fel încât de ambele părți ale acesteia (în sus sau în jos) să fie situat același număr de unități ale populației date. Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

Cum să găsiți mediana în statistici

Metoda de calcul a acestei valori depinde în mare măsură de ce tip de serie variațională avem: discretă sau interval. În primul caz, mediana din statistici este destul de simplă. Tot ce trebuie să faceți este să găsiți suma frecvențelor, să împărțiți la 2 și apoi să adăugați ½ la rezultat. Cel mai bine ar fi să explicați principiul de calcul cu următorul exemplu. Să presupunem că am grupat datele de fertilitate și dorim să aflăm care este mediana.

Numărul grupului de familie după numărul de copii

Numărul de familii

După efectuarea unor calcule simple, obținem că indicatorul dorit este egal cu: 195/2 + ½ = opțiune. Pentru a afla ce înseamnă acest lucru, ar trebui să acumulați secvențial frecvențele, începând cu cele mai mici opțiuni. Deci, suma primelor două linii ne dă 30. În mod clar, nu există 98 de opțiuni aici. Dar dacă adăugăm la rezultat frecvența celei de-a treia opțiuni (70), obținem o sumă egală cu 100. Conține doar a 98-a opțiune, ceea ce înseamnă că mediana va fi o familie care are doi copii.

În ceea ce privește seria de intervale, următoarea formulă este de obicei utilizată aici:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, în care:

  • X Me - prima valoare a intervalului median;
  • ∑f este numărul seriei (suma frecvențelor acesteia);
  • i Me - valoarea intervalului median;
  • f Me - frecvența intervalului median;
  • S Me-1 - suma frecvențelor cumulate din intervalele care preced mediana.

Din nou, este greu să-ți dai seama fără un exemplu. Să presupunem că există date despre valoare

Salariu, mii de ruble

Frecvențe acumulate

Pentru a folosi formula de mai sus, trebuie mai întâi să determinăm intervalul median. Ca atare interval, se alege unul, a cărui frecvență acumulată depășește sau este egală cu jumătate din suma totală de frecvențe. Deci, împărțind 510 la 2, obținem că acest criteriu corespunde unui interval cu o valoare salarială de 250.000 de ruble. până la 300.000 de ruble Acum puteți înlocui toate datele din formula:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 mii ruble.

Sperăm că articolul nostru a fost util, iar acum aveți o idee clară despre care este mediana în statistici și cum ar trebui calculată.

Pentru a calcula mediana în MS EXCEL există o funcție specială MEDIAN() . În acest articol, vom defini mediana și vom învăța cum să o calculăm pentru un eșantion și pentru o anumită lege de distribuție a unei variabile aleatoare.

Sa incepem cu mediane pentru mostre(adică pentru un set fix de valori).

Mediana eșantionului

Median(mediana) este numărul care este mijlocul setului de numere: jumătate dintre numerele din mulțime sunt mai mari decât median, iar jumătate dintre numere sunt mai mici decât median.

A calcula mediane necesar mai întâi (valori în prelevarea de probe). De exemplu, median pentru probă (2; 3; 3; 4 ; 5; 7; 10) va fi 4. Din moment ce. numai în prelevarea de probe 7 valori, trei dintre ele mai mici decât 4 (adică 2; 3; 3) și trei valori mai mari decât (adică 5; 7; 10).

Dacă setul conține un număr par de numere, atunci acesta este calculat pentru două numere din mijlocul setului. De exemplu, median pentru probă (2; 3; 3 ; 6 ; 7; 10) va fi 4,5, deoarece (3+6)/2=4,5.

Pentru determinare medianeîn MS EXCEL există o funcție cu același nume MEDIAN() , versiunea în limba engleză a MEDIAN().

Median nu se potrivește neapărat. O potrivire are loc numai dacă valorile din eșantion sunt distribuite simetric mijloc. De exemplu, pentru mostre (1; 2; 3 ; 4 ; 5; 6) medianși in medie sunt egale cu 3,5.

Daca este cunoscut funcția de distribuție F(x) sau funcția de densitate de probabilitate p(X), apoi median poate fi găsită din ecuația:

De exemplu, rezolvând această ecuație analitic pentru distribuția Lognormală lnN(μ; σ 2), obținem că median se calculează prin formula =EXP(μ). Pentru μ=0, mediana este 1.

Acordați atenție punctului Funcții de distribuție, pentru care F(x)=0,5(vezi poza de mai sus) . Abscisa acestui punct este 1. Aceasta este valoarea mediei, care coincide în mod natural cu valoarea calculată anterior folosind formula em.

în MS EXCEL median pentru distribuție lognormală LnN(0;1) poate fi calculat folosind formula =LOGNORM.INV(0,5,0,1).

Notă: Amintiți-vă că integrala lui pe întreaga zonă de setare a unei variabile aleatoare este egală cu unu.

Prin urmare, linia mediană (x=mediană) împarte aria de sub grafic funcții de densitate de probabilitateîn două părți egale.

Din cauza faptului că cercetătorul nu dispune de date privind volumul vânzărilor în fiecare casă de schimb valutar, calculul mediei aritmetice în vederea stabilirii prețului mediu pe dolar este nepotrivit.

Mediana unei serii de numere

Cu toate acestea, este posibil să se determine valoarea atributului, care se numește mediană (Me). Median

în exemplul nostru

Număr median: NoMe = ;

Modă

Tabelul 3.6.

f este suma frecvențelor seriei;

Frecvențe cumulate

12_

_

S sunt frecvențe acumulate.

Pe fig. 3.2. Este prezentată o histogramă a unei serii de distribuție a băncilor după profit (conform Tabelului 3.6.).

x este suma profitului, milioane de ruble,

f este numărul de bănci.

„MEDIANUL SERIEI COMANDATE”

Versiunea text HTML a publicației


Rezumatul lecției de algebră din clasa a VII-a

Tema lecției: „MEDIANUL SERIELOR COMANDATE”.

profesor al filialei Lake School a școlii secundare MKOU Burkovskaya Eremenko Tatyana Alekseevna
Obiective:
conceptul de mediană ca caracteristică statistică a unei serii ordonate; pentru a forma capacitatea de a găsi mediana pentru serii ordonate cu un număr par și impar de membri; să formeze capacitatea de a interpreta valorile medianei în funcție de situația practică, să consolideze conceptul de mulțime medie aritmetică de numere. Dezvoltați abilitățile de muncă independentă. Dezvoltați un interes pentru matematică.
În timpul orelor

munca orală.
Sunt date rânduri: 1) 4; unu; opt; 5; unu; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; patru; 6; 7,3; 6. Găsiți: a) cele mai mari și cele mai mici valori ale fiecărui rând; b) intervalul fiecărui rând; c) moda fiecărui rând.
II. Explicarea noului material.
Lucrări manuale. 1. Luați în considerare problema de la paragraful 10 al manualului. Ce înseamnă rând ordonat? Subliniez că înainte de a găsi mediana, trebuie întotdeauna să sortați seriile de date. 2. Pe tablă, ne familiarizăm cu regulile de găsire a medianei pentru serii cu un număr par și impar de membri:
median

ordonat

rând
numere
Cu

ciudat

număr

membrii

numit numărul scris în mijloc și
median

rând ordonat
numere
cu un număr par de membri
se numește media aritmetică a două numere scrise în mijloc.
median

arbitrar

rând
se numește mediana 1 3 1 7 5 4 a seriei ordonate corespunzătoare.
Observ că indicatorii sunt media aritmetică, modul și mediana pentru

diferit

caracteriza

date,

primit

rezultat

observatii.

III. Formarea deprinderilor și abilităților.
grupa 1. Exerciții de aplicare a formulelor de găsire a medianei unei serii ordonate și neordonate. unu.
№ 186.
Soluţie: a) Numărul de membri ai seriei P= 9; median Pe mine= 41; b) P= 7, rândul este ordonat, Pe mine= 207; în) P= 6, rândul este ordonat, Pe mine== 21; G) P= 8, rândul este ordonat, Pe mine== 2,9. Răspuns: a) 41; b) 207; la 21; d) 2.9. Elevii comentează cum este găsită mediana. 2. Aflați media aritmetică și mediana unei serii de numere: a) 27, 29, 23, 31, 21, 34; în); 1. b) 56, 58, 64, 66, 62, 74. Soluţie: Pentru a găsi mediana, este necesar să sortați fiecare rând: a) 21, 23, 27, 29, 31, 34. P = 6; X = = 27,5; Pe mine== 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Cum să găsiți mediana în statistici

P = 6; X = 63,3; Pe mine== 63; în); unu. P = 5; X = : 5 = 3: 5 = 0,6; Pe mine = . 3.
№ 188
(oral). Răspuns: da; b) nu; c) nu; d) da. 4. Știind că seria ordonată conține t numere, unde t este un număr impar, indicați numărul termenului care este mediana dacă t este egal cu: a) 5; b) 17; c) 47; d) 201. Răspuns: a) 3; b) 9; c) 24; d) 101. grupa a 2-a. Sarcini practice pentru găsirea medianei seriei corespunzătoare și interpretarea rezultatului. unu.
№ 189.
Soluţie: Numărul de membri de rând P= 12. Pentru a găsi mediana, seria trebuie ordonată: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Mediana seriei Pe mine= = 176. Producția lunară a fost mai mare decât mediana pentru următorii membri ai artelului: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 xx++ = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rylov; 3) Antonov; 6) Astafiev. Răspuns: 176. 2.
№ 192.
Soluţie: Să aranjam seriile de date: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; numărul de membri de rând P= 20. Glisați A = X max- X min = 42 - 30 = 12. Mod lu= 32 (această valoare apare de 6 ori - mai des decât altele). Median Pe mine= = 35. În acest caz, intervalul arată cea mai mare distanță de timp pentru prelucrarea piesei; modul arată cea mai tipică valoare a timpului de procesare; mediana este timpul de procesare pe care nu l-au depășit jumătate dintre strunjitori. Răspuns: 12; 32; 35.
IV. Rezumatul lecției.
Care este mediana unei serii de numere? – Poate mediana unei serii de numere să nu coincidă cu niciunul dintre numerele din serie? – Ce număr este mediana unei serii ordonate care conține 2 P numere? 2 P– 1 numere? Cum să găsiți mediana unei serii neordonate?
Teme pentru acasă:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

La secţiunea învăţământ general de bază

Mod și mediană

Valorile medii includ, de asemenea, modul și mediana.

Mediana și modul sunt adesea folosite ca o caracteristică medie în acele populații în care calculul mediei (aritmetică, armonică etc.) este imposibil sau nepractic.

De exemplu, un sondaj eșantion în orașul Omsk a 12 case de schimb valutar comercial a făcut posibilă fixarea diferitelor prețuri pentru dolar atunci când a fost vândut (date din 10 octombrie 1995 la cursul de schimb al dolarului -4493 ruble) .

Din cauza faptului că cercetătorul nu dispune de date privind volumul vânzărilor în fiecare casă de schimb valutar, calculul mediei aritmetice în vederea stabilirii prețului mediu pe dolar este nepotrivit. Cu toate acestea, este posibil să se determine valoarea atributului, care se numește mediană (Me). Median se află în mijlocul rândului clasat și îl divide în două.

Calculul medianei pentru datele negrupate se face după cum urmează:

a) aranjați valorile individuale ale caracteristicii în ordine crescătoare:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) determinați numărul de serie al medianei prin formula:

în exemplul nostru aceasta înseamnă că mediana în acest caz este situată între a șasea și a șaptea valoare caracteristică din seria clasată, deoarece seria are un număr par de valori individuale. Astfel, Me este egal cu media aritmetică a valorilor învecinate: 4550, 4560.

c) luați în considerare procedura de calcul a mediei în cazul unui număr impar de valori individuale.

Să presupunem că observăm nu 12, ci 11 puncte de schimb valutar, atunci seria clasată va arăta astfel (eliminăm al 12-lea punct):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Număr median: NoMe = ;

pe locul șase este = 4560, care este mediana: Me = 4560. Pe ambele părți ale acestuia este același număr de puncte.

Modă- aceasta este cea mai comună valoare a atributului în unități din această populație. Ea corespunde unei anumite valori caracteristice.

În cazul nostru, prețul modal pe dolar poate fi numit 4560 de ruble: această valoare se repetă de 4 ori, mai des decât toate celelalte.

În practică, modul și mediana sunt de obicei găsite din date grupate. În urma grupării s-a obţinut o serie de repartizare a băncilor în funcţie de valoarea profitului încasat pe an (Tabelul 3.6.).

Tabelul 3.6.

Gruparea băncilor după valoarea profitului încasat pe anul

Pentru a determina mediana, este necesar să se calculeze suma frecvențelor cumulate. Creșterea în total continuă până când suma cumulativă a frecvențelor depășește jumătate din suma frecvențelor. În exemplul nostru, suma frecvențelor acumulate (12) depășește jumătate din toate valorile (20:2). Această valoare corespunde intervalului median, care conține mediana (5,5 - 6,4). Să-i determinăm valoarea prin formula:

unde este valoarea inițială a intervalului care conține mediana;

- valoarea intervalului median;

f este suma frecvențelor seriei;

este suma frecvențelor cumulate care preced intervalul median;

este frecvența intervalului median.

Astfel, 50% dintre bănci au un profit de 6,1 milioane de ruble, iar 50% dintre bănci - mai mult de 6,1 milioane de ruble.

Cea mai mare frecvență corespunde și intervalului 5,5 - 6,4, adică. modul trebuie să fie în acest interval. Valoarea acestuia este determinată de formula:

unde este valoarea inițială a intervalului care conține modul;

- valoarea intervalului modal;

este frecvența intervalului modal;

- frecvenţa intervalului premergător modalului;

- frecvenţa intervalului după modal.

Formula de modă dată poate fi utilizată în serii variaționale cu intervale egale.

Astfel, în acest agregat, cel mai frecvent profit este de 6,10 milioane de ruble.

Mediana și modul pot fi determinate grafic. Mediana este determinată de cumulat (Fig. 3.1.). Pentru a-l construi, este necesar să se calculeze frecvențele și frecvențele cumulate. Frecvențele cumulate arată câte unități ale populației au valori caracteristice nu mai mari decât valoarea considerată și este determinată de însumarea succesivă a frecvențelor de interval. La construirea seriei de distribuție a intervalelor cumulate, limita inferioară a primului interval corespunde unei frecvențe egale cu zero, iar limita superioară corespunde întregii frecvențe a intervalului dat. Limita superioară a celui de-al doilea interval corespunde frecvenței cumulate egale cu suma frecvențelor primelor două intervale și așa mai departe.

Să construim o curbă cumulată conform tabelului. 6 privind repartizarea băncilor după profit.

Frecvențe cumulate

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х profit

Orez. 3.1. Distribuția cumulativă a băncilor după profit:

x este suma profitului, milioane de ruble,

S sunt frecvențe acumulate.

Pentru a determina mediana, înălțimea celei mai mari ordonate, care corespunde populației totale, se împarte la jumătate. Prin punctul obţinut se trasează o linie dreaptă, paralelă cu axa absciselor, până se intersectează cu cumulul. Abscisa punctului de intersecție este mediana.

Modul este determinat din histograma distribuției. Histograma este construită astfel:

Pe axa absciselor sunt trasate segmente egale care, pe scara acceptată, corespund mărimii intervalelor seriei de variații. Pe segmentele sunt construite dreptunghiuri ale căror zone sunt proporționale cu frecvențele (sau frecvențele) intervalului.

Mediana în statistică

3.2. Este prezentată o histogramă a unei serii de distribuție a băncilor după profit (conform Tabelului 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X

Orez. 3.2. Distribuția băncilor comerciale după profit:

x este suma profitului, milioane de ruble,

f este numărul de bănci.

Pentru a determina moda, conectăm vârful drept al dreptunghiului modal cu colțul din dreapta sus al dreptunghiului anterior și vârful stâng al dreptunghiului modal cu colțul din stânga sus al dreptunghiului următor. Abscisa punctului de intersecție al acestor drepte va fi modul de distribuție.

Mediană (statistică)

Mediană (statistică), în statistica matematică, un număr care caracterizează un eșantion (de exemplu, un set de numere). Dacă toate elementele din eșantion sunt diferite, atunci mediana este numărul eșantionului, astfel încât exact jumătate dintre elementele din eșantion sunt mai mari decât acesta, iar cealaltă jumătate sunt mai mici decât acesta. Într-un caz mai general, mediana poate fi găsită ordonând elementele probei în ordine crescătoare sau descrescătoare și luând elementul din mijloc. De exemplu, eșantionul (11, 9, 3, 5, 5) după ordonare se transformă în (3, 5, 5, 9, 11) iar mediana sa este numărul 5. Dacă eșantionul are un număr par de elemente, mediana poate să nu fie determinată în mod unic: pentru datele numerice, se utilizează cel mai des jumătatea sumei a două valori adiacente (adică mediana setului (1, 3, 5, 7) este luată egală cu 4).

Cu alte cuvinte, mediana în statistică este valoarea care împarte seria la jumătate în așa fel încât de ambele părți ale acesteia (în sus sau în jos) să fie situat același număr de unități ale populației date.

Sarcina numărul 1. Calculul valorii medii aritmetice, modale și mediane

Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

  • Rău
  • Median
  • Modă

Mediană (statistică)

Mediană (statistică), în statistica matematică, un număr care caracterizează un eșantion (de exemplu, un set de numere). Dacă toate elementele din eșantion sunt diferite, atunci mediana este numărul eșantionului, astfel încât exact jumătate dintre elementele din eșantion sunt mai mari decât acesta, iar cealaltă jumătate sunt mai mici decât acesta. Într-un caz mai general, mediana poate fi găsită ordonând elementele probei în ordine crescătoare sau descrescătoare și luând elementul din mijloc. De exemplu, eșantionul (11, 9, 3, 5, 5) după ordonare se transformă în (3, 5, 5, 9, 11) iar mediana sa este numărul 5.

5.5 Mod și mediană. Calculul lor în serii variaționale discrete și interval

Dacă eșantionul are un număr par de elemente, mediana poate să nu fie determinată în mod unic: pentru datele numerice, se utilizează cel mai des jumătatea sumei a două valori adiacente (adică mediana mulțimii (1, 3, 5, 7) se ia egal cu 4).

Cu alte cuvinte, mediana în statistică este valoarea care împarte seria la jumătate în așa fel încât de ambele părți ale acesteia (în sus sau în jos) să fie situat același număr de unități ale populației date. Din cauza acestei proprietăți, acest indicator are câteva alte denumiri: percentila 50 sau cuantila 0,5.

Mediana este folosită în locul mediei aritmetice atunci când variantele extreme ale seriei clasate (cel mai mic și cel mai mare) în comparație cu restul se dovedesc a fi excesiv de mari sau excesiv de mici.

Funcția MEDIAN măsoară tendința centrală, care este centrul unui set de numere într-o distribuție statistică. Există trei modalități cele mai comune de a determina tendința centrală:

  • Rău- media aritmetică, care se calculează prin adăugarea unui set de numere, urmată de împărțirea sumei rezultate la numărul acestora.
    De exemplu, media numerelor 2, 3, 3, 5, 7 și 10 este 5, care este rezultatul împărțirii sumei lor, care este 30, la numărul lor, care este 6.
  • Median- un număr care este mijlocul unui set de numere: jumătate dintre numere au valori mai mari decât mediana, iar jumătate dintre numere sunt mai mici.
    De exemplu, mediana numerelor 2, 3, 3, 5, 7 și 10 este 4.
  • Modă este numărul care apare cel mai frecvent în setul dat de numere.
    De exemplu, modul pentru numerele 2, 3, 3, 5, 7 și 10 ar fi 3.

Lecție de algebră în clasa a VII-a.

Subiectul „Media ca caracteristică statistică”.

Profesorul Egorova N.I.

Scopul lecției: formarea înțelegerii de către elevi a medianei unui set de numere și a capacității de a o calcula pentru mulțimi numerice simple, fixând conceptul de mulțime medie aritmetică de numere.

Tipul lecției: explicația materialului nou.

În timpul orelor

1. Moment organizatoric.

Informați subiectul lecției și formulați obiectivele acesteia.

2. Actualizarea cunoștințelor anterioare.

Întrebări pentru studenți:

Care este media aritmetică a unui set de numere?

Unde se află media aritmetică într-un set de numere?

Ce caracterizează media aritmetică a unui set de numere?

Unde se folosește des media aritmetică a unui set de numere?

Sarcini orale:

Aflați media aritmetică a unui set de numere:

Verificarea temelor.

Manual: Nr. 169, Nr. 172.

3. Învățarea de material nou.

În lecția anterioară, ne-am familiarizat cu o astfel de caracteristică statistică precum media aritmetică a unui set de numere. Astăzi vom dedica o lecție unei alte caracteristici statistice - mediana.

Nu numai media aritmetică arată unde pe linia numerică sunt situate numerele oricărei mulțimi și unde este centrul lor. Un alt indicator este mediana.

Mediana unui set de numere este numărul care împarte mulțimea în două părți egale. În loc de „mediană” s-ar putea spune „mijloc”.

Mai întâi, folosind exemple, vom analiza cum să găsim mediana și apoi vom da o definiție strictă.

Luați în considerare următorul exemplu verbal folosind un proiector

La sfârșitul anului școlar, 11 elevi din clasa a VII-a au trecut standardul de alergare de 100 de metri. Au fost înregistrate următoarele rezultate:

După ce băieții au alergat pe distanță, Petya s-a apropiat de profesor și l-a întrebat care a fost rezultatul lui.

„Cea mai mare medie: 16,9 secunde”, a răspuns profesorul

"De ce?" Petya a fost surprinsă. - La urma urmei, media aritmetică a tuturor rezultatelor este de aproximativ 18,3 secunde și am alergat cu o secundă sau mai bine. Și, în general, rezultatul Katya (18,4) este mult mai aproape de medie decât al meu.”

„Rezultatul tău este mediu pentru că cinci persoane au alergat mai bine decât tine și cinci mai proaste. Deci ești chiar la mijloc”, a spus profesorul.

Scrieți un algoritm pentru găsirea medianei unui set de numere:

Ordonați setul numeric (compuneți o serie clasificată).

În același timp, tăiem numerele „mai mari” și „mai mici” ale acestui set de numere până când rămân un număr sau două numere.

Dacă există un singur număr, atunci acesta este mediana.

Dacă au mai rămas două numere, atunci mediana va fi media aritmetică a celor două numere rămase.

Invitați cursanții să formuleze în mod independent definiția medianei unui set de numere, apoi citiți definiția medianei din manual (pag. 40), apoi rezolvați nr. 186 (a, b), nr. 187 (a) din manualul (pag. 41).

Cometariu:

Atrageți atenția elevilor asupra unei circumstanțe importante: mediana este practic insensibilă la abaterile semnificative ale valorilor individuale extreme ale seturilor de numere. În statistică, această proprietate se numește stabilitate. Stabilitatea unui indicator statistic este o proprietate foarte importantă, ne asigură împotriva erorilor aleatorii și a datelor individuale nesigure.

4. Consolidarea materialului studiat.

Rezolvarea problemelor.

Notați x-media aritmetică, Me-mediană.

Set de numere: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Set de numere: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Set de numere: 3,4,11,17,21

b) Set de numere: 17,18,19,25,28

c) Set de numere: 25, 25, 27, 28, 29, 40, 50

Concluzie: mediana unui set de numere format dintr-un număr impar de membri este egală cu numărul din mijloc.

a) Un set de numere: 2, 4, 8, 9.

Eu = (4+8):2=12:2=6

b) Un set de numere: 1,3,5,7,8,9.

Eu = (5+7):2=12:2=6

Mediana unui set de numere care conține un număr par de membri este jumătate din suma celor două numere din mijloc.

Elevul a primit următoarele note la algebră în timpul trimestrului:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Găsiți scorul mediu și mediana acestui set.

Să găsim scorul mediu, adică media aritmetică:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Găsiți mediana acestui set de numere:

Să comandăm un set de numere: 2,4,4,4,5,5,5,5,5,5

Doar 10 numere, pentru a găsi mediana trebuie să luați două numere din mijloc și să găsiți jumătatea lor.

Eu = (5+5):2 = 5

Întrebare pentru elevi: Dacă ai fi profesor, ce notă i-ai da acestui elev pentru un sfert? Justificați răspunsul.

Președintele companiei primește un salariu de 300.000 de ruble. trei dintre adjuncții săi primesc câte 150.000 de ruble fiecare, patruzeci de angajați - câte 50.000 de ruble fiecare. iar salariul unui curățenie este de 10.000 de ruble. Aflați media aritmetică și mediana salariilor din companie. Care dintre aceste caracteristici este mai profitabilă pentru președinte să le folosească în scopuri publicitare?

x \u003d (300000 + 3 150000 + 40 50000 + 10000): (1 + 3 + 40 + 1) \u003d 2760000: 45 \u003d 61333,33 (ruble)

Nr. 6. Oral.

A) Câte numere sunt în mulțime dacă mediana este al nouălea membru?

B) Câte numere sunt în mulțime dacă mediana ei este media aritmetică a termenilor 7 și 8?

C) Într-un set de șapte numere, cel mai mare număr a fost mărit cu 14. Va schimba acest lucru atât media aritmetică, cât și mediana?

D) Fiecare dintre numerele din mulțime a fost mărit cu 3. Ce se va întâmpla cu media aritmetică și cu mediana?

Dulciurile din magazin se vând la greutate. Pentru a afla câte dulciuri sunt conținute într-un kilogram, Masha a decis să găsească greutatea unei bomboane. Ea a cântărit mai multe bomboane și a obținut următoarele rezultate:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Ambele caracteristici sunt potrivite pentru estimarea greutății unei bomboane, deoarece nu sunt foarte diferiți unul de celălalt.

Deci, pentru a caracteriza informațiile statistice, se folosesc media aritmetică și mediana. În multe cazuri, unele dintre caracteristici pot să nu aibă vreo semnificație semnificativă (de exemplu, având informații despre momentul accidentelor rutiere, nu are sens să vorbim despre media aritmetică a acestor date).

Tema pentru acasă: paragraful 10, nr. 186 (c, d), nr. 190.

5. Rezultatele lecției. Reflecţie.

  1. „Cercetarea statistică: colectarea și gruparea datelor statistice”

    Lecţie

    Subiecte propus pentru a şaptea clasă. PLANIFICARE TEMATICĂ. § unu. Statisticcaracteristici. P 1. Media aritmetică, interval și mod 1h. P 2. MedianCumstatisticcaracteristică

  2. Programul de lucru al cursului de formare „algebră” în clasa a VII-a (nivel de bază) notă explicativă

    Program de lucru

    ... punctul 10 MedianCumstatisticcaracteristică 23 p.9 Media aritmetică, interval și mod 24 Examenul nr. 2 activat subiect

  3. Program de lucru. Matematica. clasa a V-a p. Kanashi. 2011

    Program de lucru

    ... ecuații. Media aritmetică, interval și mod. MedianCumstatisticcaracteristică. Scopul este de a sistematiza și rezuma informații despre ... și abilitățile dobândite la lectii conform subiecte(bine algebră 10 clasă). 11 Clasă(4 ore pe săptămână...

  4. Ordinul nr.51 din 30 august 2012 Program de lucru algebră Nota a VII-a

    Program de lucru

    … material de învățare MedianCumstatisticcaracteristică Cunoașteți definiția mediei aritmetice, intervalului, modului și medianeCumstatisticcaracteristici Frontale si individuale...

  5. Program de lucru la matematică clasa a 7-a nivel II nivel de bază (1)

    Program de lucru

    Cum să găsiți mediana unei serii

    la fel, Cum la 6 sala de clasa. Studiul Subiecte se încheie prin a prezenta elevilor cele mai simple statisticcaracteristici: mediu ... M .: Editura „Genzher”, 2009. 3. Zhokhov, V.I. Lecțiialgebră la 7 sala de clasa: carte. pentru profesor / V. I. Zhokhov ...

Alte documente conexe...

În 1906, marele om de știință și renumitul eugenician Francis Galton a vizitat anual Expoziția de animale și păsări de curte din vestul Angliei, unde, întâmplător, a efectuat un experiment interesant.

Potrivit lui James Surovetsky, autorul cărții The Wisdom of the Crowd, la Târgul Galton a existat o competiție în care oamenii trebuiau să ghicească greutatea unui taur sacrificat. Cel care a numit cel mai aproape de numărul adevărat a fost declarat câștigător.

Galton era cunoscut pentru disprețul său față de abilitățile intelectuale ale oamenilor obișnuiți. El credea că numai experții adevărați ar fi capabili să facă declarații exacte despre greutatea taurului. Și 787 de participanți la competiție nu erau experți.

Omul de știință urma să demonstreze incompetența mulțimii calculând numărul mediu din răspunsurile participanților. Care a fost surpriza lui când s-a dovedit că rezultatul primit corespunde aproape exact greutății reale a taurului!

Valoare medie - invenție târzie

Desigur, acuratețea răspunsului l-a uimit pe cercetător. Dar și mai remarcabil este faptul că Galton s-a gândit să folosească media.

În lumea de astăzi, mediile și așa-numitele medii sunt peste tot: temperatura medie în New York în aprilie este de 52 de grade Fahrenheit; Stephen Curry are o medie de 30 de puncte pe joc; Venitul mediu al gospodăriei din SUA este de 51.939 USD/an.

Cu toate acestea, ideea că multe rezultate diferite pot fi reprezentate printr-un singur număr este destul de nouă. Până în secolul al XVII-lea, mediile nu au fost folosite în general.

Cum a apărut și s-a dezvoltat conceptul de medii și mediane? Și cum a reușit să devină principala tehnică de măsurare în timpul nostru?

Predominanța mijloacelor asupra mediilor a avut consecințe de amploare asupra înțelegerii noastre a informațiilor. Și deseori i-a dus pe oameni în rătăcire.

Valorile medii și mediane

Imaginează-ți că spui o poveste despre patru persoane care au luat masa cu tine aseară la un restaurant. I-ai da unuia dintre ei 20 de ani, altul 30, al treilea 40, iar celui de-al patrulea 50. Ce ai spune despre vârsta lor în povestea ta?

Cel mai probabil, le vei numi vârsta medie.

Media este adesea folosită pentru a transmite informații despre ceva, precum și pentru a descrie un set de măsurători. Din punct de vedere tehnic, media este ceea ce matematicienii numesc „media aritmetică” - suma tuturor măsurătorilor împărțită la numărul de măsurători.

Deși cuvântul „medie” este adesea folosit ca sinonim pentru cuvântul „median” (median), acesta din urmă este mai des menționat ca mijlocul a ceva. Acest cuvânt provine din latinescul „medianus”, care înseamnă „mijloc”.

Valoarea mediană în Grecia Antică

Istoria valorii medii provine din învățăturile matematicianului grec antic Pitagora. Pentru Pitagora și școala sa, mediana avea o definiție clară și era foarte diferită de modul în care înțelegem media astăzi. A fost folosit doar în matematică, nu și în analiza datelor.

În școala pitagoreică, valoarea mediană era numărul mediu dintr-o succesiune de numere de trei termeni, în raport „egal” cu termenii vecini. Raportul „egal” ar putea însemna aceeași distanță. De exemplu, numărul 4 din rândul 2,4,6. Cu toate acestea, ar putea exprima și o progresie geometrică, cum ar fi 10 în secvența 1,10,100.

Statisticianul Churchill Eisenhart explică că, în Grecia antică, mediana nu era folosită ca reprezentant sau înlocuitor pentru niciun set de numere. Pur și simplu a indicat mijlocul și a fost adesea folosit în dovezile matematice.

Eisenhart a petrecut zece ani studiind media și mediana. Inițial, el a încercat să găsească funcția reprezentativă a medianei în construcțiile științifice timpurii. În schimb, el a descoperit că cei mai mulți dintre fizicienii și astronomii timpurii se bazau pe măsurători unice, realizate cu pricepere și nu aveau o metodologie pentru a alege cel mai bun rezultat dintre multe observații.

Cercetătorii moderni își bazează concluziile pe colectarea de cantități mari de date, cum ar fi, de exemplu, biologii care studiază genomul uman. Oamenii de știință antici, pe de altă parte, puteau să facă mai multe măsurători, dar au ales doar cele mai bune pentru a-și construi teoriile.

După cum a scris istoricul astronomiei Otto Neugebauer, „acest lucru este în concordanță cu dorința conștientă a oamenilor antici de a minimiza cantitatea de date empirice din știință, deoarece ei nu credeau în acuratețea observațiilor directe”.

De exemplu, matematicianul și astronomul grec Ptolemeu a calculat diametrul unghiular al lunii folosind metoda observației și teoria mișcării pământului. Scorul lui a fost 31'20. Astăzi știm că diametrul Lunii variază de la 29’20 la 34’6, în funcție de distanța de la Pământ. Ptolemeu a folosit puține date în calculele sale, dar avea toate motivele să creadă că acestea erau exacte.

Eisenhart scrie: „Trebuie să ținem cont de faptul că relația dintre observație și teorie în antichitate era diferită de cea de astăzi. Rezultatele observațiilor au fost înțelese nu ca fapte la care teoria ar trebui adaptată, ci ca cazuri concrete care pot fi utile doar ca exemple ilustrative ale adevărului teoriei.

În cele din urmă, oamenii de știință vor apela la măsurători reprezentative ale datelor, dar inițial nu au fost folosite nici mijloacele, nici medianele în acest rol. Din antichitate până în zilele noastre, un alt concept matematic a fost folosit ca mijloc reprezentativ - jumătatea sumei valorilor extreme.

Jumătate de suma valorilor extreme

Noile instrumente științifice apar aproape întotdeauna din necesitatea de a rezolva o anumită problemă într-o anumită disciplină. Necesitatea de a găsi cea mai bună valoare dintre multe măsurători a apărut din necesitatea de a determina cu exactitate locația geografică.

Gigantul intelectual din secolul al XI-lea Al-Biruni este cunoscut ca unul dintre primii oameni care au folosit metodologia semnificațiilor reprezentative. Al-Biruni a scris că, atunci când a avut multe măsurători la dispoziție și a vrut să găsească cele mai bune dintre ele, a folosit următoarea „regulă”: trebuie să găsești un număr corespunzător mijlocului dintre două valori extreme. Când se calculează jumătatea sumei valorilor extreme, toate numerele dintre valorile maxime și minime nu sunt luate în considerare, dar se găsește doar media acestor două numere.

Al-Biruni a aplicat această metodă în diverse domenii, inclusiv pentru a calcula longitudinea orașului Ghazni, care este situat pe teritoriul Afganistanului modern, precum și în studiile sale asupra proprietăților metalelor.

Cu toate acestea, în ultimele câteva secole, jumătatea sumei extremelor a fost folosită din ce în ce mai puțin. De fapt, în știința modernă, nu este deloc relevant. Valoarea mediană a înlocuit jumătatea sumei.

Tranziția la medii

Până la începutul secolului al XIX-lea, utilizarea mediei/mediei devenise o metodă obișnuită pentru găsirea valorii cele mai precise reprezentative dintr-un grup de date. Friedrich von Gauss, un matematician remarcabil al timpului său, scria în 1809: „Se credea că, dacă un anumit număr era determinat de mai multe observații directe făcute în aceleași condiții, atunci media aritmetică este cea mai adevărată valoare. Dacă nu este destul de strict, atunci cel puțin este aproape de realitate și, prin urmare, te poți baza întotdeauna pe ea.

De ce a existat o astfel de schimbare în metodologie?

La această întrebare este destul de greu de răspuns. În cercetările sale, Churchill Eisenhart sugerează că metoda de găsire a mediei aritmetice ar fi putut avea originea în domeniul măsurării deviației magnetice, adică în găsirea diferenței dintre direcția acului busolei îndreptată spre nord și nordul real. Această măsurătoare a fost extrem de importantă în timpul Epocii Descoperirilor.

Eisenhart a constatat că până la sfârșitul secolului al XVI-lea, majoritatea oamenilor de știință care măsurau deviația magnetică foloseau metoda ad-hoc (din latină „la aceasta, pentru această ocazie, în acest scop”) în alegerea celei mai precise măsurători.

Dar în 1580, omul de știință William Borough a abordat problema diferit. El a luat opt ​​măsurători diferite de deformare și le-a comparat și a concluzionat că cea mai precisă citire a fost între 11 ⅓ și 11 ¼ grade. Probabil că a calculat media aritmetică, care era în acest interval. Cu toate acestea, Borough însuși nu și-a numit în mod deschis abordarea noua metodă.

Înainte de 1635, nu existau deloc cazuri neechivoce de utilizare a valorii medii ca număr reprezentativ. Cu toate acestea, atunci astronomul englez Henry Gellibrand a luat două măsurători diferite ale deviației magnetice. Unul s-a făcut dimineața (11 grade) și celălalt după-amiaza (11 grade și 32 de minute). Calculând cea mai adevărată valoare, el a scris:

„Dacă găsim media aritmetică, putem spune cu mare probabilitate că rezultatul unei măsurători precise ar trebui să fie de aproximativ 11 grade 16 minute.”

Este probabil că aceasta a fost prima dată când media a fost folosită ca fiind cea mai apropiată de adevărată!

Cuvântul „medie” a fost folosit în engleză la începutul secolului al XVI-lea pentru a se referi la pierderile financiare din daunele suferite de o navă sau de încărcătură în timpul unei călătorii. Pentru următoarea sută de ani, a desemnat tocmai aceste pierderi, care au fost calculate ca medie aritmetică. De exemplu, dacă o navă a fost avariată în timpul unei călătorii și echipajul a trebuit să arunce unele mărfuri peste bord pentru a economisi greutatea navei, investitorii au suferit o pierdere financiară echivalentă cu suma investiției lor - aceste pierderi au fost calculate în același mod ca și medie aritmetică. Deci, treptat, valorile mediei (mediei) și ale mediei aritmetice au convergit.

Valoarea mediană

Astăzi, media sau media aritmetică este utilizată ca modalitate principală de a selecta o valoare reprezentativă a unui set de măsurători. Cum s-a întâmplat? De ce nu a fost atribuit acest rol valorii medii?

Francis Galton a fost campionul median

Termenul „valoare mediană” (mediană) - termenul mijlociu dintr-o serie de numere, împărțind această serie la jumătate - a apărut cam în același timp cu media aritmetică. În 1599, matematicianul Edward Wright, care lucra la problema deviației normale într-o busolă, a sugerat pentru prima dată utilizarea valorii mediane.

„... Să zicem că o mulțime de arcași trag la o țintă. Ținta este eliminată ulterior. Cum poți afla unde a fost ținta? Trebuie să găsiți locul de mijloc între toate săgețile. La fel, dintre setul de rezultate ale observațiilor, cel mai apropiat de adevăr va fi cel de la mijloc.

Mediana a fost utilizată pe scară largă în secolul al XIX-lea, devenind o parte indispensabilă a oricărei analize a datelor la acea vreme. A fost folosit și de Francis Galton, eminentul analist al secolului al XIX-lea. În povestea cântăririi taurului de la începutul acestui articol, Galton a folosit inițial mediana ca reprezentând opinia mulțimii.

Mulți analiști, inclusiv Galton, au preferat mediana, deoarece este mai ușor de calculat pentru seturi de date mai mici.

Cu toate acestea, mediana nu a fost niciodată mai populară decât media. Cel mai probabil, acest lucru s-a întâmplat din cauza proprietăților statistice speciale inerente valorii medii, precum și a relației sale cu distribuția normală.

Relația dintre distribuția medie și normală

Când luăm multe măsurători, rezultatele sunt, după cum spun statisticienii, „distribuite normal”. Aceasta înseamnă că, dacă aceste date sunt reprezentate pe un grafic, atunci punctele de pe el vor reprezenta ceva similar cu un clopot. Dacă le conectați, obțineți o curbă „în formă de clopot”. Multe statistici se potrivesc distribuției normale, cum ar fi înălțimea oamenilor, IQ-ul și cea mai ridicată temperatură anuală.

Când datele sunt distribuite în mod normal, media va fi foarte aproape de cel mai înalt punct al curbei clopot, iar un număr foarte mare de măsurători va fi aproape de medie. Există chiar și o formulă care prezice câte măsurători vor fi la o anumită distanță de medie.

Astfel, calcularea mediei oferă cercetătorilor o mulțime de informații suplimentare.

Relația dintre medie și deviația standard îi oferă un mare avantaj, deoarece mediana nu are o astfel de relație. Această conexiune este o parte importantă a analizei datelor experimentale și a procesării statistice a informațiilor. De aceea, media a devenit nucleul statisticii și al tuturor științelor care se bazează pe date multiple pentru concluziile lor.

Avantajul mediei se datorează și faptului că este ușor de calculat de computere. Deși valoarea mediană pentru un grup mic de date este destul de ușor de calculat pe cont propriu, este mult mai ușor să scrieți un program de calculator care să găsească valoarea medie. Dacă utilizați Microsoft Excel, probabil știți că funcția mediană nu este la fel de ușor de calculat ca funcția de valoare medie.

Drept urmare, datorită valorii sale științifice mari și ușurinței de utilizare, valoarea medie a devenit principala valoare reprezentativă. Cu toate acestea, această opțiune nu este întotdeauna cea mai bună.

Avantajele valorii medii

În multe cazuri în care dorim să calculăm centrul unei distribuții, mediana este cea mai bună măsură. Acest lucru se datorează faptului că valoarea medie este determinată în mare măsură de măsurătorile extreme.

Mulți analiști cred că utilizarea necugetă a mediei afectează negativ înțelegerea noastră a informațiilor cantitative. Oamenii se uită la medie și cred că este „normal”. Dar, de fapt, poate fi definit printr-un singur termen care iese puternic din seria omogenă.

Imaginați-vă un analist care dorește să cunoască o valoare reprezentativă pentru valoarea a cinci case. Patru case valorează 100.000 de dolari, iar a cincea este de 900.000 de dolari. Media ar fi atunci 200.000 USD, iar mediana ar fi de 100.000 USD. În aceasta, ca și în multe alte cazuri, valoarea mediană oferă o mai bună înțelegere a ceea ce poate fi numit „standard”.

Înțelegând modul în care valorile extreme pot afecta media, valoarea mediană este utilizată pentru a reflecta modificările venitului gospodăriei din SUA.

Mediana este, de asemenea, mai puțin sensibilă la datele „murdare” cu care se ocupă analiștii astăzi. Mulți statisticieni și analiști colectează informații intervievând oameni pe internet. Dacă utilizatorul adaugă accidental un zero suplimentar la răspuns, care transformă 100 în 1000, atunci această eroare va afecta media mult mai mult decât mediana.

Media sau mediana?

Alegerea dintre mediană și medie are implicații de anvergură, de la înțelegerea noastră a efectelor medicamentelor asupra sănătății până la cunoștințele noastre despre bugetul standard al unei familii.

Pe măsură ce colectarea și analiza datelor determină din ce în ce mai mult modul în care înțelegem lumea, la fel și valoarea cantităților pe care le folosim. Într-o lume ideală, analiștii ar folosi atât media, cât și mediana pentru a reprezenta datele.

Dar trăim în condiții de timp și atenție limitate. Din cauza acestor limitări, adesea trebuie să alegem doar una. Și în multe cazuri, valoarea mediană este de preferat.

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane