Medijan uzoraka podataka. Funkcija medijana u Excelu za izvođenje statističke analize

Uz prosječne vrijednosti izračunavaju se i strukturni prosjeci kao statističke karakteristike varijacijskih serija distribucija - moda I medijan.
Moda(Mo) predstavlja vrijednost karakteristike koja se proučava, koja se ponavlja s najvećom učestalošću, tj. način – vrijednost karakteristike koja se najčešće pojavljuje.
Medijan(Me) je vrijednost atributa koja se nalazi u sredini rangirane (poređane) populacije, tj. medijan je središnja vrijednost niza varijacija.
Glavno svojstvo medijana je da je zbroj apsolutnih odstupanja vrijednosti atributa od medijana manji nego od bilo koje druge vrijednosti ∑|x i - Me|=min.

Određivanje modusa i medijana iz negrupiranih podataka

Razmotrimo određivanje moda i medijana iz negrupiranih podataka. Pretpostavimo da radni tim od 9 ljudi ima sljedeće tarifne kategorije: 4 3 4 5 3 3 6 2 6. Budući da ova brigada ima najviše radnika 3. kategorije, ovaj će tarifni razred biti modalni. Mo = 3.
Za određivanje medijana potrebno je izvršiti rangiranje: 2 3 3 3 4 4 5 6 6 . Središnji radnik u ovoj seriji je radnik 4. kategorije, stoga će ova kategorija biti medijan. Ako rangirani niz uključuje paran broj jedinica, tada se medijan definira kao prosjek dviju središnjih vrijednosti.
Ako način odražava najčešću varijantu vrijednosti atributa, tada medijan praktički obavlja funkcije prosjeka za heterogenu populaciju koja ne poštuje normalni zakon distribucije. Ilustrirajmo njegov kognitivni značaj sljedećim primjerom.
Recimo da trebamo okarakterizirati prosječni prihod grupe ljudi koja se sastoji od 100 ljudi, od kojih 99 ima prihode u rasponu od 100 do 200 dolara mjesečno, a mjesečni prihod potonjih je 50 000 dolara (tablica 1).
Tablica 1 - Mjesečni prihodi proučavane skupine ljudi. Ako koristimo aritmetički prosjek, dobivamo prosječni prihod od otprilike 600 - 700 dolara, što nema mnogo zajedničkog s primanjima glavnog dijela grupe. Medijan, koji je u ovom slučaju jednak Me = 163 dolara, omogućit će nam da damo objektivan opis razine prihoda 99% ove skupine ljudi.
Razmotrimo određivanje modusa i medijana korištenjem grupiranih podataka (serija distribucije).
Pretpostavimo da raspodjela radnika cjelokupnog poduzeća prema tarifnom razredu ima sljedeći oblik (tablica 2).
Tablica 2 - Raspodjela radnika poduzeća po tarifnim kategorijama

Izračun mode i medijana za diskretnu seriju

Izračun moda i medijana za intervalne serije

Izračun modusa i medijana za niz varijacija

Određivanje moda iz niza diskretnih varijacija

Koristi se prethodno konstruirana serija vrijednosti atributa, poredana po vrijednosti. Ako je veličina uzorka neparna, uzimamo središnju vrijednost; ako je veličina uzorka parna, uzimamo aritmetičku sredinu dviju središnjih vrijednosti.
Određivanje moda iz niza diskretnih varijacija: 5. tarifni razred ima najveću frekvenciju (60 osoba), dakle, on je modalan. Mo = 5.
Da bi se odredila vrijednost medijana obilježja, broj jedinice medijana niza (N Me) nalazi se pomoću sljedeće formule: , gdje je n volumen populacije.
U našem slučaju: .
Dobivena frakcijska vrijednost, koja se uvijek pojavljuje kada je broj jedinica u populaciji paran, pokazuje da se točna središnja točka nalazi između 95 i 96 radnika. Potrebno je utvrditi kojoj skupini pripadaju radnici s ovim rednim brojevima. To se može učiniti izračunavanjem akumuliranih frekvencija. Radnika s tim brojem nema u prvoj skupini, gdje je samo 12 osoba, au drugoj skupini (12+48=60) nema niti jednog radnika. 95. i 96. radnik su u trećoj skupini (12+48+56=116), dakle, medijan je 4. tarifni razred.

Izračunavanje moda i medijana u intervalnim serijama

Za razliku od diskretnih varijacijskih serija, određivanje modusa i medijana iz intervalnih serija zahtijeva određene izračune temeljene na sljedećim formulama:
, (5.6)
Gdje x 0– donja granica modalnog intervala (interval s najvećom frekvencijom naziva se modalni);
ja– vrijednost modalnog intervala;
f Mo– učestalost modalnog intervala;
f Mo -1– učestalost intervala koji prethodi modalnom;
f Mo +1– učestalost intervala koji slijedi nakon modalnog.
(5.7)
Gdje x 0– donja granica intervala medijana (medijan je prvi interval čija akumulirana frekvencija prelazi polovicu ukupnog zbroja frekvencija);
ja– vrijednost srednjeg intervala;
Ja sam -1– akumulirani interval koji prethodi medijanu;
f ja– učestalost srednjeg intervala.
Ilustrirajmo primjenu ovih formula pomoću podataka u tablici. 3.
Interval s granicama 60 – 80 u ovoj distribuciji bit će modalan, jer ima najveću frekvenciju. Pomoću formule (5.6) definiramo modus:

Za određivanje srednjeg intervala potrebno je odrediti akumuliranu frekvenciju svakog sljedećeg intervala dok ne prijeđe polovicu zbroja akumuliranih frekvencija (u našem slučaju 50%) (tablica 5.11).
Utvrđeno je da je medijan interval s granicama od 100 - 120 tisuća rubalja. Odredimo sada medijan:

Tablica 3 - Distribucija stanovništva Ruske Federacije prema razini prosječnog nominalnog novčanog dohotka po glavi stanovnika u ožujku 1994.
Grupe prema razini prosječnog mjesečnog dohotka po glavi stanovnika, tisuća rubalja.Udio stanovništva, %
do 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Preko 3007,7
Ukupno100,0

Tablica 4 - Određivanje srednjeg intervala
Dakle, aritmetička sredina, mod i medijan mogu se koristiti kao generalizirana karakteristika vrijednosti određenog atributa za jedinice rangirane populacije.
Glavna karakteristika distribucijskog centra je aritmetička sredina, koju karakterizira činjenica da sva odstupanja od nje (pozitivna i negativna) zbrojeno daju nuli. Medijan karakterizira činjenica da je zbroj odstupanja od njega u modulu minimalan, a mod je vrijednost atributa koja se najčešće pojavljuje.
Omjer moda, medijana i aritmetičke sredine ukazuje na prirodu distribucije karakteristike u agregatu i omogućuje procjenu njegove asimetrije. U simetričnim raspodjelama sve tri karakteristike se podudaraju. Što je veća razlika između modusa i aritmetičke sredine, serija je asimetričnija. Za umjereno asimetrične serije, razlika između moda i aritmetičke sredine je približno tri puta veća od razlike između medijana i sredine, tj.
|Mo –`x| = 3 |Me –`x|.

Određivanje moda i medijana grafičkom metodom

Mod i medijan u nizu intervala mogu se odrediti grafički. Mod je određen histogramom distribucije. Da biste to učinili, odaberite najviši pravokutnik, koji je u ovom slučaju modalan. Zatim povezujemo desni vrh modalnog pravokutnika s gornjim desnim kutom prethodnog pravokutnika. I lijevi vrh modalnog pravokutnika - s gornjim lijevim kutom sljedećeg pravokutnika. S točke njihova sjecišta spuštamo okomicu na os apscise. Apscisa sjecišta ovih linija bit će način distribucije (sl. 5.3).


Riža. 5.3. Grafičko određivanje moda pomoću histograma.


Riža. 5.4. Grafičko određivanje medijana kumulatom
Za određivanje medijana od točke na ljestvici akumuliranih frekvencija (učestalosti) koja odgovara 50%, povlači se ravna linija paralelna s osi apscisa dok se ne siječe s kumulatom. Zatim se iz sjecišta spušta okomica na x-os. Apscisa sjecišta je medijan.

Kvartili, decili, percentili

Slično, pronalaženjem medijana u nizu varijacija distribucije, možete pronaći vrijednost atributa za bilo koju jedinicu rangiranog niza. Tako, na primjer, možete pronaći vrijednost atributa za jedinice koje dijele niz na četiri jednaka dijela, na 10 ili 100 dijelova. Te se vrijednosti nazivaju "kvartili", "decili", "percentili".
Kvartili predstavljaju vrijednost značajke koja dijeli rangiranu populaciju na 4 jednaka dijela.
Postoji donji kvartil (Q 1), koji odvaja ¼ populacije s najnižim vrijednostima atributa, i gornji kvartil (Q 3), koji odvaja ¼ dijela s najvišim vrijednostima atributa. To znači da će 25% jedinica u populaciji biti manje vrijednosti Q 1 ; 25% jedinica bit će sadržano između Q 1 i Q 2 ; 25% je između Q 2 i Q 3, a preostalih 25% prelazi Q 3. Srednji kvartil Q2 je medijan.
Za izračun kvartila pomoću niza intervalnih varijacija koriste se sljedeće formule:
, ,
Gdje x Q 1– donja granica intervala koji sadrži donji kvartil (interval je određen akumuliranom frekvencijom, pri čemu prva prelazi 25%);
x Q 3– donja granica intervala koji sadrži gornji kvartil (interval je određen akumuliranom frekvencijom, prva prelazi 75%);
ja– veličina intervala;
S P 1-1– akumulirana frekvencija intervala koji prethodi intervalu koji sadrži donji kvartil;
S P 3-1– akumulirana frekvencija intervala koji prethodi intervalu koji sadrži gornji kvartil;
f Q 1– učestalost intervala koji sadrži donji kvartil;
f Q 3– frekvencija intervala koji sadrži gornji kvartil.
Razmotrimo izračun donjeg i gornjeg kvartila prema podacima u tablici. 5.10. Donji kvartil je u rasponu 60 – 80, čija je kumulativna učestalost 33,5%. Gornji kvartil nalazi se u rasponu 160 – 180 s akumuliranom učestalošću od 75,8%. Uzimajući ovo u obzir dobivamo:
,
.
Osim kvartila, decili se mogu odrediti u rasponima varijacija distribucije – opcijama koje rangirane varijacijske nizove dijele na deset jednakih dijelova. Prvi decil (d 1) dijeli stanovništvo u omjeru od 1/10 do 9/10, drugi decil (d 1) - u omjeru od 2/10 do 8/10, itd.
Izračunavaju se pomoću formula:
, .
Karakteristične vrijednosti koje dijele niz na sto dijelova nazivaju se percentili. Omjeri medijana, kvartila, decila i percentila prikazani su na slici. 5.5.

Plaće u različitim sektorima gospodarstva, temperatura i količina padalina na istom teritoriju u usporedivim vremenskim razdobljima, prinosi usjeva uzgojenih u različitim geografskim regijama itd. Međutim, prosjek nipošto nije jedini generalizirajući pokazatelj - u nekim slučajevima za točniju procjenu prikladna vrijednost je medijan. U statistici se široko koristi kao pomoćna deskriptivna karakteristika distribucije neke karakteristike u određenoj populaciji. Razmotrimo kako se razlikuje od prosječnog, a također i zašto ga je potrebno koristiti.

Medijan u statistici: definicija i svojstva

Zamislimo sljedeću situaciju: u poduzeću radi 10 ljudi zajedno s direktorom. Obični radnici dobivaju 1.000 UAH, a njihov menadžer, koji je ujedno i vlasnik, prima 10.000 UAH. Ako izračunamo aritmetički prosjek, ispada da je prosječna plaća u ovom poduzeću 1900 UAH. Hoće li ova izjava biti istinita? Ili uzmimo ovaj primjer: na istom bolničkom odjelu nalazi se devet osoba s temperaturom 36,6 °C i jedna osoba s temperaturom 41 °C. Aritmetička sredina u ovom slučaju jednaka je: (36,6*9+41)/10 = 37,04 °C. Ali to ne znači da su svi prisutni bolesni. Sve to upućuje na to da sam prosjek često nije dovoljan, te se zbog toga uz njega koristi i medijan. U statistici se ovaj indikator naziva opcija koja se nalazi točno u sredini uređenog niza varijacija. Ako to izračunamo za naše primjere, dobivamo 1000 UAH, respektivno. i 36,6 °C. Drugim riječima, medijan u statistici je vrijednost koja dijeli niz napola na takav način da s obje njegove strane (dolje ili gore) postoji isti broj jedinica u određenoj populaciji. Zbog ovog svojstva ovaj pokazatelj ima još nekoliko naziva: 50. percentil ili 0,5 kvantil.

Kako pronaći medijan u statistici

Metoda za izračunavanje ove vrijednosti uvelike ovisi o vrsti serije varijacija koju imamo: diskretnoj ili intervalnoj. U prvom slučaju, medijan se vrlo jednostavno nalazi u statistici. Sve što trebate učiniti je pronaći zbroj frekvencija, podijeliti ga s 2 i zatim rezultatu dodati ½. Princip izračuna najbolje bi bilo objasniti na sljedećem primjeru. Recimo da smo grupirali podatke o plodnosti i želimo saznati koliki je medijan.

Broj obiteljske grupe prema broju djece

Broj obitelji

Nakon nekoliko jednostavnih izračuna, nalazimo da je traženi pokazatelj: 195/2 + ½ = opcija. Da biste saznali što to znači, trebali biste sekvencijalno akumulirati frekvencije, počevši od najmanjih opcija. Dakle, zbroj prva dva retka daje nam 30. Jasno je da ovdje nema 98 opcija. Ali ako rezultatu dodate frekvenciju treće opcije (70), dobit ćete zbroj jednak 100. Sadrži točno 98. opciju, što znači da će medijan biti obitelj koja ima dvoje djece.

Što se tiče intervalne serije, obično se koristi sljedeća formula:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me, u kojem:

  • X Me - prva vrijednost srednjeg intervala;
  • ∑f - broj serije (zbroj njezinih frekvencija);
  • i Me - vrijednost srednjeg raspona;
  • f Me - frekvencija srednjeg raspona;
  • S Me-1 je zbroj kumulativnih frekvencija u rasponima koji prethode medijanu.

Opet, prilično je teško razumjeti bez primjera. Pretpostavimo da postoje podaci o vrijednosti

Plaća, tisuća rubalja.

Akumulirane frekvencije

Da bismo upotrijebili gornju formulu, prvo moramo odrediti srednji interval. Kao takav raspon odaberite onaj čija akumulirana frekvencija prelazi polovicu ukupnog zbroja frekvencija ili mu je jednaka. Dakle, dijeljenjem 510 s 2, nalazimo da ovaj kriterij odgovara intervalu s vrijednošću plaće od 250.000 rubalja. do 300.000 rub. Sada možete zamijeniti sve podatke u formulu:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me = 250 + 50 * (510/2 - 170) / 115 = 286,96 tisuća rubalja.

Nadamo se da je naš članak bio koristan i da sada jasno razumijete što je medijan u statistici i kako ga treba izračunati.

Za izračun medijana u MS EXCEL-u postoji posebna funkcija MEDIAN(). U ovom ćemo članku definirati medijan i naučiti kako ga izračunati za uzorak i za zadani zakon distribucije slučajne varijable.

Počnimo s medijani Za uzorci(tj. za fiksni skup vrijednosti).

Medijan uzorka

Medijan(medijan) je broj koji je sredina skupa brojeva: polovica brojeva u skupu je veća od medijan, a pola brojeva je manje od medijan.

Izračunati medijani prvo potrebno (vrijednosti u uzorak). Na primjer, medijan za uzorak (2; 3; 3; 4 ; 5; 7; 10) bit će 4. Jer upravo unutra uzorak 7 vrijednosti, od kojih su tri manje od 4 (tj. 2; 3; 3), a tri vrijednosti su veće (tj. 5; 7; 10).

Ako skup sadrži paran broj brojeva, tada se izračunava za dva broja u sredini skupa. Na primjer, medijan za uzorak (2; 3; 3 ; 6 ; 7; 10) bit će 4,5, jer (3+6)/2=4,5.

Za određivanje medijani u MS EXCEL-u postoji istoimena funkcija MEDIAN(), engleska verzija MEDIAN().

Medijan ne mora se nužno poklapati s . Do podudaranja dolazi samo ako su vrijednosti u uzorku raspoređene simetrično u odnosu na prosjek. Na primjer, za uzorci (1; 2; 3 ; 4 ; 5; 6) medijan I prosjek jednako 3,5.

Ako je poznato Funkcija distribucije F(x) ili funkcija gustoće vjerojatnosti str(X), To medijan može se pronaći iz jednadžbe:

Na primjer, analitički riješivši ovu jednadžbu za lognormalnu distribuciju lnN(μ; σ 2), dobivamo da medijan izračunato pomoću formule =EXP(μ). Kada je μ=0, medijan je 1.

Obratite pozornost na točku Funkcije raspodjele, za koji F(x)=0,5(vidi sliku gore) . Apscisa ove točke jednaka je 1. Ovo je vrijednost medijana, koja se prirodno poklapa s prethodno izračunatom vrijednošću pomoću formule em.

U MS EXCEL-u medijan Za lognormalna distribucija LnN(0;1) može se izračunati pomoću formule =LOGNORM.REV(0,5;0;1).

Bilješka: Podsjetimo se da je integral od preko cijele domene zadavanja slučajne varijable jednaka je jedan.

Stoga središnja linija (x=medijan) dijeli područje ispod grafikona funkcije gustoće vjerojatnosti na dva jednaka dijela.

Zbog činjenice da istraživač nema podatke o obujmu prodaje u svakoj mjenjačnici, izračunavanje aritmetičkog prosjeka za određivanje prosječne cijene dolara je nepraktično.

Medijan niza brojeva

Međutim, moguće je odrediti vrijednost atributa koja se naziva medijan (Me). Medijan

u našem primjeru

Medijan broja: NoMe = ;

Moda

Tablica 3.6.

f— zbroj učestalosti niza;

S kumulativne frekvencije

12_

_

S—akumulirane frekvencije.

Na sl. 3.2. Prikazan je histogram raspodjele banaka prema profitnoj marži (prema tablici 3.6.).

x - iznos dobiti, milijun rubalja,

f je broj banaka.

"MEDIJAN UREĐENOG NIZA"

Tekstualna HTML verzija publikacije


Bilješke za lekcije iz algebre u 7. razredu

Tema lekcije: “MEDIJAN UREDJENOG NIZA.”

učiteljica škole Ozyornaya, podružnica srednje škole MCOU Burkovskaya Eremenko Tatyana Alekseevna
Ciljevi:
pojam medijana kao statističke karakteristike uređenog niza; razviti sposobnost pronalaženja medijana za uređene nizove s parnim i neparnim brojem članova; razviti sposobnost tumačenja vrijednosti medijana ovisno o praktičnoj situaciji, učvrstiti pojam aritmetičke sredine skupa brojeva. Razvijati vještine samostalnog rada. Razviti interes za matematiku.
Tijekom nastave

Usmeni rad.
Zadani su redovi: 1) 4; 1; 8; 5; 1; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7.3; 6. Pronađite: a) najveću i najmanju vrijednost svake serije; b) opseg svakog retka; c) način svakog reda.
II. Objašnjenje novog gradiva.
Rad prema udžbeniku. 1. Razmotrimo zadatak iz 10. odlomka udžbenika. Što znači naručena serija? Želio bih naglasiti da prije pronalaženja medijana uvijek morate poredati niz podataka. 2. Na ploči se upoznajemo s pravilima za pronalaženje medijana za serije s parnim i neparnim brojem članova:
Medijan

uredno

red
brojevima
S

neparan

broj

članova

je broj napisan u sredini, i
medijan

naručene serije
brojevima
s parnim brojem članova
naziva se aritmetička sredina dvaju brojeva zapisanih u sredini.
Medijan

proizvoljan

red
naziva se medijan 1 3 1 7 5 4 odgovarajućeg uređenog niza.
Napominjem da su pokazatelji aritmetička sredina, modus i medijan prema

različito

karakterizirati

podaci,

primljeno

proizlaziti

zapažanja.

III. Formiranje vještina i sposobnosti.
1. skupina. Vježbe primjene formula za određivanje medijana uređenog i neuređenog niza. 1.
№ 186.
Riješenje: a) Broj članova niza P= 9; medijan Meh= 41; b) P= 7, red je poredan, Meh= 207; V) P= 6, red je poredan, Meh= = 21; G) P= 8, red je poredan, Meh= = 2.9. Odgovor: a) 41; b) 207; na 21; d) 2.9. Učenici komentiraju kako pronaći medijan. 2. Odredi aritmetičku sredinu i medijan niza brojeva: a) 27, 29, 23, 31, 21, 34; V) ; 1. b) 56, 58, 64, 66, 62, 74. Riješenje: Da bismo pronašli medijan, potrebno je poredati svaki red: a) 21, 23, 27, 29, 31, 34. P = 6; x = = 27,5; Meh= = 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Kako pronaći medijan u statistici

P = 6; x = 63,3; Meh= = 63; V) ; 1. P = 5; x = : 5 = 3: 5 = 0,6; Meh = . 3.
№ 188
(oralno). Odgovor: da; b) ne; c) ne; d) da. 4. Znajući da uređeni niz sadrži T brojevi, gdje T– neparan broj, označava broj člana koji je medijan if T jednak je: a) 5; b) 17; c) 47; d) 201. Odgovor: a) 3; b) 9; c) 24; d) 101. 2. skupina. Praktični zadaci nalaženja medijana pripadnog niza i tumačenje dobivenog rezultata. 1.
№ 189.
Riješenje: Broj članova serije P= 12. Da bismo pronašli medijan, niz mora biti poredan: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Medijan niza Meh= = 176. Mjesečna proizvodnja bila je veća od medijana za sljedeće članove artela: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125 ; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 22 xx+ + = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rilov; 3) Antonov; 6) Astafjev. Odgovor: 176. 2.
№ 192.
Riješenje: Razvrstajmo nizove podataka: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; broj članova serije P= 20. Zamah A = x max – x min = 42 – 30 = 12. Moda Mo= 32 (ova se vrijednost pojavljuje 6 puta - češće od ostalih). Medijan Meh= = 35. U ovom slučaju raspon pokazuje najveću varijaciju u vremenu obrade dijela; način rada prikazuje najtipičniju vrijednost vremena obrade; medijan – vrijeme obrade koje nije prekoračila polovica tokara. Odgovor: 12; 32; 35.
IV. Sažetak lekcije.
– Kako se zove medijan niza brojeva? – Može li se medijan niza brojeva ne podudarati ni s jednim brojem u nizu? – Koji je broj medijan uređenog niza koji sadrži 2 P brojevi? 2 P– 1 brojevi? – Kako pronaći medijan neuređenog niza?
Domaća zadaća:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

Na odjeljak osnovno opće obrazovanje

Mod i medijan

Prosječne vrijednosti također uključuju mod i medijan.

Medijan i mod se često koriste kao prosječna karakteristika u onim populacijama gdje je izračunavanje prosjeka (aritmetičkog, harmonijskog, itd.) nemoguće ili nepraktično.

Na primjer, istraživanje uzorka 12 komercijalnih mjenjačnica u Omsku omogućilo je bilježenje različitih cijena dolara pri prodaji (podaci od 10. listopada 1995. po tečaju dolara -4493 rublja).

Zbog činjenice da istraživač nema podatke o obujmu prodaje u svakoj mjenjačnici, izračunavanje aritmetičkog prosjeka za određivanje prosječne cijene dolara je nepraktično. Međutim, moguće je odrediti vrijednost atributa koja se naziva medijan (Me). Medijan leži u sredini rangiranog reda i dijeli ga na pola.

Izračun medijana za negrupirane podatke je sljedeći:

a) rasporedite pojedinačne vrijednosti obilježja uzlaznim redoslijedom:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) odredite redni broj medijana pomoću formule:

u našem primjeru to znači da se medijan u ovom slučaju nalazi između šeste i sedme vrijednosti atributa u rangiranoj seriji, budući da serija ima paran broj pojedinačnih vrijednosti. Dakle, Me je jednako aritmetičkoj sredini susjednih vrijednosti: 4550, 4560.

c) razmotriti postupak izračunavanja medijana u slučaju neparnog broja pojedinačnih vrijednosti.

Recimo da promatramo ne 12, nego 11 točaka mjenjačnice, tada će rangirani niz izgledati ovako (odbaciti 12. točku):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Medijan broja: NoMe = ;

na šestom mjestu je = 4560, što je medijan: Me = 4560. S obje njegove strane nalazi se isti broj točaka.

Moda— ovo je najčešća vrijednost obilježja među jedinicama dane populacije. Odgovara određenoj vrijednosti atributa.

U našem slučaju, modalna cijena po dolaru može se nazvati 4560 rubalja: ova vrijednost se ponavlja 4 puta, češće od svih ostalih.

U praksi se mod i medijan obično nalaze pomoću grupiranih podataka. Kao rezultat grupiranja dobiven je niz raspodjela banaka prema visini ostvarene dobiti za godinu (tablica 3.6.).

Tablica 3.6.

Grupiranje banaka prema visini ostvarene dobiti za godinu

Da biste odredili medijan, trebate izračunati zbroj kumulativnih frekvencija. Ukupno povećanje se nastavlja sve dok kumulativni zbroj frekvencija ne prijeđe polovinu zbroja frekvencija. U našem primjeru zbroj akumuliranih frekvencija (12) premašuje polovicu svih vrijednosti (20:2). Ova vrijednost odgovara srednjem intervalu koji sadrži medijan (5,5 - 6,4). Odredimo njegovu vrijednost pomoću formule:

gdje je početna vrijednost intervala koji sadrži medijan;

— vrijednost srednjeg intervala;

f— zbroj učestalosti niza;

— zbroj kumulativnih frekvencija koje prethode srednjem intervalu;

— učestalost srednjeg intervala.

Tako 50% banaka ima dobit od 6,1 milijun rubalja, a 50% banaka ima dobit veću od 6,1 milijun rubalja.

Najveća frekvencija također odgovara intervalu 5,5 - 6,4, tj. režim mora biti u ovom intervalu. Njegovu vrijednost određujemo pomoću formule:

gdje je početna vrijednost intervala koji sadrži mod;

— vrijednost modalnog intervala;

— učestalost modalnog intervala;

— učestalost intervala koji prethodi modalnom;

— učestalost intervala koji slijedi nakon modalnog.

Navedena formula moda može se koristiti u varijacijskim serijama s jednakim intervalima.

Stoga je u ovoj populaciji najčešća veličina dobiti 6,10 milijuna rubalja.

Medijan i mod mogu se odrediti grafički. Medijan je određen kumulatom (sl. 3.1.). Za njegovu konstrukciju potrebno je izračunati kumulativne frekvencije i frekvencije. Kumulativne frekvencije pokazuju koliko jedinica populacije ima vrijednosti atributa koje nisu veće od vrijednosti koja se razmatra, a određene su sekvencijalnim zbrajanjem intervalnih frekvencija. Pri konstruiranju serije kumulativne intervalne distribucije, donja granica prvog intervala odgovara frekvenciji jednakoj nuli, a gornja granica odgovara cijeloj frekvenciji danog intervala. Gornja granica drugog intervala odgovara kumulativnoj frekvenciji koja je jednaka zbroju frekvencija prva dva intervala, itd.

Konstruirajmo kumulativnu krivulju prema podacima u tablici. 6 o raspodjeli banaka prema profitnoj marži.

S kumulativne frekvencije

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X dobit

Riža. 3.1. Kumulacije niza distribucije banaka prema profitnoj marži:

x - iznos dobiti, milijun rubalja,

S—akumulirane frekvencije.

Za određivanje medijana, visina najveće ordinate, koja odgovara ukupnoj veličini populacije, dijeli se na pola. Kroz dobivenu točku povuče se ravna linija, paralelna s osi apscisa, dok se ne siječe s kumulatom. Apscisa sjecišta je medijan.

Mod je određen histogramom distribucije. Histogram je izgrađen ovako:

Na apscisnoj osi iscrtavaju se jednaki segmenti koji u prihvaćenom mjerilu odgovaraju veličini intervala varijacijskog niza. Na segmentima su konstruirani pravokutnici čije su površine proporcionalne frekvencijama (ili frekvencijama) intervala.

Medijan u statistici

3.2. Prikazan je histogram raspodjele banaka prema profitnoj marži (prema tablici 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X

Riža. 3.2. Raspodjela poslovnih banaka prema profitnoj marži:

x - iznos dobiti, milijun rubalja,

f je broj banaka.

Da bismo odredili način, povezujemo desni vrh modalnog pravokutnika s gornjim desnim kutom prethodnog pravokutnika, a lijevi vrh modalnog pravokutnika s gornjim lijevim kutom sljedećeg pravokutnika. Apscisa sjecišta ovih linija bit će način distribucije.

Medijan (statistika)

Medijan (statistika), u matematičkoj statistici, broj koji karakterizira uzorak (na primjer, skup brojeva). Ako su svi elementi uzorka različiti, tada je medijan broj uzorka takav da je točno polovica elemenata uzorka veća od njega, a druga polovica manja od njega. Općenitije, medijan se može pronaći poredanjem elemenata uzorka uzlaznim ili silaznim redoslijedom i uzimanjem srednjeg elementa. Na primjer, uzorak (11, 9, 3, 5, 5) se nakon sređivanja pretvara u (3, 5, 5, 9, 11) i medijan mu je broj 5. Ako uzorak ima paran broj elemenata, medijan možda nije jedinstveno određen: za numeričke podatke najčešće se koristi poluzbroj dviju susjednih vrijednosti (odnosno, medijan skupa (1, 3, 5, 7) uzima se jednak 4).

Drugim riječima, medijan u statistici je vrijednost koja dijeli niz napola na takav način da s obje njegove strane (dolje ili gore) postoji isti broj jedinica u određenoj populaciji.

Zadatak br. 1. Izračunavanje aritmetičke sredine, modalnih i medijanskih vrijednosti

Zbog ovog svojstva ovaj pokazatelj ima još nekoliko naziva: 50. percentil ili 0,5 kvantil.

  • Prosječna vrijednost
  • Medijan
  • Moda

Medijan (statistika)

Medijan (statistika), u matematičkoj statistici, broj koji karakterizira uzorak (na primjer, skup brojeva). Ako su svi elementi uzorka različiti, tada je medijan broj uzorka takav da je točno polovica elemenata uzorka veća od njega, a druga polovica manja od njega. Općenitije, medijan se može pronaći poredanjem elemenata uzorka uzlaznim ili silaznim redoslijedom i uzimanjem srednjeg elementa. Na primjer, uzorak (11, 9, 3, 5, 5) nakon sređivanja pretvara se u (3, 5, 5, 9, 11), a njegov medijan je broj 5.

5.5 Mod i medijan. Njihov proračun u diskretnim i intervalnim varijacijskim serijama

Ako u uzorku postoji paran broj elemenata, medijan možda neće biti jednoznačno određen: za numeričke podatke najčešće se koristi poluzbroj dviju susjednih vrijednosti (odnosno medijan skupa (1, 3, 5, 7) uzima se jednako 4).

Drugim riječima, medijan u statistici je vrijednost koja dijeli niz napola na takav način da s obje njegove strane (dolje ili gore) postoji isti broj jedinica u određenoj populaciji. Zbog ovog svojstva ovaj pokazatelj ima još nekoliko naziva: 50. percentil ili 0,5 kvantil.

Medijan se koristi umjesto aritmetičke sredine kada se ekstremne opcije rangirane serije (najmanje i najveće) u usporedbi s ostalim pokažu pretjerano velikima ili pretjerano malima.

Funkcija MEDIAN mjeri središnju tendenciju, koja je središte skupa brojeva u statističkoj distribuciji. Postoje tri najčešća načina za određivanje središnje tendencije:

  • Prosječna vrijednost- aritmetička sredina, koja se izračunava zbrajanjem skupa brojeva, a zatim dijeljenjem rezultirajućeg zbroja njihovim brojem.
    Na primjer, prosjek brojeva 2, 3, 3, 5, 7 i 10 je 5, što je rezultat dijeljenja njihovog zbroja od 30 njihovim zbrojem od 6.
  • Medijan- broj koji je sredina skupa brojeva: polovica brojeva ima vrijednosti veće od medijana, a polovica brojeva ima vrijednosti manje.
    Na primjer, medijan za brojeve 2, 3, 3, 5, 7 i 10 bio bi 4.
  • Moda- broj koji se najčešće nalazi u određenom skupu brojeva.
    Na primjer, način za brojeve 2, 3, 3, 5, 7 i 10 bio bi 3.

Sat algebre u 7. razredu.

Tema: “Medijan kao statistička karakteristika.”

Učiteljica Egorova N.I.

Svrha lekcije: formirati kod učenika ideju o medijanu skupa brojeva i sposobnost izračunavanja za jednostavne numeričke skupove, učvrstiti koncept aritmetičke sredine skupa brojeva.

Vrsta lekcije: objašnjenje novog gradiva.

Tijekom nastave

1. Organizacijski trenutak.

Obavijestite temu lekcije i formulirajte njezine ciljeve.

2. Obnavljanje prethodnog znanja.

Pitanja za studente:

Što je aritmetička sredina skupa brojeva?

Gdje se unutar skupa brojeva nalazi aritmetička sredina?

Što karakterizira aritmetičku sredinu skupa brojeva?

Gdje se često koristi aritmetička sredina skupa brojeva?

Usmeni zadaci:

Pronađite aritmetičku sredinu skupa brojeva:

Provjera domaće zadaće.

Udžbenik: br.169,br.172.

3. Učenje novog gradiva.

U prethodnoj lekciji upoznali smo se s takvom statističkom karakteristikom kao što je aritmetička sredina skupa brojeva. Danas ćemo lekciju posvetiti još jednoj statističkoj karakteristici - medijanu.

Ne pokazuje samo aritmetička sredina gdje se na brojevnoj crti nalaze brojevi bilo kojeg skupa i gdje im je središte. Drugi pokazatelj je medijan.

Medijan skupa brojeva je broj koji skup dijeli na dva jednaka dijela. Umjesto "medijana", mogli biste reći "sredina".

Prvo, pogledajmo primjere kako pronaći medijan, a zatim dajmo strogu definiciju.

Razmotrite sljedeći usmeni primjer pomoću projektora

Na kraju školske godine 11 učenika 7. razreda položilo je normu trčanja na 100 metara. Zabilježeni su sljedeći rezultati:

Nakon što su dečki istrčali udaljenost, Petya je prišao učitelju i pitao koji je njegov rezultat.

"Najprosječniji rezultat: 16,9 sekundi", odgovorio je učitelj.

"Zašto?" – iznenadila se Petya. – Uostalom, aritmetički prosjek svih rezultata je otprilike 18,3 sekunde, a ja sam trčao više od sekunde bolje. I općenito, Katjin rezultat (18,4) mnogo je bliži prosjeku od mog.”

“Vaš rezultat je prosječan, jer je pet ljudi trčalo bolje od vas, a pet - lošije. Odnosno, vi ste točno u sredini”, rekla je učiteljica.

Zapišite algoritam za pronalaženje medijana skupa brojeva:

Rasporedite skup brojeva (napravite rangirani niz).

Istovremeno prekrižite "najveći" i "najmanji" broj danog niza brojeva dok ne preostane jedan ili dva broja.

Ako je ostao jedan broj, onda je to medijan.

Ako su ostala dva broja, tada će medijan biti aritmetička sredina dva preostala broja.

Pozvati učenike da samostalno formuliraju definiciju medijana skupa brojeva, zatim pročitati definiciju medijana u udžbeniku (str. 40), zatim riješiti br. 186 (a, b), br. 187 (a) od udžbenik (str. 41).

Komentar:

Skrenuti učenicima pozornost na važnu činjenicu: medijan je praktički neosjetljiv na značajna odstupanja pojedinačnih ekstremnih vrijednosti skupova brojeva. U statistici se ovo svojstvo naziva stabilnost. Stabilnost statističkog pokazatelja vrlo je važno svojstvo, ono nas osigurava od slučajnih pogrešaka i pojedinačnih nepouzdanih podataka.

4. Konsolidacija proučenog materijala.

Rješavanje problema.

Označimo x-aritmetičku sredinu, Me-medijan.

Skup brojeva: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Skup brojeva: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Skup brojeva: 3,4,11,17,21

b) Skup brojeva: 17,18,19,25,28

c) Niz brojeva: 25, 25, 27, 28, 29, 40, 50

Zaključak: medijan skupa brojeva koji se sastoji od neparnog broja članova jednak je broju u sredini.

a) Skup brojeva: 2, 4, 8, 9.

Ja = (4+8):2=12:2=6

b) Skup brojeva: 1,3,5,7,8,9.

Ja = (5+7):2=12:2=6

Medijan skupa brojeva koji sadrži paran broj članova jednak je polovici zbroja dvaju brojeva u sredini.

Učenik je tijekom tromjesečja dobio sljedeće ocjene iz algebre:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Pronađite srednju vrijednost i medijan ovog skupa.

Nađimo prosječnu ocjenu, odnosno aritmetičku sredinu:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Nađimo medijan ovog skupa brojeva:

Poredajmo skup brojeva: 2,4,4,4,5,5,5,5,5,5

Postoji samo 10 brojeva, da biste pronašli medijan morate uzeti dva srednja broja i pronaći njihov poluzbroj.

Ja = (5+5):2 = 5

Pitanje za učenike: Da ste učitelj, koju biste ocjenu dali ovom učeniku za četvrtinu? Obrazložite svoj odgovor.

Predsjednik tvrtke prima plaću od 300.000 rubalja. tri njegova zamjenika dobivaju po 150.000 rubalja, četrdeset zaposlenika - po 50.000 rubalja. a plaća čistačice je 10 000 rubalja. Nađite aritmetičku sredinu i medijan plaća u poduzeću. Koje je od ovih obilježja predsjedniku korisnije koristiti u reklamne svrhe?

x = (300000+3·150000+40·50000+10000):(1+3+40+1) = 2760000:45=61333,33 (rub.)

broj 6. Usmeno.

A) Koliko brojeva ima skup ako je deveti član njegov medijan?

B) Koliko brojeva ima skup ako je njegova sredina aritmetička sredina 7. i 8. člana?

C) U skupu od sedam brojeva, najveći broj je povećan za 14. Hoće li to promijeniti aritmetičku sredinu i medijan?

D) Svaki od brojeva u skupu se poveća za 3. Što se događa s aritmetičkom sredinom i medijanom?

Slatkiši u trgovini prodaju se na težinu. Kako bi saznala koliko se bombona nalazi u jednom kilogramu, Masha je odlučila pronaći težinu jednog bombona. Izvagala je nekoliko bombona i dobila sljedeće rezultate:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Obje su karakteristike prikladne za procjenu težine jednog slatkiša, jer međusobno se jako ne razlikuju.

Dakle, za karakterizaciju statističkih informacija koriste se aritmetička sredina i medijan. U mnogim slučajevima jedna od karakteristika možda nema smisleno značenje (na primjer, imajući informacije o vremenu prometnih nesreća, teško da ima smisla govoriti o aritmetičkoj sredini tih podataka).

Domaća zadaća: odlomak 10, br. 186 (c, d), br. 190.

5. Sažetak lekcije. Odraz.

  1. "Statističko istraživanje: prikupljanje i grupiranje statističkih podataka"

    Lekcija

    teme, predložen za sedmu razreda. TEMATSKO PLANIRANJE. § 1. Statističkikarakteristike. P 1. Aritmetička sredina, raspon i način 1h. P 2. MedijanKakostatističkikarakteristika

  2. Program rada nastavnog plana i programa algebre u 7. razredu (osnovna razina) obrazloženje

    Radni program

    ... klauzula 10 MedijanKakostatističkikarakteristika 23 str.9 Aritmetička sredina, raspon i modus 24 Ispit br. 2 na tema

  3. Radni program. Matematika. 5. razred str. Kanashi. 2011

    Radni program

    ... jednadžbe. Aritmetička sredina, raspon i modus. MedijanKakostatističkikarakteristika. Cilj je sistematizirati i sažeti podatke o ... i vještina stečenih na lekcije prema temama(dobro algebra 10 razreda). 11 Klasa(4 sata tjedno...

  4. Naredba broj 51 od 30.08.2012. Program rada za algebru 7.r.

    Radni program

    ... obrazovni materijal MedijanKakostatističkikarakteristika Znati definiciju aritmetičke sredine, raspona, modusa i medijaniKakostatističkikarakteristike Frontalni i pojedinačni...

  5. Program rada iz matematike 7. razred ii nivo osnovni nivo (1)

    Radni program

    Kako pronaći medijan niza

    isti, Kako u 6 razreda. studiranje teme završava upoznavanjem učenika s najjednostavnijim statističkikarakteristike: prosječno... M.: Izdavačka kuća "Genzher", 2009. 3. Zhokhov, V.I. Lekcijealgebra u 7 razreda: knjiga za učitelja / V. I. Zhokhov ...

Ostali slični dokumenti...

Godine 1906. veliki znanstvenik i slavni eugeničar Francis Galton posjetio je godišnju izložbu dostignuća u uzgoju stoke i peradi u zapadnoj Engleskoj, gdje je sasvim slučajno izveo zanimljiv eksperiment.

Kako primjećuje James Surowiecki, autor knjige The Wisdom of Crowds, Galton je na sajmu bio zainteresiran za jedno natjecanje u kojem su ljudi morali pogoditi težinu zaklanog vola. Pobjednikom je proglašen onaj koji je naveo broj najbliži pravom.

Galton je bio poznat po svom preziru prema intelektualnim sposobnostima običnih ljudi. Vjerovao je da će samo pravi stručnjaci moći dati točne izjave o težini vola. A 787 sudionika natjecanja nisu bili stručnjaci.

Znanstvenik je namjeravao dokazati nesposobnost gomile izračunavanjem prosjeka odgovora sudionika. Zamislite njegovo iznenađenje kada se pokazalo da rezultat koji je dobio gotovo točno odgovara stvarnoj težini bika!

Prosjek - kasni izum

Naravno, točnost odgovora zadivila je istraživača. Ali još je značajnija činjenica da je Galton uopće razmišljao o korištenju prosječne vrijednosti.

U današnjem svijetu prosjeci i takozvani medijani nalaze se na svakom koraku: prosječna temperatura u New Yorku u travnju je 52 stupnja Fahrenheita; Stephen Curry u prosjeku postiže 30 poena po utakmici; Prosječni obiteljski prihod u SAD-u je 51.939 dolara godišnje.

Međutim, ideja da se mnogo različitih ishoda može predstaviti jednim brojem prilično je nova. Sve do 17. stoljeća prosjeci se uopće nisu koristili.

Kako se pojavio i razvio koncept prosjeka i medijana? I kako je uspio postati glavna mjerna tehnika u našem vremenu?

Dominacija prosjeka nad medijanima imala je dalekosežne posljedice za naše razumijevanje informacija. I često je to ljude odvelo na krivi put.

Srednje i srednje vrijednosti

Zamislite da pričate priču o četvero ljudi koji su sinoć večerali s vama u restoranu. Jednom biste dali 20 godina, drugom 30, trećem 40, a četvrtom 50. Što biste u svojoj priči rekli o njihovoj dobi?

Najvjerojatnije biste ih nazvali srednjim godinama.

Prosjek se često koristi za prenošenje informacija o nečemu, kao i za opisivanje niza mjerenja. Tehnički, prosjek je ono što matematičari nazivaju "aritmetička sredina" - zbroj svih mjerenja podijeljen s brojem mjerenja.

Iako se riječ prosjek često koristi kao sinonim za medijan, potonji se češće odnosi na sredinu nečega. Ova riječ dolazi od latinskog "medianus", što znači "srednji".

Srednja vrijednost u staroj Grčkoj

Povijest srednje vrijednosti počinje s učenjima starogrčkog matematičara Pitagore. Za Pitagoru i njegovu školu, medijan je imao jasnu definiciju i bio je vrlo različit od onoga kako danas razumijemo srednju vrijednost. Koristio se samo u matematici, a ne u analizi podataka.

U pitagorejskoj školi srednja vrijednost bila je srednji broj u tročlanom nizu brojeva, u “jednakom” odnosu na susjedne članove. "Ravnopravan" odnos mogao bi značiti jednaku udaljenost. Na primjer, broj 4 u nizu 2,4,6. Međutim, također može izraziti geometrijsku progresiju, kao što je 10 u nizu 1,10,100.

Statističar Churchill Eisenhart objašnjava da se u staroj Grčkoj srednja vrijednost nije koristila za predstavljanje ili zamjenu bilo kojeg skupa brojeva. Jednostavno je označavao sredinu i često se koristio u matematičkim dokazima.

Eisenhart je proveo deset godina proučavajući srednju vrijednost i medijan. U početku je pokušao pronaći reprezentativnu funkciju medijana u ranim znanstvenim konstrukcijama. Umjesto toga, međutim, otkrio je da se većina ranih fizičara i astronoma oslanjala na pojedinačna, pametna mjerenja i da im je nedostajala metodologija za odabir najboljeg rezultata među mnogim promatranjima.

Suvremeni istraživači temelje svoje zaključke na prikupljanju velikih količina podataka, poput biologa koji proučavaju ljudski genom. Drevni znanstvenici mogli su izvršiti nekoliko mjerenja, ali su za izgradnju svojih teorija odabrali samo najbolje.

Kao što je napisao povjesničar astronomije Otto Neugebauer, "Ovo je u skladu sa svjesnom željom drevnih ljudi da minimiziraju količinu empirijskih podataka u znanosti, jer nisu vjerovali u točnost izravnih opažanja."

Na primjer, grčki matematičar i astronom Ptolemej izračunao je kutni promjer Mjeseca koristeći metode promatranja i teoriju gibanja Zemlje. Njegov rezultat bio je 31'20. Danas znamo da se promjer Mjeseca kreće od 29'20 do 34'6 ovisno o njegovoj udaljenosti od Zemlje. Ptolemej je koristio malo podataka u svojim izračunima, ali je imao sve razloge vjerovati da su točni.

Eisenhart piše: “Mora se imati na umu da je odnos između promatranja i teorije bio drugačiji u antici nego danas. Rezultati promatranja nisu shvaćeni kao činjenice kojima se teorija treba prilagoditi, već kao specifični slučajevi koji mogu biti korisni samo kao ilustrativni primjeri istinitosti teorije."

Znanstvenici će se na kraju okrenuti reprezentativnim mjerama podataka, ali u početku u ovoj ulozi nisu korišteni ni srednje vrijednosti ni medijani. Od antike do danas kao takvo reprezentativno sredstvo korišten je još jedan matematički koncept: poluzbroj ekstremnih vrijednosti.

Poluzbroj ekstremnih vrijednosti

Novi znanstveni alati gotovo uvijek proizlaze iz potrebe da se riješi određeni problem u nekoj disciplini. Potreba za pronalaženjem najbolje vrijednosti među višestrukim mjerenjima proizašla je iz potrebe za točnim određivanjem zemljopisnog položaja.

Intelektualni div iz 11. stoljeća Al-Biruni poznat je kao jedan od prvih ljudi koji su koristili metodologiju reprezentativnih značenja. Al-Biruni je napisao da kada je imao mnogo mjerenja na raspolaganju i želio pronaći najbolje među njima, upotrijebio je sljedeće "pravilo": trebate pronaći broj koji odgovara sredini između dvije krajnje vrijednosti. Pri izračunavanju poluzbroja ekstremnih vrijednosti ne uzimaju se u obzir svi brojevi između maksimalne i minimalne vrijednosti, već se nalazi prosjek samo ta dva broja.

Al-Biruni je koristio ovu metodu u raznim poljima, uključujući izračunavanje geografske dužine grada Ghazni, koji se nalazi u modernom Afganistanu, kao iu svojim proučavanjima svojstava metala.

Međutim, u posljednjih nekoliko stoljeća, poluzbroj ekstremnih vrijednosti se koristi sve manje i manje. Zapravo, u modernoj znanosti to uopće nije relevantno. Poluzbroj je zamijenjen srednjom vrijednošću.

Prelazak na prosjeke

Do početka 19. stoljeća korištenje medijana/srednje vrijednosti postalo je uobičajena metoda pronalaženja najtočnije reprezentativne vrijednosti iz skupine podataka. Friedrich von Gauss, izvanredni matematičar svog vremena, napisao je 1809. godine: “Vjerovalo se da je aritmetička sredina najistinitija vrijednost ako je određeni broj određen nekoliko izravnih opažanja pod istim uvjetima. Ako nije sasvim strog, onda je barem blizak stvarnosti, pa se na njega uvijek možete osloniti.”

Zašto je došlo do ove promjene metodologije?

Na ovo pitanje je prilično teško odgovoriti. U svojoj studiji Churchill Eisenhart sugerira da je metoda pronalaženja aritmetičke sredine mogla potjecati iz područja mjerenja magnetske devijacije, odnosno iz pronalaženja razlike između smjera igle kompasa koja pokazuje sjever i stvarnog sjevera. Ova je dimenzija bila izuzetno važna u doba velikih geografskih otkrića.

Eisenhart je otkrio da je do kraja 16. stoljeća većina znanstvenika koji su mjerili magnetski otklon koristili ad hoc metodu (latinski za "za ovu priliku, za ovu svrhu") u odabiru najtočnijeg mjerenja.

No 1580. godine znanstvenik William Borough problemu je pristupio drugačije. Napravio je osam različitih mjerenja otklona i, nakon što ih je usporedio, zaključio da je najtočnija vrijednost između 11 ⅓ i 11 ¼ stupnjeva. Vjerojatno je izračunao aritmetičku sredinu koja je bila u tom rasponu. No, sam Boro svoj pristup nije otvoreno nazvao novom metodom.

Prije 1635. nije bilo jasnih slučajeva korištenja prosjeka kao reprezentativnog broja. Međutim, tada je engleski astronom Henry Gellibrand izvršio dva različita mjerenja magnetskog otklona. Jedan od njih snimljen je ujutro (11 stupnjeva), a drugi poslijepodne (11 stupnjeva i 32 minute). Izračunavajući najpraviju vrijednost, napisao je:

"Ako pronađemo aritmetičku sredinu, možemo s velikom vjerojatnošću reći da bi rezultat točnog mjerenja trebao biti oko 11 stupnjeva i 16 minuta."

Vjerojatno je to bio prvi put da je prosječna vrijednost korištena kao najbliža stvarnoj vrijednosti!

Riječ "prosječan" korištena je u engleskom jeziku početkom 16. stoljeća za označavanje financijskog gubitka od štete koju je pretrpio brod ili njegov teret tijekom putovanja. U sljedećih stotinjak godina označavala je upravo te gubitke, koji su izračunati kao aritmetički prosjek. Na primjer, ako je brod oštećen tijekom putovanja i posada je morala baciti neku robu u more kako bi održala težinu broda, investitori bi pretrpjeli financijske gubitke jednake iznosu njihovog ulaganja - ti su gubici izračunati na isti način kao aritmetički prosjek. Tako su se postupno približavale vrijednosti prosjeka i aritmetičke sredine.

Srednja vrijednost

Danas se srednja ili aritmetička sredina koristi kao primarna metoda za odabir reprezentativne vrijednosti za skup mjerenja. Kako se to dogodilo? Zašto ova uloga nije dana srednjoj vrijednosti?

Francis Galton bio je prvak medijana

Izraz "medijan" - srednji član u nizu brojeva koji niz dijeli na pola - pojavio se otprilike u isto vrijeme kad i aritmetička sredina. Godine 1599. matematičar Edward Wright, radeći na problemu normalnog odstupanja kompasa, prvi je predložio korištenje srednje vrijednosti.

“...Pretpostavimo da mnogo strijelaca puca u određenu metu. Cilj se naknadno uklanja. Kako možete saznati gdje je bila meta? Morate pronaći srednje mjesto između svih strelica. Isto tako, među mnogim rezultatima promatranja, onaj u sredini bit će najbliži istini.”

Medijan se naširoko koristio u devetnaestom stoljeću, postavši neophodan dio svake analize podataka u to vrijeme. Koristio ga je i Francis Galton, izvanredni analitičar devetnaestog stoljeća. U priči o vaganju vola ispričanoj na početku ovog članka, Galton je u početku koristio srednju vrijednost kao predstavljanje mišljenja gomile.

Mnogi analitičari, uključujući Galton, preferirali su medijan jer ga je lakše izračunati za male skupove podataka.

Međutim, medijan nikada nije bio popularniji od prosjeka. To je najvjerojatnije zbog posebnih statističkih svojstava svojstvenih srednjoj vrijednosti, kao i njezinog odnosa s normalnom distribucijom.

Odnos između srednje i normalne distribucije

Kada provodimo mnogo mjerenja, rezultati su, kako statističari kažu, "normalno raspoređeni". To znači da će, ako se ti podaci iscrtaju na grafikonu, točke na njemu prikazivati ​​nešto slično zvonu. Ako ih spojite, dobit ćete krivulju "u obliku zvona". Mnoge statistike odgovaraju normalnoj distribuciji, kao što su visina ljudi, inteligencija i najviša godišnja temperatura.

Kada su podaci normalno distribuirani, srednja vrijednost će biti vrlo blizu najviše točke na zvonastoj krivulji, a vrlo velik broj mjerenja bit će blizu srednje vrijednosti. Postoji čak i formula koja predviđa koliko će mjerenja biti daleko od prosjeka.

Dakle, izračun prosjeka daje istraživačima mnogo dodatnih informacija.

Veza između prosječne vrijednosti i standardne devijacije daje veliku prednost, jer vrijednost medijana nema takvu vezu. Ova veza je važan dio analize eksperimentalnih podataka i statističke obrade informacija. Zbog toga je prosjek postao srž statistike i svih znanosti koje se pri donošenju zaključaka oslanjaju na više podataka.

Prednost prosjeka je i zbog činjenice da se lako izračunava pomoću računala. Iako je srednju vrijednost za malu skupinu podataka prilično lako sami izračunati, mnogo je lakše napisati računalni program koji pronalazi srednju vrijednost. Ako koristite Microsoft Excel, vjerojatno znate da funkciju medijana nije tako lako izračunati kao funkciju srednje vrijednosti.

Time je prosječna vrijednost zbog svog velikog znanstvenog značaja i jednostavnosti korištenja postala glavna reprezentativna vrijednost. Međutim, ova opcija nije uvijek najbolja.

Prednosti srednje vrijednosti

U mnogim slučajevima kada želimo izračunati središnju vrijednost distribucije, srednja vrijednost je bolja mjera. To je zato što je prosječna vrijednost uvelike određena ekstremnim rezultatima mjerenja.

Mnogi analitičari vjeruju da nepromišljeno korištenje prosjeka negativno utječe na naše razumijevanje kvantitativnih informacija. Ljudi gledaju prosjek i misle da je to "norma". No, zapravo, može ga odrediti bilo koji član koji se snažno izdvaja iz homogenog niza.

Zamislite analitičara koji želi znati reprezentativnu vrijednost za pet kuća. Četiri kuće vrijede 100.000 dolara, a peta 900.000 dolara. Srednja vrijednost bi stoga bila 200.000 USD, a medijan 100.000 USD. U ovom, kao iu mnogim drugim slučajevima, srednja vrijednost pruža bolje razumijevanje onoga što se može nazvati "standardom".

Prepoznajući koliko ekstremne vrijednosti mogu utjecati na prosjek, medijan se koristi za odražavanje promjena u prihodu kućanstva u SAD-u.

Medijani su također manje osjetljivi na prljave podatke s kojima analitičari danas barataju. Mnogi statističari i analitičari prikupljaju informacije anketiranjem ljudi na internetu. Ako korisnik slučajno doda dodatnu nulu odgovoru, što pretvara 100 u 1000, tada će ta pogreška imati mnogo jači utjecaj na srednju vrijednost nego na medijan.

Prosjek ili medijan?

Izbor između srednje vrijednosti i srednje vrijednosti ima dalekosežne posljedice, od našeg razumijevanja učinaka lijekova na zdravlje do našeg znanja o tome kakav bi trebao biti standardni kućni budžet.

Kako prikupljanje i analiza podataka sve više oblikuje način na koji razumijemo svijet, tako raste i vrijednost količina koje koristimo. U idealnom svijetu, analitičari bi koristili i srednju vrijednost i medijan da grafički izraze podatke.

Ali živimo u uvjetima ograničenog vremena i pažnje. Zbog tih ograničenja često moramo odabrati samo jednu stvar. U mnogim slučajevima, srednja vrijednost je poželjnija.

KATEGORIJE

POPULARNI ČLANCI

2023 “kingad.ru” - ultrazvučni pregled ljudskih organa