Medián vzorových údajov. Mediánová funkcia v Exceli na vykonávanie štatistickej analýzy

Spolu s priemernými hodnotami sa počítajú štrukturálne priemery ako štatistické charakteristiky variačných distribučných radov - móda a medián.
Móda(Mo) predstavuje hodnotu študovaného znaku, opakovaný s najvyššou frekvenciou, t.j. režim je hodnota funkcie, ktorá sa vyskytuje najčastejšie.
medián(Ja) je hodnota vlastnosti, ktorá spadá do stredu zoradenej (usporiadanej) populácie, t.j. medián - centrálna hodnota variačného radu.
Hlavnou vlastnosťou mediánu je, že súčet absolútnych odchýlok hodnôt atribútu od mediánu je menší ako od akejkoľvek inej hodnoty ∑|x i - Me|=min.

Určenie režimu a mediánu z nezoskupených údajov

Zvážte určenie módu a mediánu z nezoskupených údajov. Predpokladajme, že pracovné čaty pozostávajúce z 9 osôb majú tieto mzdové kategórie: 4 3 4 5 3 3 6 2 6 . Keďže tento tím má najviac pracovníkov 3. kategórie, táto tarifná kategória bude modálna. Po = 3.
Na určenie mediánu je potrebné zoradiť: 2 3 3 3 4 4 5 6 6 . Centrálny v tejto sérii je pracovník 4. kategórie, preto bude táto kategória mediánom. Ak zoradený rad obsahuje párny počet jednotiek, potom je medián definovaný ako priemer dvoch centrálnych hodnôt.
Ak režim odráža najbežnejší variant hodnoty atribútu, potom medián prakticky plní funkcie priemeru pre heterogénnu populáciu, ktorá sa neriadi normálnym zákonom rozdelenia. Jeho kognitívny význam ilustrujme na nasledujúcom príklade.
Predpokladajme, že potrebujeme charakterizovať priemerný príjem skupiny ľudí čítajúcej 100 ľudí, z ktorých 99 má príjmy v rozmedzí od 100 do 200 USD mesačne a mesačný príjem tých druhých je 50 000 USD (tabuľka 1).
Tabuľka 1 - Mesačné príjmy skúmanej skupiny osôb. Ak použijeme aritmetický priemer, dostaneme priemerný príjem okolo 600 - 700 dolárov, čo má s príjmom hlavnej časti skupiny pramálo spoločného. Medián, v tomto prípade rovný Me = 163 dolárov, nám umožní objektívne opísať úroveň príjmu 99 % tejto skupiny ľudí.
Zvážte definíciu režimu a mediánu podľa zoskupených údajov (distribučné rady).
Predpokladajme, že rozdelenie pracovníkov celého podniku ako celku podľa tarifnej kategórie má nasledujúcu formu (tabuľka 2).
Tabuľka 2 - Rozdelenie pracovníkov podniku podľa tarifnej kategórie

Výpočet módu a mediánu pre diskrétny rad

Výpočet módu a mediánu pre intervalový rad

Výpočet módu a mediánu pre variačný rad

Určenie režimu zo série diskrétnych variácií

Používa sa séria hodnôt funkcií vytvorených skôr, zoradených podľa hodnoty. Ak je veľkosť vzorky nepárna, vezmite strednú hodnotu; ak je veľkosť vzorky párna, berieme aritmetický priemer dvoch centrálnych hodnôt.
Určenie režimu zo série diskrétnych variácií: 5. tarifná kategória má najvyššiu frekvenciu (60 osôb), preto je modálna. Po = 5.
Na určenie strednej hodnoty atribútu sa číslo strednej jednotky série (N Me) zistí pomocou nasledujúceho vzorca: , kde n je objem populácie.
V našom prípade: .
Výsledná zlomková hodnota, ktorá sa vyskytuje vždy pri párnom počte jednotiek obyvateľstva, naznačuje, že presný stred je medzi 95 a 96 pracovníkmi. Je potrebné určiť, do ktorej skupiny patria pracovníci s týmito sériovými číslami. Dá sa to urobiť výpočtom akumulovaných frekvencií. V prvej skupine, kde je len 12 osôb, nie sú žiadni pracovníci s týmito číslami a nie sú ani v druhej skupine (12+48=60). Pracovníci na 95. a 96. mieste sú v tretej skupine (12+48+56=116), preto je mediánom 4. mzdová kategória.

Výpočet módu a mediánu v intervalovom rade

Na rozdiel od diskrétnych variačných sérií si určenie módu a mediánu z intervalových sérií vyžaduje určité výpočty založené na nasledujúcich vzorcoch:
, (5.6)
kde x0- spodná hranica modálneho intervalu (interval s najvyššou frekvenciou sa nazýva modálny);
i je hodnota modálneho intervalu;
fMo je frekvencia modálneho intervalu;
f Po-1 je frekvencia intervalu pred modálom;
f Po +1 je frekvencia intervalu nasledujúceho po modál.
(5.7)
kde x0– dolná hranica intervalu mediánu (medián je prvý interval, ktorého akumulovaná frekvencia presahuje polovicu celkového súčtu frekvencií);
i je hodnota stredného intervalu;
S Me-1- akumulovaný interval predchádzajúci mediánu;
f Ja je frekvencia stredného intervalu.
Aplikáciu týchto vzorcov ilustrujeme pomocou údajov v tabuľke. 3.
Interval s hranicami 60 - 80 v tomto rozdelení bude modálny, pretože má najvyššiu frekvenciu. Pomocou vzorca (5.6) určíme režim:

Na stanovenie stredného intervalu je potrebné určiť akumulovanú frekvenciu každého nasledujúceho intervalu, kým nepresiahne polovicu súčtu akumulovaných frekvencií (v našom prípade 50 %) (tabuľka 5.11).
Zistilo sa, že medián je interval s hranicami 100 - 120 tisíc rubľov. Teraz definujeme medián:

Tabuľka 3 - Rozdelenie obyvateľstva Ruskej federácie podľa úrovne priemerného nominálneho peňažného príjmu na obyvateľa v marci 1994
Skupiny podľa úrovne priemerného mesačného príjmu na obyvateľa, tisíc rubľovPodiel obyvateľstva, %
do 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Viac ako 3007,7
Celkom100,0

Tabuľka 4 - Definícia mediánu intervalu
Aritmetický priemer, režim a medián teda možno použiť ako zovšeobecnenú charakteristiku hodnôt určitého atribútu pre jednotky zoradeného obyvateľstva.
Hlavnou charakteristikou distribučného centra je aritmetický priemer, ktorý sa vyznačuje tým, že všetky odchýlky od neho (kladné aj záporné) sú nulové. Pre medián je typické, že súčet odchýlok od neho v module je minimálny a modus je hodnota vlastnosti, ktorá sa vyskytuje najčastejšie.
Pomer modusu, mediánu a aritmetického priemeru udáva povahu rozloženia znaku v súhrne, umožňuje posúdiť jeho asymetriu. V symetrickom rozdelení sú všetky tri charakteristiky rovnaké. Čím väčší je rozdiel medzi režimom a aritmetickým priemerom, tým je rad asymetrickejší. Pre stredne skreslené série je rozdiel medzi módom a aritmetickým priemerom približne trojnásobkom rozdielu medzi mediánom a priemerom, t.j.
|Po–`x| = 3 |Ja –`x|.

Určenie módu a mediánu grafickou metódou

Režim a medián v intervalovej sérii je možné určiť graficky. Režim je určený z histogramu rozdelenia. Na tento účel sa vyberie najvyšší obdĺžnik, ktorý je v tomto prípade modálny. Potom spojíme pravý vrchol modálneho obdĺžnika s pravým horným rohom predchádzajúceho obdĺžnika. A ľavý vrchol modálneho obdĺžnika je s ľavým horným rohom nasledujúceho obdĺžnika. Z bodu ich priesečníka spustíme kolmicu na os x. Úsečka priesečníka týchto čiar bude spôsob rozloženia (obr. 5.3).


Ryža. 5.3. Grafická definícia módy pomocou histogramu.


Ryža. 5.4. Grafické určenie mediánu kumuláciou
Na určenie mediánu z bodu na stupnici akumulovaných frekvencií (frekvencií) zodpovedajúceho 50% sa nakreslí priamka rovnobežná s osou x k priesečníku s kumuláciou. Potom sa z bodu priesečníka zníži kolmica na os x. Úsečka priesečníka je stred.

Kvartily, decily, percentily

Podobne pri hľadaní mediánu vo variačnom rade distribúcie môžete nájsť hodnotu prvku pre akúkoľvek jednotku zoradeného radu v poradí. Takže napríklad hodnotu funkcie môžete nájsť v jednotkách, ktoré rozdeľujú sériu na štyri rovnaké časti, na 10 alebo 100 častí. Tieto hodnoty sa nazývajú „kvartily“, „decily“, „percentily“.
Kvartily sú hodnotou funkcie, ktorá rozdeľuje populáciu v rozsahu na 4 rovnaké časti.
Rozlišujte medzi dolným kvartilom (Q 1), ktorý oddeľuje ¼ populácie s najnižšími hodnotami atribútu, a horným kvartilom (Q 3), ktorý oddeľuje ¼ časti s najvyššími hodnotami atribútu . To znamená, že 25 % jednotiek populácie bude menej ako Q 1 ; 25 % jednotiek bude uzavretých medzi Q 1 a Q 2 ; 25 % – medzi Q 2 a Q 3 a zvyšných 25 % je lepších ako Q 3. Stredný kvartil Q 2 je medián.
Na výpočet kvartilov pomocou intervalových variačných radov sa používajú tieto vzorce:
, ,
kde x Q 1– dolná hranica intervalu obsahujúceho dolný kvartil (interval je určený akumulovanou frekvenciou, pričom prvá presahuje 25 %);
x Q 3– dolná hranica intervalu obsahujúceho horný kvartil (interval je určený akumulovanou frekvenciou, pričom prvá presahuje 75 %);
i– hodnota intervalu;
S Q 1-1 je kumulatívna frekvencia intervalu predchádzajúceho intervalu obsahujúcemu dolný kvartil;
S Q 3-1 je kumulatívna frekvencia intervalu predchádzajúceho intervalu obsahujúcemu horný kvartil;
f Q 1 je frekvencia intervalu obsahujúceho dolný kvartil;
f Q 3 je frekvencia intervalu obsahujúceho horný kvartil.
Zvážte výpočet dolného a horného kvartilu podľa tabuľky. 5.10. Dolný kvartil je v rozmedzí 60 - 80, ktorého kumulatívna frekvencia je 33,5 %. Horný kvartil leží v rozmedzí 160 - 180 s akumulovanou frekvenciou 75,8 %. S ohľadom na to dostaneme:
,
.
Okrem kvartilov možno decily určiť v radoch variačného rozdelenia - možnosti, ktoré rozdeľujú zoradené variačné série na desať rovnakých častí. Prvý decil (d 1) delí populáciu 1/10 až 9/10, druhý decil (d 1) 2/10 až 8/10 atď.
Vypočítajú sa podľa vzorcov:
, .
Hodnoty funkcií, ktoré rozdeľujú sériu na sto častí, sa nazývajú percentily. Pomery mediánu, kvartilov, decilov a percentilov sú znázornené na obr. 5.5.

Mzdy v rôznych odvetviach hospodárstva, teplota a zrážky v rovnakej oblasti za porovnateľné časové obdobia, výnosy plodín v rôznych geografických regiónoch atď. primeraná hodnota, ako je medián. V štatistike sa široko používa ako pomocná popisná charakteristika distribúcie znaku v jednej populácii. Pozrime sa, ako sa líši od priemeru, a tiež to, čo spôsobilo potrebu používať ho.

Medián v štatistike: definícia a vlastnosti

Predstavte si nasledujúcu situáciu: 10 ľudí pracuje spoločne s riaditeľom vo firme. Bežní zamestnanci dostávajú po 1 000 hrivien a ich vedúci, ktorý je navyše vlastníkom, 10 000 hrivien. Ak vypočítame aritmetický priemer, ukáže sa, že priemerná mzda v tomto podniku je 1900 UAH. Bude toto tvrdenie pravdivé? Alebo ak vezmeme tento príklad, v tej istej nemocničnej izbe je deväť ľudí s teplotou 36,6 °C a jedna osoba s teplotou 41 °C. Aritmetický priemer je v tomto prípade: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. To však neznamená, že všetci prítomní sú chorí. To všetko naznačuje, že samotný priemer často nestačí, a preto sa k nemu pridáva aj medián. V štatistike sa tento ukazovateľ nazýva variant, ktorý sa nachádza presne v strede usporiadaného radu variácií. Ak to vypočítate pre naše príklady, dostanete 1 000 UAH. a 36,6 °С. Inými slovami, medián v štatistike je hodnota, ktorá delí sériu na polovicu tak, že na jej oboch stranách (nahor alebo nadol) sa nachádza rovnaký počet jednotiek danej populácie. Kvôli tejto vlastnosti má tento ukazovateľ niekoľko ďalších názvov: 50. percentil alebo 0,5 kvantil.

Ako nájsť medián v štatistike

Spôsob výpočtu tejto hodnoty do značnej miery závisí od toho, aký typ variačného radu máme: diskrétny alebo intervalový. V prvom prípade je medián v štatistikách celkom jednoduchý. Všetko, čo musíte urobiť, je nájsť súčet frekvencií, vydeliť ich 2 a potom k výsledku pridať ½. Princíp výpočtu by bolo najlepšie vysvetliť na nasledujúcom príklade. Predpokladajme, že máme zoskupené údaje o plodnosti a chceme zistiť, aký je medián.

Číslo rodinnej skupiny podľa počtu detí

Počet rodín

Po vykonaní niekoľkých jednoduchých výpočtov dostaneme, že požadovaný ukazovateľ sa rovná: 195/2 + ½ = možnosť. Aby ste zistili, čo to znamená, mali by ste postupne akumulovať frekvencie, počnúc najmenšími možnosťami. Súčet prvých dvoch riadkov nám teda dáva 30. Je zrejmé, že tu nie je 98 možností. Ak ale k výsledku pripočítame frekvenciu tretej možnosti (70), dostaneme súčet rovný 100. Obsahuje akurát 98. možnosť, čo znamená, že mediánom bude rodina, ktorá má dve deti.

Pokiaľ ide o intervalové série, zvyčajne sa tu používa nasledujúci vzorec:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, v ktorom:

  • X Me - prvá hodnota mediánu intervalu;
  • ∑f je číslo série (súčet jej frekvencií);
  • i Me - hodnota stredného rozsahu;
  • f Me - frekvencia stredného rozsahu;
  • S Me-1 - súčet kumulatívnych frekvencií v rozsahoch predchádzajúcich mediánu.

Opäť je ťažké na to prísť bez príkladu. Predpokladajme, že existujú údaje o hodnote

Plat, tisíc rubľov

Akumulované frekvencie

Aby sme mohli použiť vyššie uvedený vzorec, musíme najprv určiť stredný interval. Ako taký rozsah sa vyberie taký rozsah, ktorého akumulovaná frekvencia presahuje alebo sa rovná polovici celkového súčtu frekvencií. Takže vydelením 510 2 dostaneme, že toto kritérium zodpovedá intervalu s hodnotou platu 250 000 rubľov. až 300 000 rubľov Teraz môžete nahradiť všetky údaje vo vzorci:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 tisíc rubľov.

Dúfame, že náš článok bol užitočný a teraz máte jasnú predstavu o tom, aký je medián v štatistikách a ako by sa mal vypočítať.

Na výpočet mediánu v MS EXCEL existuje špeciálna funkcia MEDIAN() . V tomto článku si zadefinujeme medián a naučíme sa ho vypočítať pre vzorku a pre daný distribučný zákon náhodnej premennej.

Začnime s mediány pre vzorky(t. j. pre pevnú množinu hodnôt).

Ukážkový medián

Medián(medián) je číslo, ktoré je v strede množiny čísel: polovica čísel v množine je väčšia ako medián a polovica čísel je menšia ako medián.

Kalkulovať mediány potrebné ako prvé (hodnoty v vzorkovanie). Napríklad, medián pre vzorku (2; 3; 3; 4 ; 5; 7; 10) bude 4. Keďže. iba v vzorkovanie 7 hodnôt, z toho tri menšie ako 4 (t. j. 2; 3; 3) a tri hodnoty väčšie ako (t. j. 5; 7; 10).

Ak množina obsahuje párny počet čísel, potom sa počíta pre dve čísla v strede množiny. Napríklad, medián pre vzorku (2; 3; 3 ; 6 ; 7; 10) bude 4,5, pretože (3+6)/2 = 4,5.

Na určenie mediány v MS EXCEL existuje rovnomenná funkcia MEDIAN() , anglická verzia MEDIAN().

Medián nemusí nevyhnutne zodpovedať . K zhode dôjde iba vtedy, ak sú hodnoty vo vzorke rozdelené symetricky stredná. Napríklad pre vzorky (1; 2; 3 ; 4 ; 5; 6) medián a priemer sa rovnajú 3,5.

Ak je známy distribučná funkcia F(x) alebo funkcia hustoty pravdepodobnosti p(X), potom medián dá sa zistiť z rovnice:

Napríklad analytickým riešením tejto rovnice pre Lognormálne rozdelenie lnN(μ; σ 2) dostaneme, že medián sa vypočíta podľa vzorca =EXP(μ). Pre μ=0 je medián 1.

Venujte pozornosť bodke Distribučné funkcie, pre ktoré F(x) = 0,5(pozri obrázok vyššie) . Abscisa tohto bodu je 1. Toto je hodnota mediánu, ktorá sa prirodzene zhoduje s predtým vypočítanou hodnotou pomocou vzorca em.

v MS EXCEL medián pre lognormálne rozdelenie LnN(0;1) možno vypočítať pomocou vzorca =LOGNORM.INV(0;5;0;1).

Poznámka: Pripomeňme, že integrál z v celej oblasti nastavenia sa náhodná premenná rovná jednej.

Preto stredová čiara (x=medián) rozdeľuje oblasť pod grafom funkcie hustoty pravdepodobnosti na dve rovnaké časti.

Vzhľadom na to, že výskumník nedisponuje údajmi o objeme predaja v jednotlivých zmenárňach, je výpočet aritmetického priemeru na určenie priemernej ceny za dolár nevhodný.

Medián radu čísel

Je však možné určiť hodnotu atribútu, ktorý sa nazýva medián (Me). Medián

v našom príklade

Stredné číslo: NoMe = ;

Móda

Tabuľka 3.6.

f je súčet frekvencií radu;

S kumulatívne frekvencie

12_

_

S sú akumulované frekvencie.

Na obr. 3.2. Je zobrazený histogram série rozdelenia bánk podľa zisku (podľa tabuľky 3.6.).

x je výška zisku, milióny rubľov,

f je počet bánk.

"MEDIÁN OBJEDNÁVANEJ SÉRIE"

Textová HTML verzia publikácie


Zhrnutie hodiny algebry v 7. ročníku

Téma hodiny: "MEDZIÁN OBJEDNÁVANEJ SÉRIE".

učiteľka pobočky Lake School strednej školy MKOU Burkovskaya Eremenko Tatyana Alekseevna
Ciele:
koncepcia mediánu ako štatistickej charakteristiky usporiadaného radu; vytvoriť schopnosť nájsť medián pre usporiadané série s párnym a nepárnym počtom členov; vytvoriť schopnosť interpretovať hodnoty mediánu v závislosti od praktickej situácie, upevniť koncept aritmetického priemeru množiny čísel. Rozvíjať samostatné pracovné zručnosti. Vybudujte si záujem o matematiku.
Počas vyučovania

ústna práca.
Sú uvedené riadky: 1) 4; jeden; osem; 5; jeden; 2); 9; 3; 0,5; ; 3) 6; 0,2; ; štyri; 6; 7,3; 6. Nájdite: a) najväčšiu a najmenšiu hodnotu každého riadku; b) rozsah každého riadku; c) móda každého radu.
II. Vysvetlenie nového materiálu.
Učebnicová práca. 1. Zvážte problém z odseku 10 učebnice. Čo znamená objednaný riadok? Zdôrazňujem, že pred nájdením mediánu musíte vždy zoradiť rad údajov. 2. Na tabuli sa oboznamujeme s pravidlami hľadania mediánu pre série s párnym a nepárnym počtom členov:
medián

usporiadaný

riadok
čísla
s

zvláštny

číslo

členov

zavolal na číslo napísané v strede a
medián

usporiadaný riadok
čísla
s párnym počtom členov
sa nazýva aritmetický priemer dvoch čísel napísaných v strede.
medián

svojvoľný

riadok
sa nazýva medián 1 3 1 7 5 4 zodpovedajúceho usporiadaného radu.
Všimol som si, že ukazovatele sú aritmetický priemer, režim a medián pre

inak

charakterizovať

údaje,

prijaté

výsledok

pozorovania.

III. Formovanie zručností a schopností.
1. skupina. Cvičenia o aplikácii vzorcov na nájdenie mediánu usporiadaného a neusporiadaného radu. jeden.
№ 186.
Riešenie: a) Počet členov série P= 9; medián ja= 41; b) P= 7, riadok je usporiadaný, ja= 207; v) P= 6, riadok je zoradený, ja== 21; G) P= 8, riadok je usporiadaný, ja== 2,9. Odpoveď: a) 41; b) 207; v 21; d) 2.9. Študenti komentujú, ako sa zistí medián. 2. Nájdite aritmetický priemer a medián radu čísel: a) 27, 29, 23, 31, 21, 34; v) ; 1. b) 56, 58, 64, 66, 62, 74. Riešenie: Na nájdenie mediánu je potrebné zoradiť každý riadok: a) 21, 23, 27, 29, 31, 34. P = 6; X = = 27,5; ja== 28; 20 22 2 + 2, 6 3, 2 2 + 1125; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Ako nájsť medián v štatistike

P = 6; X = 63,3; ja== 63; v) ; jeden. P = 5; X = : 5 = 3: 5 = 0,6; ja = . 3.
№ 188
(ústne). Odpoveď: áno; b) nie; c) nie; d) áno. 4. Vedieť, že objednaná séria obsahuje tčísla, kde t je nepárne číslo, uveďte číslo termínu, ktoré je mediánom ak t sa rovná: a) 5; b) 17; c) 47; d) 201. Odpoveď: a) 3; b) 9; c) 24; d) 101. 2. skupina. Praktické úlohy na nájdenie mediánu zodpovedajúceho radu a interpretáciu výsledku. jeden.
№ 189.
Riešenie: Počet členov radu P= 12. Na nájdenie mediánu je potrebné zoradiť sériu: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Medián série ja= = 176. Mesačná produkcia bola vyššia ako medián pre nasledujúcich členov artelu: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 xx+ + = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rylov; 3) Antonov; 6) Astafiev. Odpoveď: 176. 2.
№ 192.
Riešenie: Usporiadajme dátové rady: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; počet členov radu P= 20. Prejdite prstom A = X max- X min = 42 - 30 = 12. Režim Mo= 32 (táto hodnota sa vyskytuje 6-krát - častejšie ako ostatné). Medián ja= = 35. V tomto prípade rozsah ukazuje najväčšie rozpätie času na spracovanie dielu; režim zobrazuje najtypickejšiu hodnotu doby spracovania; medián je čas spracovania, ktorý polovica sústružníkov neprekročila. Odpoveď: 12; 32; 35.
IV. Zhrnutie lekcie.
Aký je medián radu čísel? – Nemôže sa medián radu čísel zhodovať so žiadnym z čísel v rade? – Aké číslo je medián usporiadanej série obsahujúcej 2 Pčísla? 2 P- 1 číslo? Ako nájsť medián neusporiadanej série?
Domáca úloha:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

V časti základné všeobecné vzdelanie

Režim a medián

Stredné hodnoty zahŕňajú aj režim a medián.

Medián a modus sa často používajú ako priemerná charakteristika v tých populáciách, kde je výpočet priemeru (aritmetický, harmonický atď.) nemožný alebo nepraktický.

Napríklad výberový prieskum 12 komerčných zmenární v meste Omsk umožnil stanoviť rôzne ceny za dolár pri jeho predaji (údaje k 10. októbru 1995 pri výmennom kurze dolára -4493 rubľov) .

Vzhľadom na to, že výskumník nedisponuje údajmi o objeme predaja v jednotlivých zmenárňach, je výpočet aritmetického priemeru na určenie priemernej ceny za dolár nevhodný. Je však možné určiť hodnotu atribútu, ktorý sa nazýva medián (Me). Medián leží v strede zoradeného radu a pretína ho.

Výpočet mediánu pre nezoskupené údaje sa vykonáva takto:

a) usporiadať jednotlivé hodnoty prvku vo vzostupnom poradí:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) určiť poradové číslo mediánu podľa vzorca:

v našom príklade to znamená, že medián sa v tomto prípade nachádza medzi šiestou a siedmou hodnotou funkcie v hodnotenej sérii, pretože séria má párny počet jednotlivých hodnôt. Me sa teda rovná aritmetickému priemeru susedných hodnôt: 4550, 4560.

c) zvážiť postup výpočtu mediánu v prípade nepárneho počtu jednotlivých hodnôt.

Predpokladajme, že pozorujeme nie 12, ale 11 výmenných bodov, potom bude zoradený rad vyzerať takto (12. bod zahodíme):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Stredné číslo: NoMe = ;

na šiestom mieste je = 4560, čo je medián: Ja = 4560. Na oboch stranách je rovnaký počet bodov.

Móda- toto je najčastejšia hodnota atribútu v jednotkách tejto populácie. Zodpovedá určitej charakteristickej hodnote.

V našom prípade možno modálnu cenu za dolár nazvať 4560 rubľov: táto hodnota sa opakuje 4-krát, častejšie ako všetky ostatné.

V praxi sa režim a medián zvyčajne zisťujú zo zoskupených údajov. Výsledkom zoskupenia bola séria rozdelenia bánk podľa výšky prijatého zisku za rok (tabuľka 3.6.).

Tabuľka 3.6.

Zoskupenie bánk podľa výšky prijatého zisku za r

Na určenie mediánu je potrebné vypočítať súčet kumulatívnych frekvencií. Zvyšovanie celkového počtu pokračuje, kým kumulatívny súčet frekvencií nepresiahne polovicu súčtu frekvencií. V našom príklade súčet akumulovaných frekvencií (12) presahuje polovicu všetkých hodnôt (20:2). Táto hodnota zodpovedá intervalu mediánu, ktorý obsahuje medián (5,5 – 6,4). Určme jej hodnotu podľa vzorca:

kde je počiatočná hodnota intervalu obsahujúceho medián;

- hodnota stredného intervalu;

f je súčet frekvencií radu;

je súčet kumulatívnych frekvencií predchádzajúcich strednému intervalu;

je frekvencia stredného intervalu.

50% bánk má teda zisk 6,1 milióna rubľov a 50% bánk - viac ako 6,1 milióna rubľov.

Najvyššej frekvencii zodpovedá aj interval 5,5 - 6,4, t.j. režim musí byť v tomto intervale. Jeho hodnota je určená vzorcom:

kde je počiatočná hodnota intervalu obsahujúceho režim;

- hodnota modálneho intervalu;

je frekvencia modálneho intervalu;

- frekvencia intervalu pred modálom;

- frekvencia intervalu nasledujúceho po spôsobe.

Daný módny vzorec možno použiť vo variačných sériách s rovnakými intervalmi.

V tomto súhrne je teda najbežnejší zisk 6,10 milióna rubľov.

Medián a režim je možné určiť graficky. Medián je určený kumuláciou (obr. 3.1.). Na jej konštrukciu je potrebné vypočítať kumulatívne frekvencie a frekvencie. Kumulatívne frekvencie ukazujú, koľko jednotiek populácie má hodnoty vlastností, ktoré nie sú väčšie ako uvažovaná hodnota, a sú určené postupným sčítaním intervalových frekvencií. Pri konštrukcii kumulatívneho intervalového distribučného radu spodná hranica prvého intervalu zodpovedá frekvencii rovnajúcej sa nule a horná hranica zodpovedá celej frekvencii daného intervalu. Horná hranica druhého intervalu zodpovedá kumulatívnej frekvencii rovnajúcej sa súčtu frekvencií prvých dvoch intervalov atď.

Zostavme kumulatívnu krivku podľa tabuľky. 6 o rozdelení bánk podľa zisku.

S kumulatívne frekvencie

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х zisk

Ryža. 3.1. Kumulatívne rozdelenie bánk podľa zisku:

x je výška zisku, milióny rubľov,

S sú akumulované frekvencie.

Na určenie mediánu sa výška najväčšej ordináty, ktorá zodpovedá celkovej populácii, rozdelí na polovicu. Cez získaný bod sa vedie priamka rovnobežná s osou x, kým sa nepretína s kumuláciou. Úsečka priesečníka je stred.

Režim je určený z histogramu rozdelenia. Histogram je zostavený takto:

na osi x sú vynesené rovnaké segmenty, ktoré na akceptovanej mierke zodpovedajú veľkosti intervalov variačného radu. Obdĺžniky sú postavené na segmentoch, ktorých plochy sú úmerné frekvenciám (alebo frekvenciám) intervalu.

Medián v štatistike

3.2. Je zobrazený histogram série rozdelenia bánk podľa zisku (podľa tabuľky 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х

Ryža. 3.2. Rozdelenie komerčných bánk podľa zisku:

x je výška zisku, milióny rubľov,

f je počet bánk.

Na určenie módy spojíme pravý vrchol modálneho obdĺžnika s pravým horným rohom predchádzajúceho obdĺžnika a ľavý vrchol modálneho obdĺžnika s ľavým horným rohom nasledujúceho obdĺžnika. Abscisa priesečníka týchto čiar bude režim distribúcie.

Medián (štatistika)

Medián (štatistika), v matematickej štatistike číslo, ktoré charakterizuje vzorku (napríklad množinu čísel). Ak sú všetky prvky vo vzorke odlišné, potom medián je číslo vzorky tak, že presne polovica prvkov vo vzorke je väčšia ako on a druhá polovica je menšia ako on. Vo všeobecnejšom prípade možno medián nájsť zoradením prvkov vzorky vo vzostupnom alebo zostupnom poradí a vybratím stredného prvku. Napríklad vzorka (11, 9, 3, 5, 5) sa po zoradení zmení na (3, 5, 5, 9, 11) a jej mediánom je číslo 5. Ak má vzorka párny počet prvkov, medián nemusí byť jednoznačne určený: pre číselné údaje sa najčastejšie používa polovičný súčet dvoch susedných hodnôt (to znamená, že medián súboru (1, 3, 5, 7) sa rovná 4).

Inými slovami, medián v štatistike je hodnota, ktorá delí sériu na polovicu tak, že na jej oboch stranách (nahor alebo nadol) sa nachádza rovnaký počet jednotiek danej populácie.

Úloha číslo 1. Výpočet aritmetického priemeru, modálnej a mediánovej hodnoty

Kvôli tejto vlastnosti má tento ukazovateľ niekoľko ďalších názvov: 50. percentil alebo 0,5 kvantil.

  • Priemerná
  • Medián
  • Móda

Medián (štatistika)

Medián (štatistika), v matematickej štatistike číslo, ktoré charakterizuje vzorku (napríklad množinu čísel). Ak sú všetky prvky vo vzorke odlišné, potom medián je číslo vzorky tak, že presne polovica prvkov vo vzorke je väčšia ako on a druhá polovica je menšia ako on. Vo všeobecnejšom prípade možno medián nájsť zoradením prvkov vzorky vo vzostupnom alebo zostupnom poradí a vybratím stredného prvku. Napríklad vzorka (11, 9, 3, 5, 5) sa po objednaní zmení na (3, 5, 5, 9, 11) a jej medián je číslo 5.

5.5 Režim a medián. Ich výpočet v diskrétnych a intervalových variačných radoch

Ak má vzorka párny počet prvkov, medián nemusí byť jednoznačne určený: pre číselné údaje sa najčastejšie používa polovičný súčet dvoch susedných hodnôt (teda medián súboru (1, 3, 5, 7) sa rovná 4).

Inými slovami, medián v štatistike je hodnota, ktorá delí sériu na polovicu tak, že na jej oboch stranách (nahor alebo nadol) sa nachádza rovnaký počet jednotiek danej populácie. Kvôli tejto vlastnosti má tento ukazovateľ niekoľko ďalších názvov: 50. percentil alebo 0,5 kvantil.

Medián sa používa namiesto aritmetického priemeru, keď sa krajné varianty zoradeného radu (najmenší a najväčší) v porovnaní so zvyškom ukážu ako príliš veľké alebo príliš malé.

Funkcia MEDIAN meria centrálny trend, ktorý je stredom množiny čísel v štatistickom rozdelení. Existujú tri najbežnejšie spôsoby, ako určiť centrálny trend:

  • Priemerná- aritmetický priemer, ktorý sa vypočíta sčítaním množiny čísel a následným vydelením výsledného súčtu ich počtom.
    Napríklad priemer čísel 2, 3, 3, 5, 7 a 10 je 5, čo je výsledok vydelenia ich súčtu, ktorý je 30, ich číslom, ktoré je 6.
  • Medián- číslo, ktoré je uprostred množiny čísel: polovica čísel má hodnoty väčšie ako medián a polovica čísel je menšia.
    Napríklad medián pre čísla 2, 3, 3, 5, 7 a 10 je 4.
  • Móda je číslo, ktoré sa v danej množine čísel vyskytuje najčastejšie.
    Napríklad režim pre čísla 2, 3, 3, 5, 7 a 10 by bol 3.

Hodina algebry v 7. ročníku.

Téma "Medián ako štatistická charakteristika".

Učiteľka Egorova N.I.

Účel lekcie: vytvoriť u študentov pochopenie mediánu množiny čísel a schopnosť vypočítať ho pre jednoduché numerické množiny, upevniť koncept množiny aritmetického priemeru čísel.

Typ lekcie: vysvetlenie nového materiálu.

Počas vyučovania

1. Organizačný moment.

Informujte o téme hodiny a formulujte jej ciele.

2. Aktualizácia doterajších poznatkov.

Otázky pre študentov:

Aký je aritmetický priemer množiny čísel?

Kde sa nachádza aritmetický priemer v rámci množiny čísel?

Čo charakterizuje aritmetický priemer množiny čísel?

Kde sa často používa aritmetický priemer množiny čísel?

Ústne úlohy:

Nájdite aritmetický priemer množiny čísel:

Kontrola domácich úloh.

Učebnica: č.169, č.172.

3. Učenie sa nového materiálu.

V predchádzajúcej lekcii sme sa zoznámili s takou štatistickou charakteristikou, akou je aritmetický priemer množiny čísel. Dnes budeme venovať lekciu ďalšej štatistickej charakteristike – mediánu.

Nielen aritmetický priemer ukazuje, kde na číselnej osi sa nachádzajú čísla ktorejkoľvek množiny a kde je ich stred. Ďalším ukazovateľom je medián.

Medián množiny čísel je číslo, ktoré rozdeľuje množinu na dve rovnaké časti. Namiesto „medián“ by sa dalo povedať „stredný“.

Najprv pomocou príkladov analyzujeme, ako nájsť medián, a potom dáme prísnu definíciu.

Zvážte nasledujúci slovný príklad s použitím projektora

Normu na beh na 100 metrov absolvovalo na konci školského roka 11 žiakov 7. ročníka. Boli zaznamenané tieto výsledky:

Keď chlapci prebehli vzdialenosť, Petya pristúpila k učiteľovi a spýtala sa, aký bol jeho výsledok.

"Najpriemernejší: 16,9 sekundy," odpovedal učiteľ

"Prečo?" Peťa bola prekvapená. - Koniec koncov, aritmetický priemer všetkých výsledkov je asi 18,3 sekundy a ja som bežal o sekundu alebo viac lepšie. A vo všeobecnosti je Katyin výsledok (18,4) oveľa bližšie k priemeru ako môj.“

„Váš výsledok je priemerný, pretože päť ľudí bežalo lepšie ako vy a päť horšie. Takže ste presne uprostred,“ povedal učiteľ.

Napíšte algoritmus na nájdenie mediánu množiny čísel:

Objednajte číselnú sadu (zostavte zoradenú sériu).

Zároveň prečiarkneme „najväčšie“ a „najmenšie“ čísla tejto množiny čísel, kým nezostane jedno alebo dve čísla.

Ak existuje len jedno číslo, potom je to medián.

Ak zostanú dve čísla, potom medián bude aritmetický priemer dvoch zostávajúcich čísel.

Vyzvite študentov, aby samostatne sformulovali definíciu mediánu množiny čísel, potom si prečítali definíciu mediánu v učebnici (s. 40), potom vyriešili č. 186 (a, b), č. 187 (a) z učebnice (s. 41).

komentár:

Upozornite študentov na dôležitú okolnosť: medián je prakticky necitlivý na výrazné odchýlky jednotlivých extrémnych hodnôt množín čísel. V štatistike sa táto vlastnosť nazýva stabilita. Stabilita štatistického ukazovateľa je veľmi dôležitá vlastnosť, poisťuje nás proti náhodným chybám a individuálnym nespoľahlivým údajom.

4. Konsolidácia študovaného materiálu.

Riešenie problémov.

Označte x-aritmetický priemer, Me-medián.

Sada čísel: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Sada čísel: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Súbor čísel: 3,4,11,17,21

b) Súbor čísel: 17,18,19,25,28

c) Sada čísel: 25, 25, 27, 28, 29, 40, 50

Záver: medián množiny čísel pozostávajúcej z nepárneho počtu členov sa rovná číslu v strede.

a) Súbor čísel: 2, 4, 8, 9.

Me = (4+8):2=12:2=6

b) Súbor čísel: 1,3,5,7,8,9.

Me = (5+7):2=12:2=6

Medián množiny čísel obsahujúcich párny počet členov je polovicou súčtu dvoch čísel v strede.

Študent dostal počas štvrťroka nasledujúce známky z algebry:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Nájdite priemerné skóre a medián tohto súboru.

Poďme nájsť priemerné skóre, teda aritmetický priemer:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Nájdite medián tejto množiny čísel:

Zoraďme sadu čísel: 2,4,4,4,5,5,5,5,5,5

Len 10 čísel, aby ste našli medián, musíte vziať dve stredné čísla a nájsť ich polovičný súčet.

Me = (5+5):2 = 5

Otázka pre žiakov: Ak by ste boli učiteľom, akú známku by ste dali tomuto žiakovi za štvrťrok? Odpoveď zdôvodnite.

Prezident spoločnosti dostáva plat 300 000 rubľov. traja jeho zástupcovia dostávajú po 150 000 rubľov, štyridsať zamestnancov - každý po 50 000 rubľov. a plat upratovačky je 10 000 rubľov. Nájdite aritmetický priemer a medián platov v spoločnosti. Ktorú z týchto vlastností je pre prezidenta výhodnejšie použiť na reklamné účely?

x \u003d (300 000 + 3 150 000 + 40 50 000 + 10 000): (1 + 3 + 40 + 1) \u003d 2760000: 45 \u003d 61333,33 (rubľov)

č. 6. Ústne.

A) Koľko čísel je v množine, ak jej mediánom je jej deviaty člen?

B) Koľko čísel je v množine, ak jej medián je aritmetickým priemerom 7. a 8. člena?

C) V súbore siedmich čísel sa najväčšie číslo zvýšilo o 14. Zmení sa tým aritmetický priemer aj medián?

D) Každé z čísel v súbore bolo zvýšené o 3. Čo sa stane s aritmetickým priemerom a mediánom?

Sladkosti v obchode sa predávajú na váhu. Aby zistila, koľko sladkostí obsahuje jeden kilogram, Masha sa rozhodla zistiť hmotnosť jedného cukríka. Odvážila niekoľko cukríkov a získala tieto výsledky:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Obe charakteristiky sú vhodné na odhad hmotnosti jedného cukríka, keďže veľmi sa od seba nelíšia.

Na charakterizáciu štatistických informácií sa teda používa aritmetický priemer a medián. V mnohých prípadoch niektoré charakteristiky nemusia mať žiadny zmysluplný význam (napríklad, ak máme informácie o čase dopravných nehôd, sotva má zmysel hovoriť o aritmetickom priemere týchto údajov).

Domáca úloha: 10. odsek, č. 186 (c, d), č. 190.

5. Výsledky vyučovacej hodiny. Reflexia.

  1. "Štatistický výskum: zber a zoskupovanie štatistických údajov"

    Lekcia

    Témy navrhnuté pre siedmu trieda. TEMATICKÉ PLÁNOVANIE. § jeden. Štatistickévlastnosti. P 1. Aritmetický priemer, rozsah a režim 1h. P 2. Mediánakoštatistickécharakteristický

  2. Vysvetlivka k pracovnému programu vzdelávacieho kurzu "algebra" v 7. ročníku (základná úroveň).

    Pracovný program

    ... položka 10 Mediánakoštatistickécharakteristický 23 str. 9 Aritmetický priemer, rozsah a režim 24 Skúška č. 2 zapnutá tému

  3. Pracovný program. Matematika. 5. ročník p. Kanashi. 2011

    Pracovný program

    ... rovnice. Aritmetický priemer, rozsah a režim. Mediánakoštatistickécharakteristický. Cieľom je systematizovať a zhrnúť informácie o ... a zručnostiach získaných na lekcie podľa témy(dobre algebra 10 trieda). 11 Trieda(4 hodiny týždenne...

  4. Príkaz č. 51 z 30. augusta 2012 Pracovný program algebry 7. ročník

    Pracovný program

    … učebný materiál Mediánakoštatistickécharakteristický Poznať definíciu aritmetického priemeru, rozsahu, režimu a mediányakoštatistickévlastnosti Predné a individuálne...

  5. Pracovný program z matematiky ročník 7 II. stupeň základný stupeň (1)

    Pracovný program

    Ako nájsť medián série

    rovnaké, ako o 6 trieda. Štúdium Témy končí oboznámením žiakov s tým najjednoduchším štatistickévlastnosti: stredná ... M .: Vydavateľstvo "Genzher", 2009. 3. Zhokhov, V.I. Lekciealgebra o 7 trieda: kniha. pre učiteľa / V. I. Zhokhov ...

Ďalšie súvisiace dokumenty..

V roku 1906 veľký vedec a uznávaný eugenik Francis Galton navštívil každoročnú výstavu zvierat a hydiny v západnom Anglicku, kde náhodou vykonal zaujímavý experiment.

Podľa Jamesa Surowetského, autora knihy The Wisdom of the Crowd, na Galton Fair prebiehala súťaž, v ktorej mali ľudia uhádnuť váhu zabitého býka. Ten, kto pomenoval najbližšie k skutočnému číslu, bol vyhlásený za víťaza.

Galton bol známy svojím pohŕdaním intelektuálnymi schopnosťami obyčajných ľudí. Veril, že iba skutoční odborníci budú schopní urobiť presné vyhlásenia o hmotnosti býka. A 787 účastníkov súťaže neboli odborníci.

Vedec sa chystal dokázať neschopnosť davu výpočtom priemerného počtu z odpovedí účastníkov. Aké bolo jeho prekvapenie, keď sa ukázalo, že výsledok, ktorý dostal, takmer presne zodpovedal skutočnej váhe býka!

Priemerná hodnota - neskorý vynález

Samozrejme, presnosť odpovede výskumníka ohromila. No ešte pozoruhodnejší je fakt, že Galtonovi vôbec napadlo použiť priemer.

V dnešnom svete sú priemery a takzvané mediány všade: priemerná teplota v New Yorku v apríli je 52 stupňov Fahrenheita; Stephen Curry má priemer 30 bodov na zápas; Priemerný príjem domácnosti v USA je 51 939 USD/rok.

Myšlienka, že veľa rôznych výsledkov môže byť reprezentovaných jedným číslom, je však celkom nová. Až do 17. storočia sa priemery všeobecne nepoužívali.

Ako vznikol a vyvinul sa koncept priemerov a mediánov? A ako sa jej podarilo stať sa hlavnou meracou technikou v našej dobe?

Prevaha prostriedkov nad mediánmi mala ďalekosiahle dôsledky na naše chápanie informácií. A často to ľudí vyviedlo z omylu.

Stredné a stredné hodnoty

Predstavte si, že rozprávate príbeh o štyroch ľuďoch, ktorí s vami včera večerali v reštaurácii. Jednému z nich by ste dali 20 rokov, ďalšiemu 30, tretiemu 40 a štvrtému 50. Čo by ste vo svojom príbehu povedali o ich veku?

S najväčšou pravdepodobnosťou ich nazvete priemerným vekom.

Priemer sa často používa na sprostredkovanie informácií o niečom, ako aj na opis súboru meraní. Technicky je priemer to, čo matematici nazývajú "aritmetický priemer" - súčet všetkých meraní vydelený počtom meraní.

Hoci sa slovo „priemer“ často používa ako synonymum slova „medián“ (medián), to druhé sa častejšie označuje ako stred niečoho. Toto slovo pochádza z latinského „medianus“, čo znamená „stredný“.

Stredná hodnota v starovekom Grécku

História strednej hodnoty pochádza z učenia starogréckeho matematika Pytagora. Pre Pytagoras a jeho školu mal medián jasnú definíciu a bol veľmi odlišný od toho, ako dnes chápeme priemer. Používal sa iba v matematike, nie pri analýze údajov.

V pytagorejskej škole bola hodnota mediánu priemerné číslo v trojčlennej postupnosti čísel v „rovnakom“ vzťahu k susedným členom. Pomer "rovnaký" môže znamenať rovnakú vzdialenosť. Napríklad číslo 4 v rade 2,4,6. Môže však vyjadrovať aj geometrickú progresiu, napríklad 10 v sekvencii 1,10,100.

Štatistik Churchill Eisenhart vysvetľuje, že v starovekom Grécku sa medián nepoužíval ako zástupca ani náhrada za žiadnu množinu čísel. Jednoducho označoval stred a často sa používal pri matematických dôkazoch.

Eisenhart strávil desať rokov štúdiom priemeru a mediánu. Spočiatku sa snažil nájsť reprezentatívnu funkciu mediánu v raných vedeckých konštrukciách. Namiesto toho však zistil, že väčšina prvých fyzikov a astronómov sa spoliehala na jediné, zručne vykonané merania a nemali metodiku na výber najlepšieho výsledku spomedzi mnohých pozorovaní.

Moderní výskumníci zakladajú svoje závery na zbere veľkého množstva údajov, ako napríklad biológovia študujúci ľudský genóm. Starovekí vedci na druhej strane mohli vykonať niekoľko meraní, no na budovanie svojich teórií si vybrali len to najlepšie.

Ako napísal historik astronómie Otto Neugebauer, „toto je v súlade s vedomou túžbou starovekých ľudí minimalizovať množstvo empirických údajov vo vede, pretože neverili v presnosť priamych pozorovaní“.

Napríklad grécky matematik a astronóm Ptolemaios vypočítal uhlový priemer Mesiaca pomocou metódy pozorovania a teórie pohybu Zeme. Jeho skóre bolo 31:20. Dnes vieme, že priemer Mesiaca sa pohybuje od 29'20 do 34'6 v závislosti od vzdialenosti od Zeme. Ptolemaios použil vo svojich výpočtoch málo údajov, ale mal všetky dôvody domnievať sa, že sú presné.

Eisenhart píše: „Treba mať na pamäti, že vzťah medzi pozorovaním a teóriou v staroveku bol iný ako dnes. Výsledky pozorovaní neboli chápané ako fakty, ktorým by sa mala teória prispôsobiť, ale ako konkrétne prípady, ktoré môžu byť užitočné len ako názorné príklady pravdivosti teórie.

Nakoniec sa vedci obrátia na reprezentatívne merania údajov, ale pôvodne sa v tejto úlohe nepoužívali ani prostriedky, ani mediány. Od staroveku až po súčasnosť sa ako takýto reprezentatívny prostriedok používa iný matematický pojem - polovičný súčet extrémnych hodnôt.

Polovičný súčet extrémnych hodnôt

Nové vedecké nástroje takmer vždy vznikajú z potreby riešiť určitý problém v nejakej disciplíne. Potreba nájsť najlepšiu hodnotu spomedzi mnohých meraní vznikla z potreby presne určiť geografickú polohu.

Intelektuálny gigant Al-Biruni z 11. storočia je známy ako jeden z prvých ľudí, ktorí použili metodológiu reprezentatívnych významov. Al-Biruni napísal, že keď mal k dispozícii veľa meraní a chcel medzi nimi nájsť to najlepšie, použil nasledujúce „pravidlo“: musíte nájsť číslo zodpovedajúce stredu medzi dvoma extrémnymi hodnotami. Pri výpočte polovičného súčtu extrémnych hodnôt sa neberú do úvahy všetky čísla medzi maximálnymi a minimálnymi hodnotami, ale nájde sa iba priemer týchto dvoch čísel.

Al-Biruni aplikoval túto metódu v rôznych oblastiach, vrátane výpočtu zemepisnej dĺžky mesta Ghazni, ktoré sa nachádza na území moderného Afganistanu, ako aj vo svojich štúdiách vlastností kovov.

V posledných storočiach sa však polovičný súčet extrémov používa čoraz menej. V skutočnosti to v modernej vede vôbec nie je relevantné. Stredná hodnota nahradila polovičný súčet.

Prechod na priemery

Začiatkom 19. storočia sa používanie mediánu/priemeru stalo bežnou metódou na nájdenie najpresnejšej reprezentatívnej hodnoty zo skupiny údajov. Friedrich von Gauss, vynikajúci matematik svojej doby, v roku 1809 napísal: „Verilo sa, že ak je určité číslo určené niekoľkými priamymi pozorovaniami uskutočnenými za rovnakých podmienok, potom je najpravdivejšou hodnotou aritmetický priemer. Ak to nie je celkom striktné, tak sa to aspoň blíži realite, a preto sa na to dá vždy spoľahnúť.

Prečo došlo k takému posunu v metodológii?

Na túto otázku je pomerne ťažké odpovedať. Churchill Eisenhart vo svojom výskume naznačuje, že metóda zisťovania aritmetického priemeru mohla pochádzať z oblasti merania magnetickej odchýlky, teda z hľadania rozdielu medzi smerom strelky kompasu smerujúcej na sever a skutočným severom. Toto meranie bolo mimoriadne dôležité počas veku objavov.

Eisenhart zistil, že až do konca 16. storočia väčšina vedcov, ktorí merali magnetickú odchýlku, používala pri výbere najpresnejšieho merania metódu ad hoc (z latinského „toto, pre túto príležitosť, na tento účel“).

V roku 1580 sa však vedec William Borough k problému postavil inak. Urobil osem rôznych meraní vychýlenia a porovnal ich a dospel k záveru, že najpresnejší údaj bol medzi 11 ⅓ a 11 ¼ stupňami. Pravdepodobne vypočítal aritmetický priemer, ktorý bol v tomto rozmedzí. Samotný Borough však svoj prístup otvorene nenazval novou metódou.

Pred rokom 1635 sa vôbec nevyskytli jednoznačné prípady použitia priemernej hodnoty ako reprezentatívneho čísla. Avšak práve vtedy anglický astronóm Henry Gellibrand vykonal dve rôzne merania magnetickej výchylky. Jedna sa robila ráno (11 stupňov) a druhá popoludní (11 stupňov a 32 minút). Pri výpočte najpravdivejšej hodnoty napísal:

"Ak nájdeme aritmetický priemer, môžeme s vysokou pravdepodobnosťou povedať, že výsledok presného merania by mal byť približne 11 stupňov 16 minút."

Je pravdepodobné, že to bolo prvýkrát, čo bol priemer použitý ako najbližší k skutočnosti!

Slovo „priemerný“ sa v angličtine používalo na začiatku 16. storočia na označenie finančných strát v dôsledku škôd, ktoré loď alebo náklad utrpeli počas plavby. Ďalších sto rokov označovalo práve tieto straty, ktoré boli vypočítané ako aritmetický priemer. Napríklad, ak bola loď počas plavby poškodená a posádka musela hodiť cez palubu nejaký tovar, aby ušetrila hmotnosť lode, investori utrpeli finančnú stratu zodpovedajúcu výške ich investície – tieto straty boli vypočítané rovnakým spôsobom ako aritmetický priemer. Postupne sa teda približovali hodnoty priemeru (priemeru) a aritmetického priemeru.

Stredná hodnota

Dnes sa ako hlavný spôsob výberu reprezentatívnej hodnoty súboru meraní používa priemer alebo aritmetický priemer. Ako sa to stalo? Prečo táto rola nebola priradená k strednej hodnote?

Francis Galton bol stredným šampiónom

Pojem "stredná hodnota" (medián) - stredný výraz v rade čísel, ktorý delí tento rad na polovicu - sa objavil približne v rovnakom čase ako aritmetický priemer. V roku 1599 matematik Edward Wright, ktorý sa zaoberal problémom normálnej odchýlky v kompase, prvýkrát navrhol použiť strednú hodnotu.

“... Povedzme, že veľa lukostrelcov strieľa na nejaký cieľ. Cieľ sa následne odstráni. Ako môžete zistiť, kde bol cieľ? Musíte nájsť stred medzi všetkými šípkami. Rovnako medzi súborom výsledkov pozorovaní bude najbližšie k pravde ten v strede.

Medián bol široko používaný v devätnástom storočí a stal sa v tom čase nevyhnutnou súčasťou akejkoľvek analýzy údajov. Používal ho aj Francis Galton, významný analytik devätnásteho storočia. V príbehu o vážení býkov na začiatku tohto článku Galton pôvodne použil medián ako vyjadrenie názoru davu.

Mnoho analytikov vrátane Galtona uprednostňovalo medián, pretože je jednoduchšie vypočítať pre menšie súbory údajov.

Medián však nikdy nebol populárnejší ako priemer. S najväčšou pravdepodobnosťou sa to stalo kvôli špeciálnym štatistickým vlastnostiam, ktoré sú vlastné strednej hodnote, ako aj jej vzťahu k normálnemu rozdeleniu.

Vzťah medzi stredným a normálnym rozdelením

Keď urobíme veľa meraní, výsledky sú, ako hovoria štatistici, „normálne rozdelené“. To znamená, že ak sú tieto údaje zakreslené do grafu, body na ňom budú zobrazovať niečo podobné ako zvon. Ak ich spojíte, získate krivku „zvončeka“. Mnohé štatistiky zodpovedajú normálnemu rozdeleniu, ako je výška ľudí, IQ a najvyššia ročná teplota.

Keď sú údaje normálne rozdelené, priemer bude veľmi blízko najvyššiemu bodu na zvonovej krivke a veľmi veľký počet meraní bude blízko priemeru. Existuje dokonca vzorec, ktorý predpovedá, koľko meraní bude v určitej vzdialenosti od priemeru.

Výpočet priemeru teda poskytuje výskumníkom množstvo ďalších informácií.

Vzťah priemeru k štandardnej odchýlke mu dáva veľkú výhodu, pretože medián takýto vzťah nemá. Toto prepojenie je dôležitou súčasťou analýzy experimentálnych dát a štatistického spracovania informácií. Preto sa priemer stal jadrom štatistiky a všetkých vied, ktoré sa pri svojich záveroch spoliehajú na viaceré údaje.

Výhoda strednej hodnoty spočíva aj v tom, že ju počítač jednoducho vypočíta. Hoci sa stredná hodnota pre malú skupinu údajov dá pomerne ľahko vypočítať sami, je oveľa jednoduchšie napísať počítačový program, ktorý by zistil priemernú hodnotu. Ak používate Microsoft Excel, pravdepodobne viete, že funkciu mediánu nie je také ľahké vypočítať ako funkciu strednej hodnoty.

Výsledkom je, že vďaka svojej veľkej vedeckej hodnote a jednoduchosti použitia sa priemerná hodnota stala hlavnou reprezentatívnou hodnotou. Táto možnosť však nie je vždy najlepšia.

Výhody strednej hodnoty

V mnohých prípadoch, keď chceme vypočítať stred rozdelenia, je najlepším meradlom medián. Je to preto, že priemerná hodnota je do značnej miery určená extrémnymi meraniami.

Mnohí analytici sa domnievajú, že nepremyslené používanie priemeru negatívne ovplyvňuje naše chápanie kvantitatívnych informácií. Ľudia sa pozerajú na priemer a myslia si, že je to „normálne“. V skutočnosti ho však možno definovať jedným pojmom, ktorý výrazne vyčnieva z homogénneho radu.

Predstavte si analytika, ktorý chce vedieť reprezentatívnu hodnotu pre hodnotu piatich domov. Štyri domy majú hodnotu 100 000 dolárov a piaty 900 000 dolárov. Priemer by potom bol 200 000 USD a medián by bol 100 000 USD. V tomto, ako aj v mnohých iných prípadoch, stredná hodnota poskytuje lepšie pochopenie toho, čo možno nazvať „štandardom“.

Keď pochopíme, ako extrémne hodnoty môžu ovplyvniť priemer, stredná hodnota sa používa na vyjadrenie zmien v príjmoch domácností v USA.

Medián je tiež menej citlivý na „špinavé“ dáta, s ktorými sa dnes analytici zaoberajú. Mnoho štatistikov a analytikov zhromažďuje informácie prostredníctvom rozhovorov s ľuďmi na internete. Ak používateľ omylom pridá k odpovedi ďalšiu nulu, ktorá zmení 100 na 1000, potom táto chyba ovplyvní priemer oveľa viac ako medián.

Priemer alebo medián?

Výber medzi mediánom a priemerom má ďalekosiahle dôsledky, od nášho chápania účinkov liekov na zdravie až po naše znalosti o tom, aký je štandardný rozpočet rodiny.

Keďže zhromažďovanie a analýza údajov čoraz viac určuje, ako rozumieme svetu, mení sa aj hodnota veličín, ktoré používame. V ideálnom svete by analytici použili na vykreslenie údajov priemer aj medián.

Ale žijeme v podmienkach obmedzeného času a pozornosti. Kvôli týmto obmedzeniam si často musíme vybrať len jeden. A v mnohých prípadoch je výhodnejšia stredná hodnota.

KATEGÓRIE

POPULÁRNE ČLÁNKY

2022 "kingad.ru" - ultrazvukové vyšetrenie ľudských orgánov