A mintaadatok mediánja. Medián függvény az Excelben statisztikai elemzés elvégzéséhez

Az átlagértékekkel együtt a strukturális átlagokat is számítjuk a variációs eloszlási sorozat statisztikai jellemzőiként - divatés középső.
Divat(Mo) a vizsgált jellemző értékét jelenti, a legnagyobb gyakorisággal ismételve, azaz. mód a leggyakrabban előforduló jellemző értéke.
középső(Me) annak a jellemzőnek az értéke, amely a rangsorolt ​​(rendezett) sokaság közepére esik, azaz. medián - a variációs sorozat központi értéke.
A medián fő tulajdonsága, hogy az attribútumértékek mediántól való abszolút eltéréseinek összege kisebb, mint bármely más értéktől ∑|x i - Me|=min.

Módus és medián meghatározása nem csoportosított adatokból

Fontolgat mód és medián meghatározása csoportosítatlan adatokból. Tegyük fel, hogy a 9 fős munkacsoportok a következő bérkategóriákkal rendelkeznek: 4 3 4 5 3 3 6 2 6 . Mivel ebben a csapatban van a legtöbb 3. kategória dolgozója, ez a tarifakategória modális lesz. Mo = 3.
A medián meghatározásához rangsorolni kell: 2 3 3 3 4 4 5 6 6 . Ebben a sorozatban a 4. kategória dolgozója a központi, ezért ez a kategória lesz a medián. Ha a rangsorolt ​​sorozat páros számú egységet tartalmaz, akkor a mediánt a két központi érték átlagaként definiáljuk.
Ha a módusz az attribútumérték legáltalánosabb változatát tükrözi, akkor a medián gyakorlatilag egy átlag függvényét tölti be egy heterogén populációra, amely nem engedelmeskedik a normál eloszlási törvénynek. Illusztráljuk kognitív jelentőségét a következő példával.
Tegyük fel, hogy jellemeznünk kell egy 100 főt számláló embercsoport átlagjövedelmét, amelyből 99 fő jövedelme a 100 és 200 dollár közötti havi tartományba esik, utóbbiak havi jövedelme pedig 50 000 dollár (1. táblázat).
1. táblázat - A vizsgált embercsoport havi jövedelmei. Ha a számtani átlagot használjuk, akkor körülbelül 600-700 dolláros átlagjövedelmet kapunk, aminek kevés köze van a csoport nagy részének jövedelméhez. A medián, amely ebben az esetben egyenlő Me = 163 dollárral, lehetővé teszi számunkra, hogy objektív leírást adjunk az emberek 99%-ának jövedelmi szintjéről.
Tekintsük a módusz és medián meghatározását csoportosított adatok (eloszlási sorozatok) alapján.
Tegyük fel, hogy a teljes vállalkozás munkavállalóinak tarifakategóriák szerinti megoszlása ​​a következő (2. táblázat).
2. táblázat - A vállalkozás dolgozóinak megoszlása ​​tarifakategóriák szerint

Módus és medián számítása diszkrét sorozatra

Módus és medián számítása intervallumsorozatra

Módus és medián számítása egy variációs sorozathoz

A mód meghatározása diszkrét variációs sorozatból

A korábban beépített, érték szerint rendezett jellemzőértékek sorozata használatos. Ha a minta mérete páratlan, vegye a középső értéket; ha a minta mérete páros, akkor a két központi érték számtani átlagát vesszük.
A mód meghatározása diszkrét variációs sorozatból: az 5. tarifakategória a legmagasabb gyakorisággal (60 fő), ezért modális. Mo = 5.
Az attribútum medián értékének meghatározásához a sorozat medián egységének számát (N Me) a következő képlet segítségével találjuk meg: , ahol n a sokaság térfogata.
A mi esetünkben: .
Az így kapott törtérték, amely mindig páros számú népességegység esetén fordul elő, azt jelzi, hogy a pontos közép 95 és 96 dolgozó között van. Meg kell határozni, hogy az ilyen sorszámú dolgozók melyik csoportba tartoznak. Ezt a felhalmozott frekvenciák kiszámításával lehet megtenni. Az első csoportban, ahol mindössze 12 fő, nincs ilyen létszámú dolgozó, a második csoportba pedig nem tartoznak (12+48=60). A 95. és 96. dolgozók a harmadik csoportba tartoznak (12+48+56=116), ezért a 4. bérkategória a medián.

Módus és medián számítása intervallumsorozatban

A diszkrét variációs sorozatokkal ellentétben a módusz és a medián intervallumsorokból történő meghatározása bizonyos számításokat igényel a következő képletek alapján:
, (5.6)
ahol x0- a modális intervallum alsó határa (a legmagasabb frekvenciájú intervallumot modálisnak nevezzük);
én a modális intervallum értéke;
vezető orvos a modális intervallum gyakorisága;
fMo-1 a modálist megelőző intervallum gyakorisága;
f Mo +1 a modált követő intervallum gyakorisága.
(5.7)
ahol x0– a medián intervallum alsó határa (a medián az az első intervallum, amelynek halmozott gyakorisága meghaladja a gyakoriságok összösszegének felét);
én a medián intervallum értéke;
S Me-1- a mediánt megelőző halmozott intervallum;
f Én a medián intervallum gyakorisága.
Ezen képletek alkalmazását a táblázat adataival szemléltetjük. 3.
Ebben az eloszlásban a 60 - 80 határokkal rendelkező intervallum modális lesz, mert ennek van a legmagasabb frekvenciája. Az (5.6) képlet segítségével meghatározzuk a módot:

A medián intervallum megállapításához meg kell határozni minden további intervallum halmozott gyakoriságát, amíg az meg nem haladja a halmozott gyakoriságok összegének felét (esetünkben az 50%-ot) (5.11. táblázat).
Megállapítást nyert, hogy a medián az az intervallum, amelynek határai 100-120 ezer rubel. Most meghatározzuk a mediánt:

3. táblázat - Az Orosz Föderáció lakosságának megoszlása ​​az egy főre jutó átlagos nominális készpénzjövedelem szintje szerint 1994 márciusában
Csoportok az egy főre jutó átlagos havi jövedelem szintje szerint, ezer rubelA lakosság aránya, %
legfeljebb 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Több mint 3007,7
Teljes100,0

4. táblázat – A medián intervallum meghatározása
Így a számtani átlag, mód és medián használható egy bizonyos attribútum értékeinek általánosított jellemzőjeként egy rangsorolt ​​sokaság egységeihez.
Az eloszlási központ fő jellemzője a számtani átlag, amelyre az jellemző, hogy az ettől való összes eltérés (pozitív és negatív) nullát ad. A mediánra jellemző, hogy az ettől való eltérések összege moduluszban minimális, a módusz pedig a leggyakrabban előforduló jellemző értéke.
A módusz, a medián és a számtani átlag aránya jelzi a tulajdonság eloszlásának jellegét az aggregátumban, lehetővé teszi annak aszimmetriájának felmérését. A szimmetrikus eloszlásokban mindhárom jellemző azonos. Minél nagyobb az eltérés a módusz és a számtani átlag között, annál aszimmetrikusabb a sorozat. Mérsékelten ferde sorozatok esetén a módusz és a számtani átlag közötti különbség körülbelül háromszorosa a medián és az átlag különbségének, azaz:
|Mo–`x| = 3 |Me –`x|.

Módus és medián meghatározása grafikus módszerrel

Egy intervallumsorozat módusa és mediánja grafikusan meghatározható. A módot az eloszlás hisztogramja határozza meg. Ehhez a legmagasabb téglalapot kell kiválasztani, amely ebben az esetben modális. Ezután a modális téglalap jobb oldali csúcsát összekötjük az előző téglalap jobb felső sarkával. A modális téglalap bal csúcsa pedig a következő téglalap bal felső sarkával van. A metszéspontjukból leengedjük az abszcissza tengelyre merőlegest. Ezen egyenesek metszéspontjának abszcisszája lesz az eloszlási mód (5.3. ábra).


Rizs. 5.3. A divat grafikus meghatározása hisztogrammal.


Rizs. 5.4. A medián grafikus meghatározása kumulátum alapján
A medián meghatározásához a halmozott frekvenciák (frekvenciák) skáláján az 50%-nak megfelelő pontból egy egyenes vonalat húzunk az abszcissza tengellyel párhuzamosan a kumulátummal való metszéspontig. Ezután a metszéspontból egy merőlegest engedünk le az abszcissza tengelyére. A metszéspont abszcisszája a medián.

Kvartilis, decilis, százalékos

Hasonlóképpen, ha az eloszlás variációs sorozatában megtalálja a mediánt, megkeresheti egy jellemző értékét a rangsorolt ​​sorozat bármely egységéhez. Így például egy jellemző értékét olyan egységekben találhatja meg, amelyek a sorozatot négy egyenlő részre, 10 vagy 100 részre osztják. Ezeket az értékeket "kvartiliseknek", "deciliseknek", "százalékoknak" nevezik.
A kvartilisek egy olyan jellemző értéke, amely a tartományi sokaságot 4 egyenlő részre osztja.
Különbséget kell tenni az alsó kvartilis (Q 1) között, amely a populáció ¼-ét választja el az attribútum legalacsonyabb értékeivel, és a felső kvartilist (Q 3), amely levágja az attribútum legmagasabb értékeivel rendelkező ¼ részt. . Ez azt jelenti, hogy a lakossági egységek 25%-a kisebb lesz, mint Q 1 ; az egységek 25%-a Q 1 és Q 2 közé kerül; 25% - Q 2 és Q 3 között, a fennmaradó 25% pedig jobb, mint Q 3. A Q 2 középső kvartilise a medián.
A kvartilisek intervallumvariációs sorozatok alapján történő kiszámításához a következő képleteket kell használni:
, ,
ahol x Q 1– az alsó kvartilist tartalmazó intervallum alsó határa (az intervallumot a halmozott gyakoriság határozza meg, az első meghaladja a 25%-ot);
x Q 3– a felső kvartilist tartalmazó intervallum alsó határa (az intervallumot a halmozott gyakoriság határozza meg, az első meghaladja a 75%-ot);
én– intervallumérték;
S Q 1-1 az alsó kvartilist tartalmazó intervallumot megelőző intervallum kumulatív gyakorisága;
S Q 3-1 a felső kvartilist tartalmazó intervallumot megelőző intervallum kumulatív gyakorisága;
f Q 1 az alsó kvartilist tartalmazó intervallum gyakorisága;
f Q 3 a felső kvartilist tartalmazó intervallum gyakorisága.
Tekintsük az alsó és felső kvartilis számítását a táblázat szerint. 5.10. Az alsó kvartilis a 60-80 tartományba esik, ennek kumulatív gyakorisága 33,5%. A felső kvartilis a 160-180 tartományba esik, 75,8%-os halmozott gyakorisággal. Ezt figyelembe véve a következőket kapjuk:
,
.
A variációs eloszlási rangokban a kvartiliseken kívül decilisek is meghatározhatók – olyan opciók, amelyek a rangsorolt ​​variációs sorozatot tíz egyenlő részre osztják. Az első decilis (d 1) 1/10-től 9/10-ig osztja a sokaságot, a második decilis (d 1) 2/10-től 8/10-ig stb.
Kiszámításuk a következő képletekkel történik:
, .
Azokat a jellemzőértékeket, amelyek a sorozatot száz részre osztják, százalékosoknak nevezzük. A medián, kvartilisek, decilisek és percentilisek arányait az ábra mutatja. 5.5.

Bérek a gazdaság különböző ágazataiban, hőmérséklet és csapadék ugyanazon a területen összehasonlítható időszakokra, terméshozamok különböző földrajzi régiókban stb. Az átlag azonban korántsem az egyetlen általánosító mutató – bizonyos esetekben a pontosabb eredmény érdekében megfelelő érték, például a medián értékelése. A statisztikában széles körben használják, mint kiegészítő leíró jellemzőt egy adott sokaságon belüli eloszlására. Nézzük meg, miben tér el az átlagtól, és azt is, hogy mi indokolta a használatát.

Medián a statisztikában: meghatározás és tulajdonságok

Képzeljük el a következő helyzetet: 10 ember dolgozik együtt az igazgatóval egy cégben. A hétköznapi alkalmazottak fejenként 1000 hrivnyát kapnak, vezetőjük, aki ráadásul tulajdonos is, 10 ezer hrivnyát. Ha kiszámoljuk a számtani átlagot, akkor kiderül, hogy ennél a vállalkozásnál az átlagos fizetés 1900 UAH. Vajon igaz lesz ez az állítás? Vagy hogy ezt a példát vegyük, ugyanabban a kórházi szobában kilenc ember 36,6 °C-os és egy személy 41 °C-os. A számtani átlag ebben az esetben: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. De ez nem jelenti azt, hogy minden jelenlévő beteg. Mindez azt sugallja, hogy az átlag önmagában sokszor nem elég, és ezért mellette a mediánt is alkalmazzák. A statisztikákban ezt a mutatót olyan változatnak nevezik, amely pontosan egy rendezett variációsorozat közepén helyezkedik el. Ha kiszámítja a példáink alapján, akkor 1000 UAH-t kap. és 36,6 °С. Vagyis a medián a statisztikában az az érték, amely a sorozatot úgy osztja ketté, hogy annak mindkét oldalán (felfelé vagy lefelé) ugyanannyi egység található az adott sokaságból. E tulajdonság miatt ennek a mutatónak több más neve is van: 50. percentilis vagy 0,5 kvantilis.

Hogyan találjuk meg a mediánt a statisztikákban

Ennek az értéknek a kiszámításának módja nagyban függ attól, hogy milyen típusú variációs sorozatunk van: diszkrét vagy intervallum. Az első esetben a statisztika mediánja meglehetősen egyszerű. Csak annyit kell tennie, hogy meg kell keresnie a frekvenciák összegét, el kell osztania 2-vel, majd az eredményhez hozzáadni a ½-t. Legjobb lenne a számítás elvét a következő példával elmagyarázni. Tegyük fel, hogy csoportosítottuk a termékenységi adatokat, és szeretnénk megtudni, mi a medián.

Családi csoportszám gyermeklétszám szerint

Családok száma

Néhány egyszerű számítás elvégzése után azt kapjuk, hogy a kívánt mutató egyenlő: 195/2 + ½ = opció. Annak érdekében, hogy megtudja, mit jelent ez, szekvenciálisan fel kell halmoznia a frekvenciákat, kezdve a legkisebb opciókkal. Tehát az első két sor összege 30-at ad. Nyilvánvaló, hogy itt nincs 98 lehetőség. De ha az eredményhez hozzáadjuk a harmadik lehetőség gyakoriságát (70), akkor 100-nak megfelelő összeget kapunk. Csak a 98. opciót tartalmazza, ami azt jelenti, hogy a medián egy kétgyermekes család lesz.

Ami az intervallumsort illeti, itt általában a következő képletet használják:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, amelyben:

  • X Me - a medián intervallum első értéke;
  • ∑f a sorozat száma (frekvenciáinak összege);
  • i Me - a medián tartomány értéke;
  • f Me - a medián tartomány frekvenciája;
  • S Me-1 – a mediánt megelőző tartományok kumulatív gyakoriságainak összege.

Megint nehéz erre példa nélkül rájönni. Tegyük fel, hogy vannak adatok az értékről

Fizetés, ezer rubel

Felhalmozott frekvenciák

A fenti képlet használatához először meg kell határoznunk a medián intervallumot. Ilyen tartományként egy olyan tartományt választunk, amelynek halmozott frekvenciája meghaladja a frekvenciák összösszegének felét, vagy egyenlő azzal. Tehát, elosztva 510-et 2-vel, azt kapjuk, hogy ez a kritérium egy 250 000 rubel fizetési értékű intervallumnak felel meg. legfeljebb 300 000 rubel Most behelyettesítheti a képlet összes adatát:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 = 286,96 ezer rubel.

Reméljük, hogy cikkünk hasznos volt, és most már világos elképzelése van arról, hogy mi a medián a statisztikákban, és hogyan kell kiszámítani.

A medián kiszámításához az MS EXCEL-ben van egy speciális MEDIAN() függvény. Ebben a cikkben meghatározzuk a mediánt, és megtanuljuk, hogyan lehet kiszámítani egy mintára és egy valószínűségi változó adott eloszlási törvényére.

Kezdjük azzal mediánok számára minták(azaz fix értékkészletre).

Minta medián

Középső(medián) az a szám, amely a számhalmaz közepe: a halmazban lévő számok fele nagyobb, mint középső, és a számok fele kisebb, mint középső.

Számolni mediánok először szükséges (értékek mintavétel). Például, középső mintához (2; 3; 3; 4 ; 5; 7; 10) lesz 4. Mivel. csak benne mintavétel 7 érték, ebből három kisebb, mint 4 (azaz 2; 3; 3) és három érték nagyobb, mint (azaz 5; 7; 10).

Ha a halmaz páros számú számot tartalmaz, akkor a halmaz közepén lévő két számra kerül kiszámításra. Például, középső mintához (2; 3; 3 ; 6 ; 7; 10) 4,5 lesz, mert (3+6)/2=4,5.

Meghatározására mediánok Az MS EXCEL-ben van egy azonos nevű függvény MEDIAN() , a MEDIAN() angol változata.

Középső nem feltétlenül egyezik. Egyezés csak akkor következik be, ha a mintában lévő értékek szimmetrikusan oszlanak el középső. Például azért minták (1; 2; 3 ; 4 ; 5; 6) középsőés átlagos egyenlők 3,5-tel.

Ha ismert elosztási függvény F(x) vagy valószínűségi sűrűségfüggvény p(X), akkor középső az egyenletből megtalálható:

Például, ha ezt az egyenletet analitikusan megoldjuk az lnN(μ; σ 2) lognormális eloszlásra, azt kapjuk, hogy középső az =EXP(μ) képlettel számítjuk ki. μ=0 esetén a medián 1.

Ügyeljen a pontra Elosztási funkciók, amelyekre F(x) = 0,5(lásd a fenti képet) . Ennek a pontnak az abszcisszája 1. Ez a medián értéke, amely természetesen egybeesik az em képlet segítségével korábban számított értékkel.

MS EXCEL-ben középső számára lognormális eloszlás LnN(0;1) kiszámítható a képlet segítségével =LOGNORM.INV(0;5;0;1).

jegyzet: Emlékezzünk vissza, hogy az integrálja a valószínűségi változó beállítási területének teljes területén egyenlő eggyel.

Ezért a medián egyenes (x=Medián) felosztja a grafikon alatti területet valószínűségi sűrűségfüggvények két egyenlő részre.

Tekintettel arra, hogy a kutató nem rendelkezik adatokkal az egyes pénzváltók értékesítési volumenéről, a számtani átlag számítása a dolláronkénti átlagár meghatározásához nem megfelelő.

Számsorozat mediánja

Azonban meg lehet határozni az attribútum értékét, amelyet mediánnak (Me) nevezünk. Középső

példánkban

Medián szám: NoMe = ;

Divat

3.6. táblázat.

f a sorozat frekvenciáinak összege;

S kumulatív frekvenciák

12_

_

S a felhalmozott frekvenciák.

ábrán. 3.2. A bankok nyereség szerinti megoszlásának sorozatának hisztogramja látható (a 3.6. táblázat szerint).

x a nyereség összege, millió rubel,

f a bankok száma.

"A MEGRENDELT SOROZAT MEDIÁNJA"

A kiadvány szöveges HTML-változata


Az algebra órájának összefoglalója a 7. osztályban

Az óra témája: "A MEGRENDELT SOROZAT MEDIÁNJA".

Eremenko Tatyana Alekseevna, a MKOU Burkovskaya középiskola Lake School fiókjának tanára
Célok:
a medián fogalma, mint egy rendezett sorozat statisztikai jellemzője; a páros és páratlan számú tagú rendezett sorozatok mediánjának megtalálásának képessége; a medián értékeinek gyakorlati helyzettől függő értelmezésének képességének kialakítása, a számtani középérték halmaz fogalmának megszilárdítása. Az önálló munkavégzés készségeinek fejlesztése. Fokozza érdeklődését a matematika iránt.
Az órák alatt

szóbeli munka.
A sorok adottak: 1) 4; egy; nyolc; 5; egy; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; négy; 6; 7,3; 6. Keresse meg: a) az egyes sorok legnagyobb és legkisebb értékét; b) az egyes sorok tartománya; c) az egyes sorok divatja.
II. Új anyag magyarázata.
Tankönyvi munka. 1. Tekintsük a problémát a tankönyv 10. bekezdéséből! Mit jelent a rendezett sor? Hangsúlyozom, hogy a medián megtalálása előtt mindig rendezni kell az adatsorokat. 2. A táblán megismerkedünk a páros és páratlan számú sorozatok mediánjának megtalálásának szabályaival:
középső

szabályos

sor
számok
Val vel

páratlan

szám

tagjai

felhívta a közepére írt számot, és
középső

rendelt sor
számok
páros számú taggal
a közepére írt két szám számtani középértékének nevezzük.
középső

tetszőleges

sor
a megfelelő rendezett sorozat 1 3 1 7 5 4 mediánjának nevezzük.
Megjegyzem, hogy a mutatók a számtani átlag, a mód és a medián

eltérően

jellemez

adat,

kapott

eredmény

megfigyelések.

III. A készségek és képességek kialakulása.
1. csoport. Gyakorlatok rendezett és rendezetlen sorozat mediánjának meghatározására szolgáló képletek alkalmazására. egy.
№ 186.
Megoldás: a) A sorozat tagjainak száma P= 9; középső Nekem= 41; b) P= 7, a sor rendezett, Nekem= 207; ban ben) P= 6, a sor rendezett, Nekem== 21; G) P= 8, a sor rendezett, Nekem== 2.9. Válasz: a) 41; b) 207; 21-kor; d) 2.9. A tanulók kommentálják, hogyan találják meg a mediánt. 2. Határozza meg egy számsorozat számtani középértékét és mediánját: a) 27, 29, 23, 31, 21, 34; ban ben) ; 1. b) 56, 58, 64, 66, 62, 74. Megoldás: A medián megtalálásához az egyes sorokat rendezni kell: a) 21, 23, 27, 29, 31, 34. P = 6; x = = 27,5; Nekem== 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Hogyan találjuk meg a mediánt a statisztikákban

P = 6; x = 63,3; Nekem== 63; ban ben) ; egy. P = 5; x = : 5 = 3: 5 = 0,6; Nekem = . 3.
№ 188
(orálisan). Válasz: igen; b) nem; c) nem; d) igen. 4. Tudva, hogy a rendezett sorozat tartalmaz t számok, hol t egy páratlan szám, jelölje meg a kifejezés számát, amely az if medián t egyenlő: a) 5; b) 17; c) 47; d) 201. Válasz: a) 3; b) 9; c) 24; d) 101. 2. csoport. Gyakorlati feladatok a megfelelő sorozat mediánjának megtalálásához és az eredmény értelmezéséhez. egy.
№ 189.
Megoldás: A sortagok száma P= 12. A medián megtalálásához a sorozatokat a következő sorrendben kell megadni: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. A sorozat mediánja Nekem= = 176. Az artel következő tagjainál a havi kibocsátás meghaladta a mediánt: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 178 178 xx+ + = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rylov; 3) Antonov; 6) Asztafjev. Válasz: 176. 2.
№ 192.
Megoldás: Rendezzük az adatsorokat: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; sortagok száma P= 20. Csúsztatás A = x max- x min = 42 - 30 = 12. Üzemmód Mo= 32 (ez az érték 6-szor fordul elő - gyakrabban, mint mások). Középső Nekem= = 35. Ebben az esetben a tartomány mutatja az alkatrész feldolgozási idő legnagyobb eloszlását; a mód a feldolgozási idő legjellemzőbb értékét mutatja; medián az a feldolgozási idő, amelyet az esztergályosok fele nem lépte túl. Válasz: 12; 32; 35.
IV. A lecke összefoglalása.
Mennyi egy számsor mediánja? – Egy számsor mediánja nem eshet egybe a sorozat egyik számával? – Milyen szám mediánja egy 2-t tartalmazó rendezett sorozatnak? P számok? 2 P– 1 szám? Hogyan lehet megtalálni egy rendezetlen sorozat mediánját?
Házi feladat:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

Az alapfokú általános műveltség rovatban

Mód és medián

Az átlagértékek a módot és a mediánt is tartalmazzák.

A mediánt és a módust gyakran használják átlagjellemzőként azokban a populációkban, ahol az átlag kiszámítása (számtani, harmonikus stb.) lehetetlen vagy nem praktikus.

Például egy Omszk városában, 12 kereskedelmi valutaváltót felölelő mintafelmérés lehetővé tette a dollár különféle árainak rögzítését az eladáskor (az 1995. október 10-i adatok a dollár árfolyamán -4493 rubel) .

Tekintettel arra, hogy a kutató nem rendelkezik adatokkal az egyes pénzváltók értékesítési volumenéről, a számtani átlag számítása a dolláronkénti átlagár meghatározásához nem megfelelő. Azonban meg lehet határozni az attribútum értékét, amelyet mediánnak (Me) nevezünk. Középső a rangsorolt ​​sor közepén fekszik, és felosztja azt.

A csoportosítatlan adatok mediánjának kiszámítása a következőképpen történik:

a) rendezze a jellemző egyedi értékeit növekvő sorrendbe:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) határozza meg a medián sorszámát a következő képlettel:

példánkban ez azt jelenti, hogy a medián ebben az esetben a rangsorolt ​​sorozat hatodik és hetedik jellemzőértéke között helyezkedik el, mivel a sorozatnak páros számú egyedi értéke van. Így Me egyenlő a szomszédos értékek számtani átlagával: 4550, 4560.

c) mérlegelje a medián kiszámításának eljárását páratlan számú egyedi érték esetén.

Tegyük fel, hogy nem 12, hanem 11 valutaváltási pontot figyelünk meg, akkor a rangsorolt ​​sorozat így fog kinézni (a 12. pontot elvetjük):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Medián szám: NoMe = ;

a hatodik helyen = 4560, ami a medián: én = 4560. Ennek mindkét oldalán ugyanannyi pont van.

Divat- ez az attribútum leggyakoribb értéke a sokaság egységeiben. Egy bizonyos jellemző értéknek felel meg.

Esetünkben a dolláronkénti modális árat 4560 rubelnek nevezhetjük: ez az érték 4-szer ismétlődik, gyakrabban, mint az összes többi.

A gyakorlatban a módozatot és a mediánt általában csoportosított adatokból találjuk meg. A csoportosítás eredményeként a bankok évre befolyt nyeresége szerinti megoszlási sorozatát kaptuk (3.6. táblázat).

3.6. táblázat.

A bankok csoportosítása az év során befolyt nyereség összege szerint

A medián meghatározásához ki kell számítani a kumulatív gyakoriságok összegét. A teljes növekedés addig tart, amíg a frekvenciák kumulált összege meg nem haladja a gyakoriságok összegének felét. Példánkban a felhalmozott frekvenciák összege (12) meghaladja az összes érték felét (20:2). Ez az érték a medián intervallumnak felel meg, amely tartalmazza a mediánt (5,5 - 6,4). Határozzuk meg értékét a következő képlettel:

ahol a mediánt tartalmazó intervallum kezdeti értéke;

- a medián intervallum értéke;

f a sorozat frekvenciáinak összege;

a medián intervallumot megelőző kumulatív gyakoriságok összege;

a medián intervallum gyakorisága.

Így a bankok 50% -ának nyeresége 6,1 millió rubel, a bankok 50% -ának pedig több mint 6,1 millió rubel.

A legmagasabb frekvencia szintén az 5,5 - 6,4 intervallumnak felel meg, azaz. a módnak ebben az intervallumban kell lennie. Értékét a következő képlet határozza meg:

ahol a módust tartalmazó intervallum kezdőértéke;

- a modális intervallum értéke;

a modális intervallum gyakorisága;

- a modált megelőző intervallum gyakorisága;

- a modált követő intervallum gyakorisága.

A megadott divatképlet egyenlő intervallumú variációs sorozatokban használható.

Így ebben az aggregátumban a leggyakoribb nyereség 6,10 millió rubel.

A medián és a mód grafikusan meghatározható. A mediánt a kumulátum határozza meg (3.1. ábra). Ennek elkészítéséhez ki kell számítani a kumulatív frekvenciákat és frekvenciákat. A kumulatív gyakoriságok azt mutatják meg, hogy a sokaság hány egységének jellemzői értéke nem nagyobb, mint a figyelembe vett érték, és az intervallumfrekvenciák egymást követő összegzésével határozzák meg. A kumulatív intervallum eloszlási sorozat felépítésénél az első intervallum alsó határa nullával egyenlő gyakoriságnak, a felső határa pedig az adott intervallum teljes frekvenciájának felel meg. A második intervallum felső határa az első két intervallum frekvenciáinak összegével egyenlő kumulatív frekvenciának felel meg, és így tovább.

Készítsünk kumulatív görbét a táblázat szerint. 6 a bankok nyereség szerinti megoszlásáról.

S kumulatív frekvenciák

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х nyereség

Rizs. 3.1. A bankok kumulált nyereség szerinti megoszlása:

x a nyereség összege, millió rubel,

S a felhalmozott frekvenciák.

A medián meghatározásához a legnagyobb ordináta magasságát, amely megfelel a teljes népességnek, fel kell osztani. A kapott ponton az abszcissza tengellyel párhuzamos egyenes vonalat húzunk, amíg az nem metszi a kumulátumot. A metszéspont abszcisszája a medián.

A módot az eloszlás hisztogramja határozza meg. A hisztogram a következőképpen épül fel:

az abszcissza tengelyen egyenlő szakaszokat ábrázolunk, amelyek az elfogadott skálán megfelelnek a variációs sorozat intervallumainak méretének. A szegmensekre téglalapokat építenek, amelyek területei arányosak az intervallum frekvenciáival (vagy frekvenciáival).

Medián a statisztikákban

3.2. A bankok nyereség szerinti megoszlásának sorozatának hisztogramja látható (a 3.6. táblázat szerint).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X

Rizs. 3.2. A kereskedelmi bankok nyereség szerinti megoszlása:

x a nyereség összege, millió rubel,

f a bankok száma.

A divat meghatározásához a modális téglalap jobb csúcsát összekötjük az előző téglalap jobb felső sarkával, a modális téglalap bal csúcsát pedig a következő téglalap bal felső sarkával. Ezen egyenesek metszéspontjának abszcisszája lesz az elosztási mód.

Medián (statisztika)

Medián (statisztika), a matematikai statisztikában egy mintát (például egy számhalmazt) jellemző szám. Ha a mintában az összes elem különbözik, akkor a medián a minta száma úgy, hogy a mintában lévő elemeknek pontosan a fele nagyobb, a másik fele pedig kisebb nála. Általánosabb esetben a mediánt úgy találhatjuk meg, hogy a minta elemeit növekvő vagy csökkenő sorrendbe rendezzük, és a középső elemet vesszük. Például a minta (11, 9, 3, 5, 5) a rendezés után (3, 5, 5, 9, 11) lesz, mediánja pedig az 5. Ha a minta páros számú elemet tartalmaz, a a medián nem határozható meg egyértelműen: a numerikus adatokhoz leggyakrabban két szomszédos érték félösszegét használják (azaz a halmaz (1, 3, 5, 7) mediánját 4-nek vesszük).

Vagyis a medián a statisztikában az az érték, amely a sorozatot úgy osztja ketté, hogy annak mindkét oldalán (felfelé vagy lefelé) ugyanannyi egység található az adott sokaságból.

1. számú feladat. Számtani átlag, modális és medián érték számítása

E tulajdonság miatt ennek a mutatónak több más neve is van: 50. percentilis vagy 0,5 kvantilis.

  • Átlagos
  • Középső
  • Divat

Medián (statisztika)

Medián (statisztika), a matematikai statisztikában egy mintát (például egy számhalmazt) jellemző szám. Ha a mintában az összes elem különbözik, akkor a medián a minta száma úgy, hogy a mintában lévő elemeknek pontosan a fele nagyobb, a másik fele pedig kisebb nála. Általánosabb esetben a mediánt úgy találhatjuk meg, hogy a minta elemeit növekvő vagy csökkenő sorrendbe rendezzük, és a középső elemet vesszük. Például a minta (11, 9, 3, 5, 5) a rendezés után (3, 5, 5, 9, 11) lesz, mediánja pedig az 5.

5.5 Módus és medián. Számításuk diszkrét és intervallumos variációs sorozatokban

Ha a minta páros számú elemet tartalmaz, előfordulhat, hogy a medián nem határozható meg egyértelműen: numerikus adatoknál a leggyakrabban két szomszédos érték félösszegét használják (vagyis a halmaz mediánját (1, 3, 5, 7) értéke 4).

Vagyis a medián a statisztikában az az érték, amely a sorozatot úgy osztja ketté, hogy annak mindkét oldalán (felfelé vagy lefelé) ugyanannyi egység található az adott sokaságból. E tulajdonság miatt ennek a mutatónak több más neve is van: 50. percentilis vagy 0,5 kvantilis.

A mediánt akkor használjuk a számtani átlag helyett, ha a rangsorolt ​​sorozat szélső változatai (legkisebb és legnagyobb) a többihez képest túl nagynak vagy túl kicsinek bizonyulnak.

A MEDIAN függvény a központi trendet méri, amely egy statisztikai eloszlásban egy számhalmaz középpontja. Három leggyakoribb módja van a központi trend meghatározásának:

  • Átlagos- a számtani átlag, amelyet úgy számítanak ki, hogy összeadják a számokat, majd elosztják a kapott összeget a számukkal.
    Például a 2, 3, 3, 5, 7 és 10 számok átlaga 5, ami úgy adódik, hogy a 30-as összegüket elosztjuk számukkal, amely 6.
  • Középső- egy szám, amely egy számhalmaz közepe: a számok felének értéke nagyobb, mint a medián, és a számok fele kisebb.
    Például a 2, 3, 3, 5, 7 és 10 számok mediánja 4.
  • Divat az adott számhalmazban leggyakrabban előforduló szám.
    Például a 2, 3, 3, 5, 7 és 10 számok üzemmódja 3 lenne.

Algebra óra 7. osztályban.

"A medián, mint statisztikai jellemző" témakör.

Tanár Egorova N.I.

Az óra célja: kialakítani a tanulókban a számhalmaz mediánjának megértését és egyszerű numerikus halmazokra történő kiszámításának képességét, rögzítve a számtani középhalmaz fogalmát.

Az óra típusa: új tananyag magyarázata.

Az órák alatt

1. Szervezeti mozzanat.

Tájékoztassa az óra témáját, és fogalmazza meg céljait.

2. Korábbi ismeretek aktualizálása.

Kérdések diákokhoz:

Mi egy számhalmaz számtani középértéke?

Hol található a számtani középérték a számok halmazán belül?

Mi jellemzi egy számhalmaz számtani középértékét?

Hol használják gyakran egy számhalmaz számtani középértékét?

Szóbeli feladatok:

Keresse meg egy számhalmaz számtani átlagát:

Házi feladat ellenőrzése.

Tankönyv: 169. sz., 172. sz.

3. Új anyag elsajátítása.

Az előző leckében egy olyan statisztikai jellemzővel ismerkedtünk meg, mint egy számhalmaz számtani átlaga. Ma egy másik statisztikai jellemzőnek – a mediánnak – szentelünk leckét.

Nem csak a számtani átlag mutatja meg, hogy a számegyenesen hol találhatók bármely halmaz számai és hol van a középpontjuk. Egy másik mutató a medián.

Egy számhalmaz mediánja az a szám, amely a halmazt két egyenlő részre osztja. A „medián” helyett azt mondhatjuk, hogy „közép”.

Először példákon keresztül elemezzük, hogyan találjuk meg a mediánt, majd adunk egy szigorú definíciót.

Tekintsük a következő szóbeli példát kivetítő használatával

A 7. évfolyam 11 tanulója a tanév végén teljesítette a 100 méteres futás színvonalát. A következő eredményeket rögzítették:

Miután a srácok lefutották a távot, Petya odalépett a tanárhoz, és megkérdezte, mi az eredménye.

„A legtöbb átlagos: 16,9 másodperc” – válaszolta a tanár

"Miért?" Petya meglepődött. - Végül is az összes eredmény számtani átlaga körülbelül 18,3 másodperc, és egy másodperccel vagy többel jobban futottam. És általában véve, Katya eredménye (18,4) sokkal közelebb áll az átlaghoz, mint az enyém.”

„Az eredményed átlagos, mert öten futottak jobban nálad és öten rosszabbul. Tehát a közepén vagy – mondta a tanár.

Írjon egy algoritmust egy számhalmaz mediánjának megtalálására:

Rendelje meg a numerikus halmazt (alkosson rangsorolt ​​sorozatot).

Ugyanakkor e számkészlet „legnagyobb” és „legkisebb” számát áthúzzuk, amíg egy vagy két szám nem marad.

Ha csak egy szám van, akkor ez a medián.

Ha két szám maradt, akkor a medián a maradék két szám számtani átlaga lesz.

Kérd meg a tanulókat, hogy önállóan fogalmazzák meg egy számhalmaz mediánjának definícióját, majd olvassák el a medián definícióját a tankönyvben (40. o.), majd oldják meg a 186. (a, b), 187. (a) sz. a tankönyv (41. o.).

Megjegyzés:

Felhívjuk a tanulók figyelmét egy fontos körülményre: a medián gyakorlatilag érzéketlen a számhalmazok egyéni szélsőértékeinek jelentős eltéréseire. A statisztikákban ezt a tulajdonságot stabilitásnak nevezik. Egy statisztikai mutató stabilitása nagyon fontos tulajdonság, biztosít minket a véletlenszerű hibák és az egyedi megbízhatatlan adatok ellen.

4. A tanult anyag konszolidálása.

Problémamegoldás.

Jelölje x-számtani átlag, Me-medián.

Számkészlet: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Számkészlet: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Számhalmaz: 3,4,11,17,21

b) Számkészlet: 17,18,19,25,28

c) Számok halmaza: 25, 25, 27, 28, 29, 40, 50

Következtetés: a páratlan számú tagból álló számhalmaz mediánja megegyezik a középen lévő számmal.

a) Számok halmaza: 2, 4, 8, 9.

Me = (4+8):2=12:2=6

b) Számok halmaza: 1,3,5,7,8,9.

Me = (5+7):2=12:2=6

A páros számú tagot tartalmazó számhalmaz mediánja a középen lévő két szám összegének a fele.

A tanuló az alábbi osztályzatokat kapta algebrából a negyedév során:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Keresse meg ennek a halmaznak az átlagos pontszámát és mediánját.

Keressük az átlagpontszámot, vagyis a számtani átlagot:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Keresse meg ennek a számkészletnek a mediánját:

Rendeljünk egy számkészletet: 2,4,4,4,5,5,5,5,5,5

Csak 10 szám, a medián meghatározásához két középső számot kell vennie, és meg kell találnia a félösszegüket.

Me = (5+5):2 = 5

Kérdés a diákokhoz: Ha tanár lennél, milyen osztályzatot adnál ennek a diáknak egy negyedért? Indokolja a választ.

A cég elnöke 300 000 rubel fizetést kap. három helyettese fejenként 150 000 rubelt, negyven alkalmazottja fejenként 50 000 rubelt kap. a takarítónő fizetése pedig 10 000 rubel. Keresse meg a fizetések számtani átlagát és mediánját a vállalatnál. Az alábbi tulajdonságok közül melyiket jövedelmezőbb az elnöknek reklámcélokra használni?

x \u003d (300000 + 3 150000 + 40 50000 + 10000): (1 + 3 + 40 + 1) \u003d 2760000: 45 \u003d 61333,33 (rubel)

6. sz. Szóban.

A) Hány szám van a halmazban, ha a mediánja a kilencedik tagja?

B) Hány szám van a halmazban, ha annak mediánja a 7. és 8. tag számtani átlaga?

C) Egy hét számból álló halmazban a legnagyobb számot 14-gyel növeltük. Megváltoztatja-e ez mind a számtani átlagot, mind a mediánt?

D) A halmazban lévő számok mindegyike 3-mal nőtt. Mi lesz a számtani átlaggal és a mediánnal?

Az édességeket a boltban súly szerint értékesítik. Hogy megtudja, hány édességet tartalmaz egy kilogramm, Masha úgy döntött, hogy megkeresi egy cukorka súlyát. Több cukorkát is kimért, és a következő eredményeket érte el:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Mindkét jellemző alkalmas egy cukorka súlyának becslésére, hiszen nem nagyon különböznek egymástól.

Tehát a statisztikai információk jellemzésére a számtani átlagot és a mediánt használjuk. Sok esetben előfordulhat, hogy egyes jellemzőknek nincs értelme (például a közúti balesetek idejére vonatkozó információk birtokában aligha van értelme ezeknek az adatoknak a számtani átlagáról beszélni).

Házi feladat: 10. bekezdés, 186. (c, d), 190. sz.

5. Az óra eredményei. Visszaverődés.

  1. "Statisztikai kutatás: statisztikai adatok gyűjtése és csoportosítása"

    Lecke

    Témák hetedikre javasolta osztály. TEMATIKUS TERVEZÉS. § egy. Statisztikaijellemzők. P 1. Számtani átlag, tartomány és módus 1h. P 2. Középsőhogyanstatisztikaijellegzetes

  2. Az „algebra” képzés munkaprogramja a 7. évfolyam (alapszint) magyarázó jegyzetében

    Munkaprogram

    ... 10. tétel Középsőhogyanstatisztikaijellegzetes 23 p.9 Számtani átlag, tartomány és mód 24 2. sz. vizsga on téma

  3. Munkaprogram. Matematika. 5. évfolyam p. Kanashi. 2011

    Munkaprogram

    ... egyenletek. Számtani átlag, tartomány és módus. Középsőhogyanstatisztikaijellegzetes. A cél az, hogy rendszerezze és összefoglalja a ...-ról szóló információkat és az itt szerzett készségeket leckéket alapján témákat(jól algebra 10 osztály). 11 Osztály(heti 4 óra...

  4. 2012. augusztus 30-i 51. számú végzés Algebra munkaprogram 7. évfolyam

    Munkaprogram

    … tananyag Középsőhogyanstatisztikaijellegzetes Ismerje a számtani átlag, a tartomány, a módus és a definícióját mediánokhogyanstatisztikaijellemzők Frontális és egyéni...

  5. Matematika munkaprogram 7. évfolyam ii szint alapszint (1)

    Munkaprogram

    Hogyan találjuk meg egy sorozat mediánját

    azonos, hogyan 6-kor tanterem. A tanulmány Témák azzal zárul, hogy a tanulókat a legegyszerűbbekkel ismertetjük meg statisztikaijellemzők: közepes ... M .: "Genzher" kiadó, 2009. 3. Zhokhov, V.I. Leckékalgebra 7-kor tanterem: könyv. a tanár számára / V. I. Zhokhov ...

Egyéb kapcsolódó dokumentumok..

1906-ban a nagy tudós és neves eugenikus, Francis Galton ellátogatott a nyugat-angliai éves Állat- és Baromfikiállításra, ahol véletlenül érdekes kísérletet végzett.

James Surowetsky, a The Wisdom of the Crowd szerzője szerint a galtoni vásáron volt egy verseny, amelyben az embereknek meg kellett találniuk egy levágott bika súlyát. Az lett a győztes, aki a valós számhoz legközelebb állót nevezte meg.

Galton arról volt ismert, hogy megvetette a hétköznapi emberek intellektuális képességeit. Úgy vélte, hogy a bika súlyáról csak valódi szakértők tudnak pontos megállapításokat tenni. A verseny 787 résztvevője pedig nem volt szakértő.

A tudós a tömeg tehetetlenségét a résztvevők válaszaiból kiszámolt átlagszámmal akarta bizonyítani. Mi volt a meglepetése, amikor kiderült, hogy a kapott eredmény szinte pontosan megfelel a bika valós súlyának!

Átlagérték - késői találmány

A válasz pontossága természetesen meghökkentette a kutatót. De még figyelemreméltóbb az a tény, hogy Galton egyáltalán gondolt az átlag használatára.

A mai világban az átlagok és az úgynevezett mediánok mindenhol ott vannak: New Yorkban áprilisban az átlaghőmérséklet 52 Fahrenheit-fok; Stephen Curry meccsenként 30 pontot átlagol; A háztartások medián jövedelme az Egyesült Államokban 51 939 dollár/év.

Az az elképzelés azonban, hogy sok különböző eredményt lehet egyetlen számmal ábrázolni, egészen új. A 17. századig általában nem használtak átlagokat.

Hogyan jött létre és fejlődött az átlagok és mediánok fogalma? És hogyan vált korunk fő mérési technikájává?

Az átlagok túlsúlya a mediánokkal szemben messzemenő következményekkel járt az információ megértésére nézve. És gyakran félrevezette az embereket.

Átlag és medián értékek

Képzeld el, hogy egy történetet mesélsz négy emberről, akik tegnap este veled vacsoráztak egy étteremben. Az egyiküknek 20 évet, a másiknak 30-at, a harmadiknak 40-et, a negyediknek 50-et adnál. Mit mondanál a történetükben az életkorukról?

Valószínűleg átlagéletkornak fogja nevezni őket.

Az átlagot gyakran használják információ továbbítására valamiről, valamint egy méréssorozat leírására. Technikailag az átlagot a matematikusok "számtani átlagnak" nevezik - az összes mérés összege osztva a mérések számával.

Bár az „átlag” szót gyakran a „medián” (medián) szó szinonimájaként használják, az utóbbit gyakrabban nevezik valaminek a közepének. Ez a szó a latin „medianus” szóból származik, ami „közép”-et jelent.

Medián érték az ókori Görögországban

A medián érték története az ókori görög matematikus, Pythagoras tanításaiból származik. Pythagoras és iskolája esetében a mediánnak egyértelmű meghatározása volt, és nagyon különbözött attól, ahogyan ma az átlagot értjük. Csak a matematikában használták, az adatelemzésben nem.

A Pitagorasz iskolában a medián érték egy háromtagú számsorozat átlagos száma volt, a szomszédos tagokkal "egyenlő" viszonyban. Az "egyenlő" arány ugyanazt a távolságot jelentheti. Például a 4-es szám a 2,4,6 sorban. Ugyanakkor kifejezhet geometriai progressziót is, például 10-et az 1, 10, 100 sorozatban.

Churchill Eisenhart statisztikus elmagyarázza, hogy az ókori Görögországban a mediánt nem használták egyetlen számkészlet sem reprezentatív, sem helyettesítőjeként. Egyszerűen a közepét jelölte, és gyakran használták matematikai bizonyításokban.

Eisenhart tíz évet töltött az átlag és a medián tanulmányozásával. Kezdetben a medián reprezentatív funkcióját próbálta megtalálni a korai tudományos konstrukciókban. Ehelyett azonban azt találta, hogy a korai fizikusok és csillagászok többsége egyetlen, ügyesen elvégzett mérésre támaszkodott, és nem volt módszerük arra, hogy a sok megfigyelés közül a legjobb eredményt válasszák ki.

A modern kutatók következtetéseiket nagy mennyiségű adat gyűjtésére alapozzák, mint például az emberi genomot tanulmányozó biológusok. Az ókori tudósok ezzel szemben több mérést is végezhettek, de elméleteik felépítéséhez csak a legjobbat választották.

Amint azt Otto Neugebauer csillagászattörténész írta: "ez összhangban van az ókori emberek azon tudatos vágyával, hogy a tudományban minimalizálják az empirikus adatok mennyiségét, mert nem hittek a közvetlen megfigyelések pontosságában".

Például a görög matematikus és csillagász, Ptolemaiosz a megfigyelés módszerével és a Föld mozgáselméletével kiszámította a Hold szögátmérőjét. Eredménye 31'20 lett. Ma már tudjuk, hogy a Hold átmérője a Földtől való távolságtól függően 29'20 és 34'6 között mozog. Ptolemaiosz kevés adatot használt számításai során, de minden oka megvolt azt hinni, hogy azok pontosak.

Eisenhart ezt írja: „Nem szabad elfelejteni, hogy a megfigyelés és az elmélet kapcsolata az ókorban más volt, mint manapság. A megfigyelések eredményeit nem tényekként értelmezték, amelyekhez igazítani kell az elméletet, hanem konkrét esetekként, amelyek csak az elmélet igazságának szemléltető példáiként szolgálhatnak.

Végül a tudósok az adatok reprezentatív méréseihez fognak fordulni, de kezdetben nem használtak sem eszközöket, sem mediánokat ebben a szerepkörben. Az ókortól napjainkig egy másik matematikai fogalmat is használnak ilyen reprezentatív eszközként - a szélsőértékek fele összegét.

A szélsőértékek fele összege

Az új tudományos eszközök szinte mindig abból fakadnak, hogy valamilyen tudományágban egy bizonyos problémát meg kell oldani. A sok mérés közül a legjobb érték megtalálásának igénye a földrajzi helyzet pontos meghatározásának igényéből fakadt.

A 11. századi Al-Biruni szellemi óriás az egyik első ember, aki alkalmazta a reprezentatív jelentések módszertanát. Al-Biruni azt írta, hogy amikor sok mérés állt a rendelkezésére, és meg akarta találni közülük a legjobbat, a következő "szabályt" alkalmazta: meg kell találni egy számot, amely megfelel két szélső érték közötti középnek. A szélsőértékek félösszegének kiszámításakor a maximális és minimális értékek közötti összes számot nem veszik figyelembe, hanem csak ennek a két számnak az átlagát találjuk meg.

Al-Biruni ezt a módszert különféle területeken alkalmazta, beleértve a modern Afganisztán területén található Ghazni város hosszúsági fokának kiszámítását, valamint a fémek tulajdonságainak tanulmányozásában.

Az utóbbi néhány évszázadban azonban a szélsőségek fele összegét egyre ritkábban alkalmazták. Valójában a modern tudományban ez egyáltalán nem releváns. A medián érték felváltotta a félösszeget.

Átmenet az átlagokra

A 19. század elejére a medián/átlag használata elterjedt módszerré vált a legpontosabban reprezentatív érték megtalálására egy adatcsoportból. Friedrich von Gauss, korának kiemelkedő matematikusa ezt írta 1809-ben: „Azt hitték, hogy ha egy bizonyos számot több, azonos feltételek mellett végzett közvetlen megfigyelés határoz meg, akkor a számtani átlag a legigazabb érték. Ha nem egészen szigorú, akkor legalább közel áll a valósághoz, és ezért mindig lehet rá támaszkodni.

Miért történt ekkora módszerváltás?

Erre a kérdésre meglehetősen nehéz válaszolni. Churchill Eisenhart kutatásaiban azt sugallja, hogy a számtani átlag megtalálásának módszere a mágneses eltérés mérésének területéből eredhetett, vagyis az iránytű északra mutató és a valós északi iránya közötti különbség megtalálásából. Ez a mérés rendkívül fontos volt a felfedezések korában.

Eisenhart úgy találta, hogy a 16. század végéig a mágneses eltérést mérő tudósok többsége az ad hoc módszert (a latinból "erre, erre az alkalomra, erre a célra") alkalmazta a legpontosabb mérés kiválasztásához.

1580-ban azonban William Borough tudós másként közelítette meg a problémát. Nyolc különböző elhajlási mérést végzett, és összehasonlította őket, és arra a következtetésre jutott, hogy a legpontosabb leolvasás 11 ⅓ és 11 ¼ fok között volt. Valószínűleg kiszámolta a számtani átlagot, ami ebben a tartományban volt. Maga Borough azonban nem nevezte nyíltan az új módszert.

1635 előtt egyáltalán nem volt egyértelmű eset az átlagérték reprezentatív számként való használatára. Ekkor azonban Henry Gellibrand angol csillagász két különböző mérést végzett a mágneses elhajlásról. Az egyik délelőtt készült (11 fok), a másik délután (11 fok és 32 perc). A legigazibb értéket kiszámolva ezt írta:

"Ha megtaláljuk a számtani átlagot, nagy valószínűséggel azt mondhatjuk, hogy a pontos mérés eredménye körülbelül 11 fok 16 perc lesz."

Valószínűleg ez volt az első alkalom, hogy az átlagot használták az igazhoz legközelebb esőnek!

Az "átlagos" szót az angol nyelvben a 16. század elején használták a hajó vagy a rakomány utazása során elszenvedett károk miatti anyagi veszteségekre. A következő száz évben pontosan ezeket a veszteségeket jelölte, amelyeket számtani átlagként számítottak ki. Például, ha egy hajó megsérült egy út során, és a legénységnek néhány árut a fedélzetre kellett dobnia, hogy megmentse a hajó súlyát, a befektetőket a befektetésük összegével megegyező anyagi veszteség érte – ezeket a veszteségeket ugyanúgy számították ki, mint a számtani átlag. Így fokozatosan az átlag (átlag) és a számtani átlag értékei konvergáltak.

Medián érték

Manapság az átlagot vagy a számtani átlagot használják fő módszerként egy mérési halmaz reprezentatív értékének kiválasztására. Hogy történt? Miért nem a medián értékhez rendelték ezt a szerepet?

Francis Galton volt a medián bajnok

A „medián érték” (medián) kifejezés – egy számsor középső tagja, amely ezt a sorozatot felére osztja – nagyjából egy időben jelent meg a számtani átlaggal. 1599-ben Edward Wright matematikus, aki az iránytű normál eltérésének problémáján dolgozott, először javasolta a mediánérték használatát.

„... Tegyük fel, hogy sok íjász lő valamilyen célba. A célt ezt követően eltávolítják. Hogyan lehet megtudni, hol volt a célpont? Meg kell találnia a középső helyet az összes nyíl között. Ugyanígy a megfigyelések eredményhalmaza közül is az lesz a legközelebb az igazsághoz, amelyik középen van.

A mediánt a 19. században széles körben használták, és akkoriban minden adatelemzés nélkülözhetetlen részévé vált. Francis Galton, a kiváló tizenkilencedik századi elemző is használta. A cikk elején található bikamérleg-történetben Galton eredetileg a mediánt használta a tömeg véleményének kifejezésére.

Sok elemző, köztük Galton, a mediánt részesítette előnyben, mert könnyebb kiszámítani kisebb adatkészletekre.

A medián azonban soha nem volt népszerűbb az átlagnál. Valószínűleg ez az átlagértékben rejlő speciális statisztikai tulajdonságok, valamint a normális eloszlással való kapcsolata miatt következett be.

Az átlag és a normál eloszlás kapcsolata

Ha sok mérést végzünk, az eredmények, ahogy a statisztikusok mondják, "normális eloszlásúak". Ez azt jelenti, hogy ha ezeket az adatokat egy grafikonon ábrázoljuk, akkor a rajta lévő pontok valami haranghoz hasonlót ábrázolnak. Ha összekapcsolja őket, egy "harang alakú" görbét kap. Sok statisztikai adat megfelel a normál eloszlásnak, például az emberek magassága, az IQ és a legmagasabb éves hőmérséklet.

Ha az adatok normális eloszlásúak, akkor az átlag nagyon közel lesz a haranggörbe legmagasabb pontjához, és nagyon sok mérés lesz közel az átlaghoz. Még egy képlet is megjósolja, hogy hány mérés lesz bizonyos távolságra az átlagtól.

Így az átlag kiszámítása sok további információt ad a kutatóknak.

Az átlagnak a szóráshoz való viszonya nagy előnyt jelent, mivel a mediánnak nincs ilyen kapcsolata. Ez a kapcsolat fontos része a kísérleti adatok elemzésének és az információ statisztikai feldolgozásának. Ezért vált az átlag a statisztika és minden olyan tudomány magjává, amely több adatra támaszkodik következtetéseihez.

Az átlag előnye annak is köszönhető, hogy számítógépekkel könnyen kiszámítható. Bár az adatok kis csoportjának mediánértékét meglehetősen könnyű önállóan kiszámítani, sokkal könnyebb olyan számítógépes programot írni, amely megtalálja az átlagos értéket. Ha Microsoft Excelt használ, valószínűleg tudja, hogy a medián függvény kiszámítása nem olyan egyszerű, mint az átlagérték függvény.

Ennek eredményeként nagy tudományos értéke és könnyű kezelhetősége miatt az átlagérték vált a fő reprezentatív értékké. Ez a lehetőség azonban nem mindig a legjobb.

A medián érték előnyei

Sok esetben, amikor egy eloszlás középpontját szeretnénk kiszámítani, a medián a legjobb mérőszám. Az átlagértéket ugyanis nagyrészt az extrém mérések határozzák meg.

Sok elemző úgy véli, hogy az átlag meggondolatlan használata negatívan befolyásolja a mennyiségi információk megértését. Az emberek az átlagot nézik, és azt gondolják, hogy ez "normális". De valójában egy olyan kifejezéssel definiálható, amely erősen kiemelkedik a homogén sorozatból.

Képzeljünk el egy elemzőt, aki öt ház értékére szeretne reprezentatív értéket tudni. Négy ház 100 000 dollárt, az ötödik 900 000 dollárt ér. Ekkor az átlag 200 000 dollár, a medián pedig 100 000 dollár lenne. Ebben, mint sok más esetben, a medián érték jobban megérti azt, hogy mit nevezhetünk „standardnak”.

Annak megértése, hogy a szélsőséges értékek hogyan befolyásolhatják az átlagot, a medián értéket az Egyesült Államok háztartási jövedelmének változásaira használják.

A medián kevésbé érzékeny azokra a "piszkos" adatokra is, amelyekkel ma az elemzők foglalkoznak. Sok statisztikus és elemző gyűjt információkat azáltal, hogy embereket kérdez ki az interneten. Ha a felhasználó véletlenül plusz nullát ad a válaszhoz, ami 100-ból 1000-re változik, akkor ez a hiba sokkal jobban befolyásolja az átlagot, mint a medián.

Átlag vagy medián?

A medián és az átlag közötti választásnak messzemenő következményei vannak, kezdve a gyógyszerek egészségre gyakorolt ​​hatásaival kapcsolatos ismereteinktől egészen a család szokásos költségvetésének ismeretéig.

Ahogy az adatok gyűjtése és elemzése egyre inkább meghatározza, hogyan értjük a világot, úgy változik a felhasznált mennyiségek értéke is. Egy ideális világban az elemzők az átlagot és a mediánt is felhasználnák az adatok ábrázolásához.

De korlátozott idő és figyelem körülményei között élünk. E korlátok miatt gyakran csak egyet kell választanunk. És sok esetben a medián érték előnyösebb.

KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2022 "kingad.ru" - az emberi szervek ultrahangvizsgálata