A mintaadatok mediánja. Medián függvény az Excelben statisztikai elemzés elvégzéséhez

Az átlagértékekkel együtt a strukturális átlagokat az eloszlások variációs sorozatainak statisztikai jellemzőiként számítjuk ki - divatÉs középső.
Divat(Mo) a vizsgált jellemző értékét jelenti, a legnagyobb gyakorisággal ismételve, azaz. mód – a leggyakrabban előforduló jellemző értéke.
Középső(Me) annak az attribútumnak az értéke, amely a rangsorolt ​​(rendezett) sokaság közepére esik, azaz. a medián egy variációs sorozat központi értéke.
A medián fő tulajdonsága, hogy az attribútumértékek abszolút eltéréseinek összege a mediántól kisebb, mint bármely más értéktől ∑|x i - Me|=min.

Mód és medián meghatározása csoportosítatlan adatokból

Mérlegeljük mód és medián meghatározása csoportosítatlan adatokból. Tegyük fel, hogy egy 9 fős munkacsoport a következő tarifakategóriákkal rendelkezik: 4 3 4 5 3 3 6 2 6. Mivel ebben a brigádban van a legtöbb 3. kategória dolgozója, ez a tarifakategória modális lesz. Mo = 3.
A medián meghatározásához rangsorolást kell végezni: 2 3 3 3 4 4 5 6 6 . Ebben a sorozatban a központi dolgozó a 4. kategória dolgozója, ezért ez a kategória lesz a medián. Ha a rangsorolt ​​sorozat páros számú egységet tartalmaz, akkor a mediánt a két központi érték átlagaként definiáljuk.
Ha a módusz az attribútumérték legáltalánosabb változatát tükrözi, akkor a medián gyakorlatilag az átlag függvényeit látja el egy heterogén sokaság esetében, amely nem engedelmeskedik a normál eloszlási törvénynek. Illusztráljuk kognitív jelentőségét a következő példával.
Tegyük fel, hogy jellemeznünk kell egy 100 fős embercsoport átlagjövedelmét, akik közül 99 fő havi jövedelme 100-200 dollár között mozog, utóbbiak havi jövedelme pedig 50 000 dollár (1. táblázat).
1. táblázat - A vizsgált embercsoport havi jövedelme. Ha a számtani átlagot használjuk, akkor körülbelül 600-700 dolláros átlagjövedelmet kapunk, aminek nem sok köze van a csoport nagy részének jövedelméhez. A medián, amely ebben az esetben egyenlő Me = 163 dollárral, lehetővé teszi számunkra, hogy objektív leírást adjunk ennek az embercsoportnak a jövedelmi szintjéről.
Vegyük fontolóra a módusz és medián meghatározását csoportosított adatok (eloszlási sorozatok) felhasználásával.
Tegyük fel, hogy a teljes vállalkozás dolgozóinak tarifakategóriák szerinti megoszlása ​​a következő (2. táblázat).
2. táblázat - A vállalati dolgozók megoszlása ​​tarifakategóriák szerint

Módus és medián számítása diszkrét sorozatra

Módus és medián számítása intervallumsorokhoz

Módus és medián számítása egy variációs sorozathoz

Módus meghatározása diszkrét variációs sorozatból

A rendszer az attribútumértékek korábban összeállított sorozatát használja, érték szerint rendezve. Ha a minta mérete páratlan, akkor a központi értéket vesszük; ha a minta mérete páros, akkor a két központi érték számtani átlagát vesszük.
Módus meghatározása diszkrét variációs sorozatból: az 5. tarifakategória a legmagasabb gyakorisággal (60 fő), ezért modális. Mo = 5.
Egy jellemző mediánértékének meghatározásához a sorozat medián egységének számát (N Me) a következő képlettel találjuk meg: , ahol n a sokaság térfogata.
A mi esetünkben: .
Az így kapott törtérték, amely mindig akkor fordul elő, ha a sokaságban lévő egységek száma páros, azt jelzi, hogy a pontos felezőpont 95 és 96 dolgozó között van. Meg kell határozni, hogy az ilyen sorszámú dolgozók melyik csoportba tartoznak. Ezt a felhalmozott frekvenciák kiszámításával lehet megtenni. Az első csoportban, ahol mindössze 12 fő, nincs ilyen létszámú dolgozó, a másodikban pedig nincs (12+48=60). A 95. és 96. dolgozók a harmadik csoportba tartoznak (12+48+56=116), így a medián a 4. tarifakategória.

Módus és medián számítása intervallumsorokban

A diszkrét variációs sorozatokkal ellentétben a módusz és a medián intervallumsorokból történő meghatározása bizonyos számításokat igényel a következő képletek alapján:
, (5.6)
Ahol x 0– a modális intervallum alsó határa (a legmagasabb gyakoriságú intervallumot modálisnak nevezzük);
én– a modális intervallum értéke;
f Mo– a modális intervallum gyakorisága;
f Mo -1– a modálist megelőző intervallum gyakorisága;
f Mo +1– a modálist követő intervallum gyakorisága.
(5.7)
Ahol x 0– a medián intervallum alsó határa (a medián az az első intervallum, amelynek összesített gyakorisága meghaladja a frekvenciák összösszegének felét);
én– a medián intervallum értéke;
S Én -1– a mediánt megelőző halmozott intervallum;
f Én– a medián intervallum gyakorisága.
Szemléltessük e képletek alkalmazását a táblázat adataival! 3.
Ebben az eloszlásban a 60 – 80 határú intervallum modális lesz, mert ennek van a legmagasabb frekvenciája. Az (5.6) képlet segítségével definiáljuk a módot:

A medián intervallum megállapításához meg kell határozni minden további intervallum halmozott gyakoriságát, amíg az meg nem haladja a halmozott gyakoriságok összegének felét (esetünkben az 50%-ot) (5.11. táblázat).
Megállapították, hogy a medián az az intervallum, amelynek határai 100-120 ezer rubel. Határozzuk meg most a mediánt:

3. táblázat - Az Orosz Föderáció lakosságának megoszlása ​​az egy főre jutó átlagos nominális monetáris jövedelem szintje szerint 1994 márciusában.
Csoportok az egy főre jutó átlagos havi jövedelem szintje szerint, ezer rubel.Lakossági részesedés, %
Legfeljebb 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Több mint 3007,7
Teljes100,0

4. táblázat – A medián intervallum meghatározása
Így a számtani átlag, mód és medián használható egy adott attribútum értékeinek általánosított jellemzőjeként egy rangsorolt ​​sokaság egységeihez.
Az eloszlási központ fő jellemzője a számtani átlag, amelyre az jellemző, hogy az ettől való összes eltérés (pozitív és negatív) nullát ad. A mediánra jellemző, hogy az ettől való eltérések összege moduluszban minimális, a módusz pedig a leggyakrabban előforduló attribútum értéke.
A módusz, a medián és a számtani átlag aránya jelzi a jellemző eloszlásának jellegét az aggregátumban, és lehetővé teszi annak aszimmetriájának felmérését. A szimmetrikus eloszlásokban mindhárom jellemző egybeesik. Minél nagyobb az eltérés a módusz és a számtani átlag között, annál aszimmetrikusabb a sorozat. Mérsékelten aszimmetrikus sorozatok esetén a módusz és a számtani átlag közötti különbség körülbelül háromszor nagyobb, mint a medián és az átlag közötti különbség, azaz:
|Mo –`x| = 3 |Me –`x|.

Módus és medián meghatározása grafikus módszerrel

Egy intervallumsorozat módusa és mediánja grafikusan meghatározható. A módot az eloszlási hisztogram határozza meg. Ehhez válassza ki a legmagasabb téglalapot, amely ebben az esetben modális. Ezután a modális téglalap jobb oldali csúcsát összekötjük az előző téglalap jobb felső sarkával. És a modális téglalap bal csúcsa - a következő téglalap bal felső sarkával. A metszéspontjukból leengedjük az abszcissza tengelyre merőlegest. Ezen egyenesek metszéspontjának abszcisszája lesz az eloszlási mód (5.3. ábra).


Rizs. 5.3. Az üzemmód grafikus meghatározása hisztogram segítségével.


Rizs. 5.4. A medián grafikus meghatározása kumulátum alapján
A medián meghatározásához a halmozott frekvenciák (frekvenciák) skáláján az 50%-nak megfelelő pontból egy egyenes vonalat húzunk párhuzamosan az abszcissza tengellyel, amíg az nem metszi a kumulátumot. Ezután a metszéspontból egy merőlegest leeresztünk az x tengelyre. A metszéspont abszcisszája a medián.

Kvartilis, decilis, percentilis

Hasonlóképpen, ha az eloszlás variációs sorozatában megtalálja a mediánt, megkeresheti az attribútum értékét a rangsorolt ​​sorozat bármely egységéhez. Így például megtalálhatja az attribútum értékét olyan egységeknél, amelyek egy sorozatot négy egyenlő részre, 10 vagy 100 részre osztanak. Ezeket az értékeket „kvartilisnek”, „decilisnek”, „percentilisnek” nevezik.
A kvartilisek egy olyan jellemző értékét jelentik, amely a rangsorolt ​​sokaságot 4 egyenlő részre osztja.
Van egy alsó kvartilis (Q 1), amely az attribútum legalacsonyabb értékeivel rendelkező populáció ¼-ét választja el, és egy felső kvartilis (Q 3), amely az attribútum legmagasabb értékeivel rendelkező rész ¼ részét választja el. Ez azt jelenti, hogy a sokaságban lévő egységek 25%-a kisebb lesz Q 1 értékben; az egységek 25%-a Q 1 és Q 2 között lesz; 25% Q 2 és Q 3 között van, a maradék 25% pedig meghaladja a Q 3-at. A Q2 középső negyede a medián.
A kvartilisek intervallumvariációs sorozatok segítségével történő kiszámításához a következő képleteket kell használni:
, ,
Ahol x Q 1– az alsó kvartilist tartalmazó intervallum alsó határa (az intervallumot a halmozott gyakoriság határozza meg, az első meghaladja a 25%-ot);
x Q 3– a felső kvartilist tartalmazó intervallum alsó határa (az intervallumot a halmozott gyakoriság határozza meg, az első meghaladja a 75%-ot);
én– intervallum mérete;
S Q 1-1– az alsó kvartilist tartalmazó intervallumot megelőző intervallum felhalmozott gyakorisága;
S Q 3-1– a felső kvartilist tartalmazó intervallumot megelőző intervallum felhalmozott gyakorisága;
f Q 1– az alsó kvartilist tartalmazó intervallum gyakorisága;
f Q 3– a felső kvartilist tartalmazó intervallum gyakorisága.
Tekintsük az alsó és felső kvartilis számítását a táblázat adatai szerint. 5.10. Az alsó kvartilis a 60-80 tartományba esik, ennek kumulatív gyakorisága 33,5%. A felső kvartilis a 160-180 tartományba esik, 75,8%-os halmozott gyakorisággal. Ezt figyelembe véve a következőket kapjuk:
,
.
Az eloszlás variációs tartományaiban a kvartiliseken kívül decilisek is meghatározhatók - olyan opciók, amelyek a rangsorolt ​​variációs sorozatot tíz egyenlő részre osztják. Az első decilis (d 1) osztja a népességet 1/10 és 9/10 arányban, a második decilis (d 1) - 2/10 és 8/10 arányban stb.
Kiszámításuk a következő képletekkel történik:
, .
Azokat a karakterisztikus értékeket, amelyek a sorozatot száz részre osztják, százalékosoknak nevezzük. A mediánok, kvartilisek, decilisek és percentilisek arányait az ábra mutatja be. 5.5.

A fizetések a gazdaság különböző ágazataiban, a hőmérséklet és a csapadék szintje ugyanazon a területen összehasonlítható időszakokra, a különböző földrajzi régiókban termesztett növények termése stb. Az átlag azonban korántsem az egyetlen általánosító mutató - bizonyos esetekben a pontosabb értékeléshez megfelelő érték a medián. A statisztikában széles körben használják a jellemző egy adott populációban való eloszlásának kiegészítő leíró jellemzőjeként. Nézzük meg, miben különbözik az átlagostól, és azt is, hogy miért szükséges használni.

Medián a statisztikában: meghatározás és tulajdonságok

Képzeljük el a következő helyzetet: 10 ember dolgozik egy cégnél az igazgatóval együtt. Az egyszerű munkások 1000 UAH-t kapnak, a vezetőjük, aki egyben a tulajdonos is, 10 000 UAH-t. Ha kiszámoljuk a számtani átlagot, akkor kiderül, hogy ennél a vállalkozásnál az átlagos fizetés 1900 UAH. Vajon igaz lesz ez az állítás? Vagy vegyük ezt a példát: ugyanazon a kórházi osztályon kilenc ember 36,6 °C-os, és egy személy 41 °C-os. A számtani átlag ebben az esetben egyenlő: (36,6*9+41)/10 = 37,04 °C. De ez nem jelenti azt, hogy minden jelenlévő beteg. Mindez azt sugallja, hogy az átlag önmagában sokszor nem elég, és ezért mellette a mediánt is alkalmazzák. A statisztikákban ezt a mutatót nevezik annak az opciónak, amely pontosan a rendezett variációs sorozat közepén található. Ha a példáinkra kiszámoljuk, 1000 UAH-t kapunk, ill. és 36,6 °C. Más szóval, a medián a statisztikában olyan érték, amely egy sorozatot úgy oszt fel, hogy annak mindkét oldalán (lefelé vagy felfelé) ugyanannyi egység van egy adott sokaságban. E tulajdonság miatt ennek a mutatónak több más neve is van: 50. percentilis vagy 0,5 kvantilis.

Hogyan találjuk meg a mediánt a statisztikákban

Ennek az értéknek a kiszámításának módja nagyban függ attól, hogy milyen típusú variációs sorozatunk van: diszkrét vagy intervallum. Az első esetben a medián egész egyszerűen megtalálható a statisztikákban. Csak annyit kell tennie, hogy meg kell keresnie a frekvenciák összegét, el kell osztania 2-vel, majd hozzáadnia kell ½-t az eredményhez. Legjobb lenne a számítási elvet a következő példa segítségével elmagyarázni. Tegyük fel, hogy csoportosítottuk a termékenységre vonatkozó adatokat, és szeretnénk megtudni, mi a medián.

Családi csoportszám gyermeklétszám szerint

Családok száma

Néhány egyszerű számítás után azt találjuk, hogy a szükséges mutató: 195/2 + ½ = opció. Annak érdekében, hogy megtudja, mit jelent ez, szekvenciálisan fel kell halmoznia a frekvenciákat, kezdve a legkisebb opciókkal. Tehát az első két sor összege 30-at ad. Nyilvánvaló, hogy itt nincs 98 lehetőség. De ha az eredményhez hozzáadja a harmadik lehetőség gyakoriságát (70), akkor 100-nak megfelelő összeget kap. Pontosan a 98. opciót tartalmazza, ami azt jelenti, hogy a medián egy kétgyermekes család lesz.

Ami az intervallumsort illeti, általában a következő képletet használják:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me, amelyben:

  • X Me - a medián intervallum első értéke;
  • ∑f - sorozatok száma (frekvenciáinak összege);
  • i Ме - a medián tartomány értéke;
  • f Me - a medián tartomány frekvenciája;
  • S Ме-1 a mediánt megelőző tartományok kumulatív gyakoriságainak összege.

Megint elég nehéz megérteni példa nélkül. Tegyük fel, hogy vannak adatok az értékről

Fizetés, ezer rubel.

Felhalmozott frekvenciák

A fenti képlet használatához először meg kell határoznunk a medián intervallumot. Ilyen tartományként válassza azt, amelyiknek a felhalmozott frekvenciája meghaladja a frekvenciák teljes összegének felét, vagy egyenlő vele. Tehát, elosztva 510-et 2-vel, azt találjuk, hogy ez a kritérium megfelel a 250 000 rubel fizetési értékű intervallumnak. legfeljebb 300 000 rubel. Most behelyettesítheti az összes adatot a képletbe:

M e = X Me + i Me * (∑f / 2 - S Me-1) / f Me = 250 + 50 * (510/2 - 170) / 115 = 286,96 ezer rubel.

Reméljük, hogy cikkünk hasznos volt, és most már világosan megértette, mi a medián a statisztikákban, és hogyan kell kiszámítani.

A medián kiszámításához MS EXCEL-ben van egy speciális MEDIAN() függvény. Ebben a cikkben meghatározzuk a mediánt, és megtanuljuk, hogyan lehet kiszámítani egy mintára és egy valószínűségi változó adott eloszlási törvényére.

Kezdjük azzal mediánok Mert minták(azaz fix értékkészletre).

Minta medián

Középső(medián) egy szám, amely egy számhalmaz közepe: a halmazban lévő számok fele nagyobb, mint középső, és a számok fele kisebb, mint középső.

Számolni mediánok először szükséges (értékek minta). Például, középső mintához (2; 3; 3; 4 ; 5; 7; 10) lesz 4. Mert csak be minta 7 érték, közülük három kisebb, mint 4 (azaz 2; 3; 3), és három érték nagyobb (azaz 5; 7; 10).

Ha a halmaz páros számú számot tartalmaz, akkor a halmaz közepén lévő két számra kerül kiszámításra. Például, középső mintához (2; 3; 3 ; 6 ; 7; 10) 4,5 lesz, mert (3+6)/2=4,5.

Meghatározására mediánok az MS EXCEL-ben van egy azonos nevű függvény MEDIAN(), a MEDIAN() angol változata.

Középső nem feltétlenül esik egybe a -val. Egyezés csak akkor következik be, ha a mintában szereplő értékek szimmetrikusan oszlanak el a következőhöz képest átlagos. Például azért minták (1; 2; 3 ; 4 ; 5; 6) középsőÉs átlagos egyenlő 3,5.

Ha ismert Elosztási funkció F(x) vagy valószínűségi sűrűségfüggvény p(X), Azt középső az egyenletből megtalálható:

Például, ha ezt az egyenletet analitikusan megoldottuk az lnN(μ; σ 2) lognormális eloszlásra, azt kapjuk, hogy középső az =EXP(μ) képlettel számítjuk ki. Ha μ=0, akkor a medián 1.

Ügyeljen a lényegre Elosztási funkciók, amelyekre F(x) = 0,5(lásd a fenti képet) . Ennek a pontnak az abszcisszája egyenlő 1-gyel. Ez a medián értéke, amely természetesen egybeesik az em képlet segítségével korábban számított értékkel.

MS EXCEL-ben középső Mert lognormális eloszlás LnN(0;1) kiszámítható a képlet segítségével =LOGNORM.REV(0,5;0;1).

jegyzet: Emlékezzünk vissza, hogy az integrálja a valószínűségi változó megadásának teljes tartományában egyenlő eggyel.

Ezért a medián egyenes (x=Medián) felosztja a grafikon alatti területet valószínűségi sűrűségfüggvények két egyenlő részre.

Tekintettel arra, hogy a kutató nem rendelkezik adatokkal az egyes pénzváltók értékesítési volumenéről, nem praktikus a számtani átlag kiszámítása az átlagos dollárár meghatározásához.

Számsorozat mediánja

Azonban meg lehet határozni az attribútum értékét, amelyet mediánnak (Me) nevezünk. Középső

példánkban

Medián szám: NoMe = ;

Divat

3.6. táblázat.

f— a sorozat frekvenciáinak összege;

S kumulatív frekvenciák

12_

_

S – felhalmozott frekvenciák.

ábrán. 3.2. Az ábrán a bankok haszonkulcs szerinti megoszlásának hisztogramja látható (3.6. táblázat szerint).

x - nyereség összege, millió rubel,

f a bankok száma.

"MEGRENDELT SOROZAT KÖZÉPE"

A kiadvány szöveges HTML-változata


Algebra órajegyzetek 7. osztályban

Az óra témája: „EGY MEGRENDELT SOROZAT KÖZÉPÉNEK”.

az Ozyornaya iskola tanára, az MCOU Burkovskaya középiskola filiája Eremenko Tatyana Alekseevna
Célok:
a medián fogalma, mint egy rendezett sorozat statisztikai jellemzője; fejleszteni kell a páros és páratlan számú tagú rendezett sorozatok mediánjának megtalálásának képességét; a medián értékeinek gyakorlati helyzettől függően értelmezésének képességének fejlesztése, egy számhalmaz számtani középértéke fogalmának megszilárdítása. Az önálló munkavégzés készségeinek fejlesztése. Fejlessze érdeklődését a matematika iránt.
Az órák alatt

Szóbeli munka.
A sorok a következők: 1) 4; 1; 8; 5; 1; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7,3; 6. Keresse meg: a) az egyes sorozatok legnagyobb és legkisebb értékét; b) az egyes sorok hatókörét; c) az egyes sorok módját.
II. Új anyag magyarázata.
Dolgozzon a tankönyv szerint. 1. Tekintsük a problémát a tankönyv 10. bekezdéséből. Mit jelent a megrendelt sorozat? Szeretném hangsúlyozni, hogy a medián megtalálása előtt mindig meg kell rendelni az adatsorokat. 2. A táblán megismerkedünk a páros és páratlan számú tagú sorozatok mediánjának megtalálásának szabályaival:
Középső

szabályos

sor
számok
Val vel

páratlan

szám

tagjai

a közepére írt szám, és
középső

megrendelt sorozat
számok
páros számú taggal
a közepére írt két szám számtani középértékének nevezzük.
Középső

tetszőleges

sor
a megfelelő rendezett sorozat 1 3 1 7 5 4 mediánjának nevezzük.
Megjegyzem, hogy a mutatók a számtani átlag, módus és medián szerint

eltérően

jellemez

adat,

kapott

eredmény

megfigyelések.

III. A készségek és képességek kialakulása.
1. csoport. Gyakorlatok rendezett és rendezetlen sorozat mediánjának meghatározására szolgáló képletek alkalmazására. 1.
№ 186.
Megoldás: a) A sorozat tagjainak száma P= 9; középső Meh= 41; b) P= 7, a sor rendezett, Meh= 207; V) P= 6, a sor rendezett, Meh= = 21; G) P= 8, a sor rendezett, Meh= = 2,9. Válasz: a) 41; b) 207; 21-kor; d) 2.9. A tanulók kommentálják, hogyan találják meg a mediánt. 2. Határozza meg egy számsorozat számtani középértékét és mediánját: a) 27, 29, 23, 31, 21, 34; V) ; 1. b) 56, 58, 64, 66, 62, 74. Megoldás: A medián megkereséséhez az egyes sorokat sorrendbe kell rendezni: a) 21, 23, 27, 29, 31, 34. P = 6; x = = 27,5; Meh= = 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Hogyan találjuk meg a mediánt a statisztikákban

P = 6; x = 63,3; Meh= = 63; V) ; 1. P = 5; x = : 5 = 3: 5 = 0,6; Meh = . 3.
№ 188
(orálisan). Válasz: igen; b) nem; c) nem; d) igen. 4. Tudva, hogy egy rendezett sorozat tartalmaz T számok, hol T– páratlan szám, adja meg annak a tagnak a számát, amely a medián if T egyenlő: a) 5; b) 17; c) 47; d) 201. Válasz: a) 3; b) 9; c) 24; d) 101. 2. csoport. Gyakorlati feladatok a megfelelő sorozat mediánjának megtalálásához és a kapott eredmény értelmezéséhez. 1.
№ 189.
Megoldás: A sorozat tagjainak száma P= 12. A medián megtalálásához a sorozatokat a következő sorrendben kell megadni: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. A sorozat mediánja Meh= = 176. A havi kibocsátás nagyobb volt, mint a medián az artel következő tagjainál: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125 ; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 178 178 xx+ + = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rilov; 3) Antonov; 6) Asztafjev. Válasz: 176. 2.
№ 192.
Megoldás: Tegyük sorba az adatsorokat: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; sorozat tagjainak száma P= 20. Swing A = x max - x min = 42 – 30 = 12. Divat Mo= 32 (ez az érték 6-szor fordul elő - gyakrabban, mint mások). Középső Meh= = 35. Ebben az esetben a tartomány mutatja a legnagyobb eltérést az alkatrész feldolgozási idejében; a mód a legjellemzőbb feldolgozási időértéket mutatja; medián – feldolgozási idő, amelyet az esztergályosok fele nem lépte túl. Válasz: 12; 32; 35.
IV. Óra összefoglalója.
– Hogyan nevezzük egy számsor mediánját? – Egy számsor mediánja nem eshet egybe a sorozat egyik számával? – Milyen szám mediánja egy 2-t tartalmazó rendezett sorozatnak? P számok? 2 P– 1 szám? – Hogyan lehet megtalálni egy rendezetlen sorozat mediánját?
Házi feladat:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

Az alapfokú általános műveltség rovathoz

Mód és medián

Az átlagos értékek tartalmazzák a módot és a mediánt is.

A mediánt és a módust gyakran használják átlagjellemzőként azokban a populációkban, ahol az átlag kiszámítása (számtani, harmonikus stb.) lehetetlen vagy nem praktikus.

Például egy 12 omszki kereskedelmi valutaváltási iroda mintavételes felmérése lehetővé tette, hogy a dollár eladása során eltérő árakat rögzítsenek (az 1995. október 10-i adatok a dollár árfolyamán -4493 rubel).

Tekintettel arra, hogy a kutató nem rendelkezik adatokkal az egyes pénzváltók értékesítési volumenéről, nem praktikus a számtani átlag kiszámítása az átlagos dollárár meghatározásához. Azonban meg lehet határozni az attribútum értékét, amelyet mediánnak (Me) nevezünk. Középső a rangsor közepén fekszik, és kettéosztja.

A csoportosítatlan adatok mediánjának kiszámítása a következő:

a) rendezze a jellemző egyedi értékeit növekvő sorrendbe:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) határozza meg a medián sorszámát a következő képlettel:

példánkban ez azt jelenti, hogy a medián ebben az esetben az attribútum hatodik és hetedik értéke között helyezkedik el a rangsorolt ​​sorozatban, mivel a sorozatnak páros számú egyedi értéke van. Így Me egyenlő a szomszédos értékek számtani átlagával: 4550, 4560.

c) mérlegelje a medián kiszámításának eljárását páratlan számú egyedi érték esetén.

Tegyük fel, hogy nem 12, hanem 11 valutaváltási pontot figyelünk meg, ekkor a rangsorolt ​​sorozat így fog kinézni (a 12. pontot el kell vetni):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Medián szám: NoMe = ;

a hatodik helyen = 4560, ami a medián: én = 4560. Mindkét oldalán ugyanannyi pont található.

Divat— ez a jellemző legáltalánosabb értéke egy adott sokaság egységei között. Egy adott attribútumértéknek felel meg.

Esetünkben a dolláronkénti modális árat 4560 rubelnek nevezhetjük: ez az érték 4-szer ismétlődik, gyakrabban, mint az összes többi.

A gyakorlatban a módust és a mediánt általában csoportosított adatok felhasználásával találjuk meg. A csoportosítás eredményeként egy sor banki felosztást kaptunk az év során befolyt eredmény mértéke szerint (3.6. táblázat).

3.6. táblázat.

A bankok csoportosítása az év során befolyt nyereség összege szerint

A medián meghatározásához ki kell számítania a kumulatív gyakoriságok összegét. A teljes növekedés addig tart, amíg a frekvenciák kumulált összege meg nem haladja a frekvenciák összegének felét. Példánkban a felhalmozott frekvenciák összege (12) meghaladja az összes érték felét (20:2). Ez az érték a medián intervallumnak felel meg, amely a mediánt tartalmazza (5,5 - 6,4). Határozzuk meg az értékét a képlet segítségével:

ahol a mediánt tartalmazó intervallum kezdeti értéke;

— a medián intervallum értéke;

f— a sorozat frekvenciáinak összege;

— a medián intervallumot megelőző kumulatív gyakoriságok összege;

— a medián intervallum gyakorisága.

Így a bankok 50%-ának 6,1 millió rubel a nyeresége, a bankok 50%-ának pedig több mint 6,1 millió rubel.

A legmagasabb frekvencia szintén az 5,5 - 6,4 intervallumnak felel meg, azaz. a módnak ebben az intervallumban kell lennie. Értékét a következő képlettel határozzuk meg:

ahol a módust tartalmazó intervallum kezdőértéke;

— a modális intervallum értéke;

— a modális intervallum gyakorisága;

— a modált megelőző intervallum gyakorisága;

— a modálist követő intervallum gyakorisága.

A megadott módusképlet egyenlő időközökkel variációs sorozatokban használható.

Így ebben a populációban a leggyakoribb nyereség nagysága 6,10 millió rubel.

A medián és a módus grafikusan meghatározható. A mediánt a kumulátum határozza meg (3.1. ábra). Ennek elkészítéséhez ki kell számítani a kumulatív frekvenciákat és frekvenciákat. A kumulatív gyakoriságok azt mutatják meg, hogy hány populációs egységnek van olyan attribútumértéke, amely nem nagyobb, mint a vizsgált érték, és az intervallumgyakoriságok szekvenciális összegzésével határozzák meg. A kumulatív intervallum eloszlás sorozat felépítésénél az első intervallum alsó határa nullával egyenlő gyakoriságnak, felső határa pedig egy adott intervallum teljes frekvenciájának felel meg. A második intervallum felső határa egy kumulatív frekvenciának felel meg, amely megegyezik az első két intervallum frekvenciáinak összegével stb.

Készítsünk kumulatív görbét a táblázat adatai alapján. 6 a bankok haszonkulcs szerinti megoszlásáról.

S kumulatív frekvenciák

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X nyereség

Rizs. 3.1. A bankok eloszlási sorozatának kumulátumai haszonkulcs szerint:

x - nyereség összege, millió rubel,

S – felhalmozott frekvenciák.

A medián meghatározásához a legnagyobb ordináta magasságát, amely megfelel a teljes populáció méretének, fel kell osztani. Az eredményül kapott ponton az abszcissza tengellyel párhuzamos egyenes vonalat húzunk, amíg az nem metszi a kumulátumot. A metszéspont abszcisszája a medián.

A módot az eloszlási hisztogram határozza meg. A hisztogram a következőképpen épül fel:

Az abszcissza tengelyen egyenlő szegmenseket ábrázolunk, amelyek az elfogadott skálán megfelelnek a variációs sorozat intervallumainak méretének. A szegmensekre téglalapokat építünk, amelyek területei arányosak az intervallum gyakoriságával (vagy frekvenciáival).

Medián a statisztikákban

3.2. Az ábrán a bankok haszonkulcs szerinti megoszlásának hisztogramja látható (3.6. táblázat szerint).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X

Rizs. 3.2. A kereskedelmi bankok haszonkulcs szerinti megoszlása:

x - nyereség összege, millió rubel,

f a bankok száma.

A mód meghatározásához a modális téglalap jobb oldali csúcsát az előző téglalap jobb felső sarkához, a modális téglalap bal csúcsát pedig a következő téglalap bal felső sarkához kapcsoljuk. Ezen egyenesek metszéspontjának abszcisszája lesz az elosztási mód.

Medián (statisztika)

Medián (statisztika), a matematikai statisztikában egy mintát (például egy számhalmazt) jellemző szám. Ha az összes mintaelem különbözik, akkor a medián az a mintaszám, amelynél a mintaelemek pontosan fele nagyobb, a másik fele pedig kisebb nála. Általánosabban, a mediánt úgy találhatjuk meg, hogy a minta elemeit növekvő vagy csökkenő sorrendbe rendezzük, és a középső elemet vesszük. Például a minta (11, 9, 3, 5, 5) a rendezés után (3, 5, 5, 9, 11) lesz, mediánja pedig az 5. Ha a minta páros számú elemet tartalmaz, a a medián nem határozható meg egyértelműen: a numerikus adatokhoz leggyakrabban két szomszédos érték félösszegét használják (azaz a halmaz (1, 3, 5, 7) mediánját 4-nek vesszük).

Más szóval, a medián a statisztikában olyan érték, amely egy sorozatot úgy oszt fel, hogy annak mindkét oldalán (lefelé vagy felfelé) ugyanannyi egység van egy adott sokaságban.

1. számú feladat. Számtani átlag, modális és medián értékek számítása

E tulajdonság miatt ennek a mutatónak több más neve is van: 50. percentilis vagy 0,5 kvantilis.

  • Átlagos érték
  • Középső
  • Divat

Medián (statisztika)

Medián (statisztika), a matematikai statisztikában egy mintát (például egy számhalmazt) jellemző szám. Ha az összes mintaelem különbözik, akkor a medián az a mintaszám, amelynél a mintaelemek pontosan fele nagyobb, a másik fele pedig kisebb nála. Általánosabban, a mediánt úgy találhatjuk meg, hogy a minta elemeit növekvő vagy csökkenő sorrendbe rendezzük, és a középső elemet vesszük. Például a minta (11, 9, 3, 5, 5) a rendezés után (3, 5, 5, 9, 11) lesz, mediánja pedig az 5.

5.5 Módus és medián. Számításuk diszkrét és intervallum variációs sorozatokban

Ha páros számú elem van a mintában, akkor előfordulhat, hogy a medián nem határozható meg egyértelműen: numerikus adatoknál leggyakrabban két szomszédos érték félösszegét használják (vagyis a halmaz mediánját (1, 3, 5, 7) értéke 4).

Más szóval, a medián a statisztikában olyan érték, amely egy sorozatot úgy oszt fel, hogy annak mindkét oldalán (lefelé vagy felfelé) ugyanannyi egység van egy adott sokaságban. E tulajdonság miatt ennek a mutatónak több más neve is van: 50. percentilis vagy 0,5 kvantilis.

A mediánt akkor használjuk a számtani átlag helyett, ha a rangsorolt ​​sorozat szélső lehetőségei (legkisebb és legnagyobb) a többihez képest túl nagynak vagy túl kicsinek bizonyulnak.

A MEDIAN függvény a központi tendenciát méri, amely egy statisztikai eloszlásban egy számhalmaz középpontja. A központi tendencia meghatározásának három leggyakoribb módja van:

  • Átlagos érték- számtani átlag, amelyet úgy számítanak ki, hogy összeadják a számokat, majd elosztják a kapott összeget a számukkal.
    Például a 2, 3, 3, 5, 7 és 10 számok átlaga 5, ami a 30-as összegük 6-tal való elosztásának eredménye.
  • Középső- egy szám, amely egy számkészlet közepe: a számok felének értéke nagyobb, mint a medián, és a számok felének kisebb az értéke.
    Például a 2, 3, 3, 5, 7 és 10 számok mediánja 4 lenne.
  • Divat- az adott számkészletben leggyakrabban előforduló szám.
    Például a 2, 3, 3, 5, 7 és 10 számok üzemmódja 3 lenne.

Algebra óra 7. osztályban.

Téma: "A medián, mint statisztikai jellemző."

Tanár Egorova N.I.

A lecke célja: fogalmat alkotni a tanulókban egy számhalmaz mediánjáról és az egyszerű numerikus halmazok kiszámításának képességéről, megszilárdítani a számkészlet számtani átlagának fogalmát.

Az óra típusa: új tananyag magyarázata.

Az órák alatt

1. Szervezeti mozzanat.

Tájékoztassa az óra témáját, és fogalmazza meg céljait.

2. Korábbi ismeretek frissítése.

Kérdések diákoknak:

Mi egy számhalmaz számtani középértéke?

Hol található a számtani középérték a számok halmazán belül?

Mi jellemzi egy számhalmaz számtani középértékét?

Hol használják gyakran egy számhalmaz számtani középértékét?

Szóbeli feladatok:

Keresse meg egy számhalmaz számtani átlagát:

Házi feladat ellenőrzése.

Tankönyv: 169. sz., 172. sz.

3. Új anyag tanulmányozása.

Az előző leckében egy olyan statisztikai jellemzővel ismerkedtünk meg, mint egy számhalmaz számtani átlaga. Ma egy másik statisztikai jellemzőnek – a mediánnak – szentelünk leckét.

Nem csak a számtani átlag mutatja meg, hogy a számegyenesen hol találhatók bármely halmaz számai és hol van a középpontjuk. Egy másik mutató a medián.

Egy számhalmaz mediánja az a szám, amely a halmazt két egyenlő részre osztja. A „medián” helyett mondhatjuk, hogy „közepes”.

Először nézzünk meg példákat a medián megtalálására, majd adjunk meg egy szigorú definíciót.

Tekintsük a következő szóbeli példát projektor használatával

A tanév végén 11 7. osztályos tanuló teljesítette a 100 méteres futás normatíváját. A következő eredményeket rögzítették:

Miután a srácok lefutották a távot, Petya odalépett a tanárhoz, és megkérdezte, mi az eredménye.

„A legtöbb átlagos eredmény: 16,9 másodperc” – válaszolta a tanár.

"Miért?" – lepődött meg Petya. – Végül is az összes eredmény számtani átlaga hozzávetőlegesen 18,3 másodperc, és több mint egy másodperccel jobban futottam. És általában véve, Katya eredménye (18,4) sokkal közelebb áll az átlaghoz, mint az enyém.”

„Átlagos az eredményed, hiszen öten futottak jobban nálad, öten pedig rosszabbul. Vagyis pont a közepén vagy” – mondta a tanár.

Írjon fel egy algoritmust egy számhalmaz mediánjának megtalálásához:

Rendezzünk egy számkészletet (készítsünk rangsorolt ​​sorozatot).

Egyszerre húzza át egy adott számkészlet „legnagyobb” és „legkisebb” számát, amíg egy vagy két szám nem marad.

Ha egy szám maradt, akkor az a medián.

Ha két szám maradt, akkor a medián a maradék két szám számtani átlaga lesz.

Kérd meg a tanulókat, hogy önállóan fogalmazzák meg egy számhalmaz mediánjának definícióját, majd olvassák el a medián definícióját a tankönyvben (40. o.), majd oldják meg a 186. (a, b), 187. (a) sz. a tankönyv (41. o.).

Megjegyzés:

Felhívjuk a hallgatók figyelmét egy fontos tényre: a medián gyakorlatilag érzéketlen a számkészletek egyéni szélsőértékeinek jelentős eltéréseire. A statisztikákban ezt a tulajdonságot stabilitásnak nevezik. A statisztikai mutató stabilitása nagyon fontos tulajdonság, amely megvéd minket a véletlenszerű hibáktól és az egyedi megbízhatatlan adatoktól.

4. A tanult anyag konszolidálása.

Problémamegoldás.

Jelöljük x-számtani középértéket, Me-mediánt.

Számkészlet: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Számkészlet: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Számhalmaz: 3,4,11,17,21

b) Számkészlet: 17,18,19,25,28

c) Számok halmaza: 25, 25, 27, 28, 29, 40, 50

Következtetés: a páratlan számú tagból álló számhalmaz mediánja megegyezik a középen lévő számmal.

a) Számok halmaza: 2, 4, 8, 9.

Me = (4+8):2=12:2=6

b) Számok halmaza: 1,3,5,7,8,9.

Me = (5+7):2=12:2=6

A páros számú tagot tartalmazó számhalmaz mediánja egyenlő a középen lévő két szám összegének felével.

A tanuló az alábbi osztályzatokat kapta algebrából a negyedév során:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Keresse meg ennek a halmaznak az átlagát és mediánját.

Keressük az átlagpontszámot, vagyis a számtani átlagot:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Keressük ennek a számkészletnek a mediánját:

Rendezzük a számkészletet: 2,4,4,4,5,5,5,5,5,5

Csak 10 szám van, a medián meghatározásához vegyük a két középső számot, és keressük meg a félösszegüket.

Me = (5+5):2 = 5

Kérdés a diákoknak: Ha tanár lennél, milyen osztályzatot adnál erre a tanulóra a negyedévben? Válaszát indokolja.

A cég elnöke 300 000 rubel fizetést kap. három helyettese fejenként 150 000 rubelt, negyven alkalmazottja fejenként 50 000 rubelt kap. a takarítónő fizetése pedig 10 000 rubel. Keresse meg a fizetések számtani átlagát és mediánját a vállalatnál. Az alábbi tulajdonságok közül melyiket hasznosítja az elnök reklámozási célokra?

x = (300000+3·150000+40·50000+10000):(1+3+40+1) = 2760000:45=61333,33 (dörzsölés)

6. sz. Szóban.

A) Hány szám van egy halmazban, ha a kilencedik tagja a mediánja?

B) Hány szám van egy halmazban, ha annak mediánja a 7. és 8. tag számtani középértéke?

C) Egy hét számból álló halmazban a legnagyobb szám 14-gyel nő. Megváltoztatja-e ez a számtani átlagot és a mediánt?

D) A halmazban lévő számok mindegyikét 3-mal növeljük. Mi történik a számtani átlaggal és a mediánnal?

Az édességeket a boltban súly szerint értékesítik. Hogy megtudja, hány cukorka van egy kilogrammban, Masha úgy döntött, hogy megkeresi egy cukorka súlyát. Több cukorkát is kimért, és a következő eredményeket érte el:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Mindkét jellemző alkalmas egy cukorka súlyának becslésére, mert nem nagyon különböznek egymástól.

Tehát a statisztikai információk jellemzésére a számtani átlagot és a mediánt használjuk. Sok esetben előfordulhat, hogy az egyik jellemzőnek nincs értelme (például a közúti balesetek idejére vonatkozó információk birtokában aligha van értelme ezen adatok számtani átlagáról beszélni).

Házi feladat: 10. bekezdés, 186. (c, d), 190. sz.

5. Óra összefoglalója. Visszaverődés.

  1. "Statisztikai kutatás: statisztikai adatok gyűjtése és csoportosítása"

    Lecke

    Témák, hetedikre javasolt osztály. TEMATIKUS TERVEZÉS. 1. §. Statisztikaijellemzők. P 1. Számtani átlag, tartomány és módus 1h. P 2. KözépsőHogyanstatisztikaijellegzetes

  2. Az algebra tananyag munkaprogramja 7. évfolyamon (alapszint) magyarázó jegyzet

    Munkaprogram

    ... 10. pont KözépsőHogyanstatisztikaijellegzetes 23 p.9 Számtani átlag, tartomány és módus 24 2. sz. vizsga on téma

  3. Munkaprogram. Matematika. 5. évfolyam p. Kanashi. 2011

    Munkaprogram

    ... egyenletek. Számtani átlag, tartomány és módus. KözépsőHogyanstatisztikaijellegzetes. A cél az, hogy rendszerezze és összefoglalja a ...-ról szóló információkat és az itt szerzett készségeket leckéket alapján témákat(jól algebra 10 osztály). 11 Osztály(heti 4 óra...

  4. 2012. augusztus 30-án kelt 51. számú végzés Munkaprogram algebra 7. osztály

    Munkaprogram

    ... oktatási anyag KözépsőHogyanstatisztikaijellegzetes Ismerje a számtani átlag, a tartomány, a módus és a definícióját mediánokHogyanstatisztikaijellemzők Frontális és egyéni...

  5. Matematika munkaprogram 7. évfolyam ii szint alapszint (1)

    Munkaprogram

    Hogyan találjuk meg egy sorozat mediánját

    azonos, Hogyan 6-kor osztály. Tanul Témák azzal végződik, hogy a tanulók megismerkednek a legegyszerűbbekkel statisztikaijellemzők: átlagos... M.: "Genzher" kiadó, 2009. 3. Zhokhov, V.I. Leckékalgebra 7-kor osztály: könyv a tanár számára / V. I. Zhokhov ...

További hasonló dokumentumok...

1906-ban a nagy tudós és híres eugenikus, Francis Galton ellátogatott a nyugat-angliai állattenyésztés és baromfitenyésztés eredményeinek éves kiállítására, ahol egészen véletlenül érdekes kísérletet végzett.

Ahogy James Surowiecki, a The Wisdom of Crowds szerzője megjegyzi, a vásáron Galtont egy verseny érdekelte, amelyben az embereknek meg kellett találniuk egy levágott ökör súlyát. Az nyert, aki az igazihoz legközelebb eső számot nevezte meg.

Galton arról volt ismert, hogy megvetette a hétköznapi emberek intellektuális képességeit. Úgy vélte, hogy az ökör súlyáról csak az igazi szakértők képesek pontos megállapításokat tenni. A verseny 787 résztvevője pedig nem volt szakértő.

A tudós a tömeg inkompetenciáját a résztvevők válaszainak átlagának kiszámításával akarta bizonyítani. Képzeld el meglepetését, amikor kiderült, hogy a kapott eredmény szinte pontosan megfelel a bika valós súlyának!

Átlagos – késői feltalálás

A válasz pontossága természetesen meghökkentette a kutatót. De még figyelemreméltóbb az a tény, hogy Galton még az átlagérték használatára is gondolt.

A mai világban mindenhol megtalálhatók az átlagok és az úgynevezett mediánok: New Yorkban áprilisban 52 Fahrenheit-fok az átlaghőmérséklet; Stephen Curry meccsenként 30 pontot átlagol; A családi átlagjövedelem az Egyesült Államokban 51 939 dollár/év.

Az az elképzelés azonban, hogy sok különböző eredményt lehet egyetlen számmal ábrázolni, egészen új. A 17. századig egyáltalán nem használtak átlagokat.

Hogyan alakult ki és alakult ki az átlagok és mediánok fogalma? És hogyan vált korunk fő mérési technikájává?

Az átlagok dominanciája a mediánokkal szemben messzemenő következményekkel járt az információk megértésére. És gyakran félrevezette az embereket.

Átlag és medián értékek

Képzeld el, hogy egy történetet mesélsz négy emberről, akik tegnap este veled vacsoráztak egy étteremben. Az egyiküknek 20 évet adna, a másiknak 30, a harmadiknak 40, a negyediknek pedig 50. Mit mondana el az életkorukról a történetében?

Valószínűleg középkorúnak neveznéd őket.

Az átlagot gyakran használják információ továbbítására valamiről, valamint mérési sorozat leírására. Technikailag az átlagot a matematikusok „számtani átlagnak” hívják – az összes mérés összegét osztva a mérések számával.

Bár az átlag szót gyakran a medián szinonimájaként használják, az utóbbi gyakrabban utal valaminek a közepére. Ez a szó a latin „medianus” szóból származik, ami „közép”-et jelent.

Medián érték az ókori Görögországban

A mediánérték története az ókori görög matematikus, Pythagoras tanításaival kezdődik. Pythagoras és iskolája esetében a mediánnak világos meghatározása volt, és nagyon különbözött attól, ahogyan ma értjük az átlagot. Csak a matematikában használták, adatelemzésben nem.

A Pitagorasz iskolában a medián érték egy háromtagú számsor középső szám volt, a szomszédos tagokkal „egyenlő” viszonyban. Az "egyenlő" kapcsolat egyenlő távolságot jelenthet. Például a 4-es szám a 2,4,6 sorozatban. Ugyanakkor kifejezhet geometriai progressziót is, például 10-et az 1, 10, 100 sorozatban.

Churchill Eisenhart statisztikus elmagyarázza, hogy az ókori Görögországban a medián értéket nem használták a számok ábrázolására vagy helyettesítésére. Egyszerűen a közepét jelölte, és gyakran használták matematikai bizonyításokban.

Eisenhart tíz évet töltött az átlag és a medián tanulmányozásával. Kezdetben a medián reprezentatív funkcióját próbálta megtalálni a korai tudományos konstrukciókban. Ehelyett azonban felfedezte, hogy a legtöbb korai fizikus és csillagász egyetlen, okos mérésre támaszkodott, és hiányzott a módszertan a legjobb eredmény kiválasztásához a sok megfigyelés közül.

A modern kutatók következtetéseiket nagy mennyiségű adat gyűjtésére alapozzák, például a biológusok, akik az emberi genomot tanulmányozzák. Az ókori tudósok számos mérést végezhettek, de csak a legjobbakat választották elméleteik felépítéséhez.

Ahogy Otto Neugebauer csillagásztörténész írta: „Ez összhangban van az ókori emberek azon tudatos vágyával, hogy minimalizálják az empirikus adatok mennyiségét a tudományban, mert nem hittek a közvetlen megfigyelések pontosságában.”

Például a görög matematikus és csillagász, Ptolemaiosz megfigyelési módszerekkel és a Föld mozgáselméletével kiszámította a Hold szögátmérőjét. Eredménye 31'20 lett. Ma már tudjuk, hogy a Hold átmérője 29'20 és 34'6 között van a Földtől való távolságától függően. Ptolemaiosz kevés adatot használt számításai során, de minden oka megvolt azt hinni, hogy azok pontosak.

Eisenhart a következőket írja: „Nem szabad elfelejteni, hogy a megfigyelés és az elmélet kapcsolata az ókorban más volt, mint manapság. A megfigyelések eredményeit nem tényekként értelmezték, amelyekhez az elméletet hozzá kell igazítani, hanem olyan konkrét esetekként, amelyek csak az elmélet igazságának szemléltető példái lehetnek."

A tudósok végül az adatok reprezentatív mértékeihez fognak fordulni, de kezdetben sem eszközöket, sem mediánokat nem használtak ebben a szerepben. Az ókortól napjainkig egy másik matematikai fogalmat is használnak ilyen reprezentatív eszközként: a szélsőértékek fele összegét.

A szélsőértékek fele összege

Az új tudományos eszközök szinte mindig abból adódnak, hogy valamilyen tudományterületen egy konkrét problémát kell megoldani. A több mérés közül a legjobb érték megtalálásának igénye a földrajzi helyzet pontos meghatározásának igényéből fakadt.

A 11. századi Al-Biruni szellemi óriás az egyik első ember, aki alkalmazta a reprezentatív jelentések módszertanát. Al-Biruni azt írta, hogy amikor sok mérés állt a rendelkezésére, és meg akarta találni közülük a legjobbat, a következő „szabályt” alkalmazta: meg kell találni a két szélső érték közötti középső számot. A szélsőértékek félösszegének kiszámításakor a maximális és minimális értékek közötti összes számot nem veszik figyelembe, de csak ennek a két számnak az átlagát találjuk meg.

Al-Biruni ezt a módszert különféle területeken alkalmazta, beleértve a modern Afganisztánban található Ghazni város hosszúsági fokának kiszámítását, valamint a fémek tulajdonságait vizsgáló tanulmányait.

Az utóbbi néhány évszázadban azonban a szélsőértékek fele összegét egyre kevésbé használták. Valójában a modern tudományban ez egyáltalán nem releváns. A félösszeget a medián érték váltotta fel.

Megy az átlagokhoz

A 19. század elejére a medián/átlagérték használata általánossá vált az adatcsoportból a legpontosabban reprezentatív érték megtalálására. Friedrich von Gauss, korának kiemelkedő matematikusa ezt írta 1809-ben: „Azt hitték, hogy ha egy bizonyos számot több, azonos feltételek mellett végzett közvetlen megfigyeléssel határoztak meg, akkor a számtani átlag a legigazabb érték. Ha nem teljesen szigorú, akkor legalább közel áll a valósághoz, és ezért mindig támaszkodhat rá.”

Miért történt ez a módszerváltás?

Erre a kérdésre meglehetősen nehéz válaszolni. Churchill Eisenhart tanulmányában azt sugallja, hogy a számtani átlag megtalálásának módszere a mágneses eltérés mérésének területéről, vagyis az északi iránytű és a valós északi iránytű közötti különbség megtalálásából eredhetett. Ez a dimenzió rendkívül fontos volt a nagy földrajzi felfedezések korában.

Eisenhart úgy találta, hogy egészen a 16. század végéig a mágneses eltérítést mérő tudósok többsége az ad hoc módszert (latinul "erre, erre az alkalomra, erre a célra") használta a legpontosabb mérés kiválasztásához.

1580-ban azonban William Borough tudós másként közelítette meg a problémát. Nyolc különböző mérést végzett az elhajlásról, és ezek összehasonlítása után arra a következtetésre jutott, hogy a legpontosabb érték 11 ⅓ és 11 ¼ fok között van. Valószínűleg számított egy számtani átlagot, amely ebben a tartományban volt. Maga Boro azonban nyíltan nem nevezte új módszernek megközelítését.

1635 előtt nem volt egyértelmű eset az átlag reprezentatív számként való használatára. Ekkor azonban Henry Gellibrand angol csillagász két különböző mágneses eltérítési mérést végzett. Az egyiket délelőtt (11 fok), a másikat délután (11 fok és 32 perc) vették. A legigazibb értéket kiszámolva ezt írta:

"Ha megtaláljuk a számtani átlagot, nagy valószínűséggel azt mondhatjuk, hogy a pontos mérés eredménye körülbelül 11 fok 16 perc lesz."

Valószínűleg ez volt az első alkalom, hogy az átlagértéket használták a valós értékhez legközelebb esőnek!

Az "átlagos" szót az angol nyelvben a 16. század elején használták a hajó vagy rakománya által az utazás során elszenvedett károk miatti anyagi veszteség jelölésére. A következő száz évben pontosan ezeket a veszteségeket jelölte meg, amelyeket számtani átlagként számítottak ki. Például, ha egy hajó megsérült egy út során, és a legénységnek néhány árut a fedélzetre kellett dobnia, hogy fenntartsa a hajó súlyát, a befektetők a befektetésük összegével megegyező pénzügyi veszteségeket szenvednének el – ezeket a veszteségeket ugyanúgy számították ki, mint a számtani átlag. Így fokozatosan közeledtek az átlag és a számtani középértékek.

Medián érték

Napjainkban az átlagot vagy a számtani átlagot használják elsődleges módszerként egy méréssorozat reprezentatív értékének kiválasztására. Hogy történt ez? Miért nem a mediánérték kapta ezt a szerepet?

Francis Galton volt a medián bajnoka

A „medián” kifejezés – egy számsor középső tagja, amely kettéosztja a sorozatot – nagyjából egy időben jelent meg a számtani átlaggal. 1599-ben Edward Wright matematikus, aki a normál iránytű eltérésének problémáján dolgozott, először javasolta a mediánérték használatát.

„...Tegyük fel, hogy sok íjász lő egy bizonyos célpontra. A célt ezt követően eltávolítják. Hogyan lehet megtudni, hol volt a célpont? Meg kell találnia a középső helyet az összes nyíl között. Hasonlóképpen, sok megfigyelési eredmény közül a középső lesz a legközelebb az igazsághoz.”

A mediánt a tizenkilencedik században széles körben használták, és akkoriban minden adatelemzés szükséges részévé vált. Francis Galton, a XIX. század kiemelkedő elemzője is használta. A cikk elején elmondott, az ökör mérlegelésének történetében Galton kezdetben a medián értéket használta a tömeg véleményének kifejezésére.

Sok elemző, köztük Galton is, a mediánt részesítette előnyben, mert kis adathalmazokra könnyebb kiszámítani.

A medián azonban soha nem volt népszerűbb az átlagnál. Ez valószínűleg az átlagban rejlő speciális statisztikai tulajdonságoknak, valamint a normális eloszláshoz való viszonyának volt köszönhető.

Az átlag és a normális eloszlás kapcsolata

Ha sok mérést végzünk, az eredmények, ahogy a statisztikusok mondják, „normál eloszlásúak”. Ez azt jelenti, hogy ha ezeket az adatokat egy grafikonon ábrázoljuk, a rajta lévő pontok valami haranghoz hasonlót ábrázolnak. Ha összekapcsolja őket, „harang alakú” görbét kap. Sok statisztika normális eloszlásnak felel meg, mint például az emberek magassága, intelligencia és a legmagasabb éves hőmérséklet.

Ha az adatok normális eloszlásúak, akkor az átlag nagyon közel lesz a haranggörbe legmagasabb pontjához, és nagyon sok mérés lesz közel az átlaghoz. Még egy képlet is megjósolja, hogy hány mérés esik bizonyos távolságra az átlagtól.

Így az átlag kiszámítása rengeteg további információval szolgál a kutatóknak.

Az átlagérték és a szórás közötti kapcsolat nagy előnyt jelent, mert a medián értéknek nincs ilyen kapcsolata. Ez a kapcsolat fontos része a kísérleti adatok elemzésének és az információ statisztikai feldolgozásának. Ez az oka annak, hogy az átlag a statisztika és minden olyan tudomány magja, amely több adatra támaszkodik következtetéseik levonásához.

Az átlag előnye annak is köszönhető, hogy számítógépekkel könnyen kiszámítható. Bár az adatok kis csoportjának mediánértékét meglehetősen könnyű önállóan kiszámítani, sokkal könnyebb olyan számítógépes programot írni, amely megtalálja az átlagot. Ha Microsoft Excelt használ, valószínűleg tudja, hogy a medián függvény kiszámítása nem olyan egyszerű, mint az átlagfüggvény.

Ennek eredményeként nagy tudományos jelentősége és könnyű kezelhetősége miatt az átlagérték lett a fő reprezentatív érték. Ez a lehetőség azonban nem mindig a legjobb.

A medián érték előnyei

Sok esetben, amikor egy eloszlás központi értékét szeretnénk kiszámítani, a medián érték a jobb mérőszám. Az átlagértéket ugyanis nagyrészt az extrém mérési eredmények határozzák meg.

Sok elemző úgy véli, hogy az átlagok meggondolatlan használata negatív hatással van a mennyiségi információk megértésére. Az emberek az átlagot nézik, és azt gondolják, hogy ez a "norma". Valójában azonban bármely olyan tag meghatározhatja, amely erősen kiemelkedik egy homogén sorozatból.

Képzeljen el egy elemzőt, aki öt ház reprezentatív értékét szeretné tudni. Négy ház 100 000 dollárt, az ötödik 900 000 dollárt ér. Az átlag tehát 200 000 dollár, a medián pedig 100 000 dollár lenne. Ebben, mint sok más esetben, a medián érték jobban megérti azt, amit „standardnak” nevezhetünk.

Felismerve, hogy a szélsőséges értékek mennyire befolyásolhatják az átlagot, a mediánt az Egyesült Államok háztartásainak jövedelmében bekövetkezett változások tükrözésére használják.

A mediánok is kevésbé érzékenyek azokra a piszkos adatokra, amelyekkel az elemzők ma foglalkoznak. Sok statisztikus és elemző gyűjt információkat az interneten végzett felmérések segítségével. Ha a felhasználó véletlenül plusz nullát ad a válaszhoz, ami 100-at 1000-re változtat, akkor ez a hiba sokkal erősebb hatással lesz az átlagra, mint a mediánra.

Átlagos vagy medián?

A medián és az átlag közötti választásnak messzemenő következményei vannak, kezdve a kábítószerek egészségre gyakorolt ​​hatásaival kapcsolatos ismereteinkig, egészen addig, amíg tudjuk, milyennek kell lennie egy átlagos háztartási költségvetésnek.

Ahogy az adatgyűjtés és -elemzés egyre inkább befolyásolja a világ megértését, úgy változik a felhasznált mennyiségek értéke is. Egy ideális világban az elemzők az átlagot és a mediánt is felhasználnák az adatok grafikus kifejezésére.

De korlátozott idő és figyelem körülményei között élünk. E korlátok miatt gyakran csak egy dolgot kell választanunk. És sok esetben a medián érték előnyösebb.

KATEGÓRIÁK

NÉPSZERŰ CIKKEK

2023 „kingad.ru” - az emberi szervek ultrahangvizsgálata