Mediana przykładowych danych. Funkcja mediany w programie Excel do wykonywania analiz statystycznych

Wraz z wartościami średnimi obliczane są średnie strukturalne jako charakterystyki statystyczne szeregów rozkładu wariacyjnego - moda oraz mediana.
Moda(Mo) reprezentuje wartość badanej cechy, powtarzaną z największą częstotliwością, tj. tryb jest wartością funkcji, która występuje najczęściej.
Mediana(Me) to wartość cechy, która mieści się w środku uszeregowanej (uporządkowanej) populacji, tj. mediana - centralna wartość szeregu zmienności.
Główną właściwością mediany jest to, że suma bezwzględnych odchyleń wartości atrybutów od mediany jest mniejsza niż od dowolnej innej wartości ∑|x i - Me|=min.

Określanie trybu i mediany na podstawie danych niezgrupowanych

Rozważać określenie trybu i mediany z danych niezgrupowanych. Załóżmy, że brygady robocze, składające się z 9 osób, mają następujące kategorie płac: 4 3 4 5 3 3 6 2 6 . Ponieważ ten zespół ma najwięcej pracowników 3. kategorii, ta kategoria taryfowa będzie modalna. Mo = 3.
Aby określić medianę, należy uszeregować: 2 3 3 3 4 4 5 6 6 . Centralny w tej serii jest pracownik czwartej kategorii, dlatego ta kategoria będzie medianą. Jeżeli seria rankingowa obejmuje parzystą liczbę jednostek, to medianę definiuje się jako średnią z dwóch wartości środkowych.
Jeżeli tryb odzwierciedla najczęściej spotykany wariant wartości atrybutu, to mediana praktycznie spełnia funkcje średniej dla populacji heterogenicznej, która nie podlega prawu rozkładu normalnego. Zilustrujmy jego znaczenie poznawcze następującym przykładem.
Załóżmy, że musimy scharakteryzować średni dochód grupy osób liczącej 100 osób, z której 99 ma dochody w przedziale od 100 do 200 dolarów miesięcznie, a miesięczny dochód tej ostatniej wynosi 50 000 dolarów (Tabela 1).
Tabela 1 - Miesięczne dochody badanej grupy osób. Jeśli użyjemy średniej arytmetycznej, otrzymamy średni dochód w wysokości około 600 – 700 dolarów, co ma niewiele wspólnego z dochodami głównej części grupy. Mediana, w tym przypadku równa Me = 163 dolary, pozwoli nam na obiektywny opis poziomu dochodów 99% tej grupy osób.
Rozważ definicję modu i mediany przez zgrupowane dane (szeregi rozkładu).
Załóżmy, że rozkład pracowników całego przedsiębiorstwa jako całości według kategorii taryfowej ma następującą postać (tabela 2).
Tabela 2 - Rozkład pracowników przedsiębiorstwa według kategorii taryfowej

Obliczanie trybu i mediany dla szeregu dyskretnego

Obliczanie trybu i mediany dla szeregu interwałowego

Obliczanie trybu i mediany dla szeregu wariacyjnego

Wyznaczanie trybu z dyskretnej serii zmienności

Wykorzystywana jest seria wartości cech zbudowanych wcześniej, posortowana według wartości. Jeśli wielkość próby jest nieparzysta, weź wartość środkową; jeśli wielkość próby jest parzysta, bierzemy średnią arytmetyczną dwóch wartości centralnych.
Wyznaczanie trybu z dyskretnej serii zmienności: 5. kategoria taryfowa ma najwyższą częstotliwość (60 osób), dlatego jest modalna. Mo = 5.
Aby określić medianę wartości atrybutu, numer mediany jednostki szeregu (N Me) znajduje się za pomocą następującego wzoru: , gdzie n jest wielkością populacji.
W naszym przypadku: .
Wynikowa wartość ułamkowa, która zawsze występuje przy parzystej liczbie jednostek populacji, wskazuje, że dokładny środek wynosi od 95 do 96 pracowników. Konieczne jest ustalenie, do której grupy należą pracownicy o tych numerach seryjnych. Można to zrobić, obliczając skumulowane częstotliwości. Nie ma pracowników o tych numerach w pierwszej grupie, gdzie jest tylko 12 osób, i nie ma ich w drugiej grupie (12+48=60). Pracownicy 95. i 96. znajdują się w trzeciej grupie (12+48+56=116), zatem 4. kategoria płac jest medianą.

Obliczanie trybu i mediany w szeregu interwałowym

W przeciwieństwie do dyskretnych szeregów wariacyjnych, wyznaczenie trybu i mediany z szeregów interwałowych wymaga pewnych obliczeń opartych na następujących wzorach:
, (5.6)
gdzie x0- dolna granica przedziału modalnego (przedział o największej częstotliwości nazywany jest modalnym);
i jest wartością przedziału modalnego;
fMo jest częstotliwością przedziału modalnego;
fMo-1 jest częstotliwością przedziału poprzedzającego modal;
f Mo +1 jest częstotliwością przedziału następującego po modalu.
(5.7)
gdzie x0– dolna granica przedziału mediany (mediana to pierwszy przedział, którego skumulowana częstość przekracza połowę całkowitej sumy częstości);
i jest wartością przedziału mediany;
S Ja-1- skumulowany przedział poprzedzający medianę;
f Ja jest częstotliwością średniego przedziału.
Ilustrujemy zastosowanie tych wzorów za pomocą danych w tabeli. 3.
Przedział z granicami 60 - 80 w tym rozkładzie będzie modalny, ponieważ ma najwyższą częstotliwość. Korzystając ze wzoru (5.6), określamy tryb:

Aby ustalić medianę przedziału, należy określić skumulowaną częstość każdego kolejnego przedziału, aż przekroczy ona połowę sumy skumulowanych częstości (w naszym przypadku 50%) (tabela 5.11).
Stwierdzono, że mediana to przedział z granicami 100 - 120 tysięcy rubli. Teraz definiujemy medianę:

Tabela 3 - Rozkład ludności Federacji Rosyjskiej według poziomu średniego nominalnego dochodu pieniężnego na mieszkańca w marcu 1994 r.
Grupy według poziomu średniego miesięcznego dochodu na mieszkańca, w tysiącach rubliUdział ludności, %
do 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Ponad 3007,7
Całkowity100,0

Tabela 4 - Definicja przedziału mediany
Zatem średnia arytmetyczna, tryb i mediana mogą być używane jako uogólniona charakterystyka wartości określonego atrybutu dla jednostek populacji rankingowej.
Główną cechą centrum dystrybucyjnego jest średnia arytmetyczna, która charakteryzuje się tym, że wszystkie odchylenia od niej (dodatnie i ujemne) sumują się do zera. Typowe dla mediany jest to, że suma odchyleń od niej w module jest minimalna, a modą jest wartość cechy, która występuje najczęściej.
Stosunek trybu, mediany i średniej arytmetycznej wskazuje na charakter rozkładu cechy w agregacie, pozwala ocenić jej asymetrię. W rozkładzie symetrycznym wszystkie trzy cechy są takie same. Im większa rozbieżność między modą a średnią arytmetyczną, tym szereg jest bardziej asymetryczny. W przypadku szeregów o średniej skośności różnica między modą a średnią arytmetyczną jest w przybliżeniu trzykrotnością różnicy między medianą a średnią, tj.:
|Mo–`x| = 3 |Ja –`x|.

Wyznaczanie trybu i mediany metodą graficzną

Tryb i medianę w szeregu interwałowym można określić graficznie. Tryb jest określany na podstawie histogramu rozkładu. Aby to zrobić, wybierany jest najwyższy prostokąt, który w tym przypadku jest modalny. Następnie łączymy prawy wierzchołek prostokąta modalnego z prawym górnym rogiem poprzedniego prostokąta. A lewy wierzchołek prostokąta modalnego jest z lewym górnym rogiem kolejnego prostokąta. Od punktu ich przecięcia obniżamy prostopadłą do osi odciętych. Odcięta punktu przecięcia tych linii będzie trybem dystrybucji (ryc. 5.3).


Ryż. 5.3. Graficzna definicja mody za pomocą histogramu.


Ryż. 5.4. Graficzne wyznaczanie mediany przez kumulację
Aby wyznaczyć medianę z punktu na skali skumulowanych częstości (częstości) odpowiadającego 50%, rysuje się linię prostą równoległą do osi odciętych do przecięcia z kumulacją. Następnie z punktu przecięcia prostopadła jest obniżana do osi odciętych. Odciętą punktu przecięcia jest mediana.

Kwartyle, Decyle, Percentyle

Podobnie, znajdując medianę w szeregu wariacyjnym rozkładu, można znaleźć wartość cechy dla dowolnej jednostki szeregów uszeregowanych w kolejności. Na przykład możesz znaleźć wartość cechy w jednostkach, które dzielą szereg na cztery równe części, na 10 lub 100 części. Wartości te nazywane są „kwartylami”, „decylami”, „percentylami”.
Kwartyle to wartość cechy, która dzieli zróżnicowaną populację na 4 równe części.
Rozróżnij dolny kwartyl (Q 1), który oddziela ¼ populacji o najniższych wartościach atrybutu, oraz górny kwartyl (Q 3), który odcina ¼ części o najwyższych wartościach atrybutu . Oznacza to, że 25% jednostek populacji będzie mniejszych niż Q1; 25% lokali zostanie zamkniętych między Q1 a Q2; 25% - między Q 2 a Q 3, a pozostałe 25% jest lepsze od Q 3. Środkowy kwartyl Q 2 to mediana.
Aby obliczyć kwartyle na podstawie serii zmienności przedziałów, stosuje się następujące wzory:
, ,
gdzie x Pytanie 1– dolna granica przedziału zawierająca dolny kwartyl (przedział wyznacza częstość skumulowana, pierwsza przekracza 25%);
x Pytanie 3– dolna granica przedziału zawierająca górny kwartyl (przedział wyznacza częstość skumulowana, pierwsza przekracza 75%);
i– wartość interwału;
S Q 1-1 jest skumulowaną częstotliwością przedziału poprzedzającego przedział zawierający dolny kwartyl;
S Q 3-1 jest skumulowaną częstotliwością przedziału poprzedzającego przedział zawierający górny kwartyl;
f Pytanie 1 jest częstotliwością przedziału zawierającego dolny kwartyl;
f Pytanie 3 jest częstotliwością przedziału zawierającego górny kwartyl.
Rozważ obliczenie dolnego i górnego kwartyla zgodnie z tabelą. 5.10. Dolny kwartyl mieści się w przedziale 60 – 80, którego skumulowana częstość wynosi 33,5%. Górny kwartyl mieści się w przedziale 160 - 180 z skumulowaną częstością 75,8%. Mając to na uwadze, otrzymujemy:
,
.
Oprócz kwartyli można określić decyle w rangach rozkładu wariacyjnego - opcjach, które dzielą uszeregowane szeregi wariacyjne na dziesięć równych części. Pierwszy decyl (d 1) dzieli populację od 1/10 do 9/10, drugi decyl (d 1) od 2/10 do 8/10 i tak dalej.
Oblicza się je według wzorów:
, .
Wartości cech, które dzielą serię na sto części, nazywane są percentylami. Stosunki mediany, kwartyli, decyli i percentyli przedstawiono na ryc. 5.5.

Płace w różnych sektorach gospodarki, temperatura i opady na tym samym obszarze w porównywalnych okresach, plony w różnych regionach geograficznych itp. Jednak średnia nie jest bynajmniej jedynym uogólniającym wskaźnikiem – w niektórych przypadkach dla dokładniejszego oceny wartość taka jak mediana jest odpowiednia. W statystyce jest szeroko stosowany jako pomocnicza charakterystyka opisowa rozkładu cechy w pojedynczej populacji. Zobaczmy, czym różni się od średniej, a także co spowodowało potrzebę jej użycia.

Mediana w statystyce: definicja i właściwości

Wyobraź sobie następującą sytuację: 10 osób pracuje razem z dyrektorem w firmie. Zwykli pracownicy otrzymują po 1000 hrywien, a ich kierownik, który zresztą jest właścicielem, otrzymuje po 10 tys. hrywien. Jeśli obliczymy średnią arytmetyczną, okaże się, że średnia pensja w tym przedsiębiorstwie wynosi 1900 UAH. Czy to stwierdzenie okaże się prawdą? Weźmy ten przykład: w tej samej sali szpitalnej jest dziewięć osób z temperaturą 36,6°C i jedna osoba z temperaturą 41°C. Średnia arytmetyczna w tym przypadku wynosi: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. Ale to nie znaczy, że wszyscy obecni są chorzy. Wszystko to sugeruje, że sama średnia często nie wystarcza, dlatego oprócz niej stosuje się medianę. W statystyce wskaźnik ten nazywany jest wariantem, który znajduje się dokładnie w środku uporządkowanej serii wariacji. Jeśli obliczysz to dla naszych przykładów, otrzymasz odpowiednio 1000 UAH. i 36,6 °С. Innymi słowy, mediana w statystyce to wartość, która dzieli szereg na pół w taki sposób, że po obu jego stronach (w górę lub w dół) znajduje się taka sama liczba jednostek danej populacji. Ze względu na tę właściwość wskaźnik ten ma kilka innych nazw: 50. percentyl lub kwantyl 0,5.

Jak znaleźć medianę w statystykach

Sposób obliczenia tej wartości w dużej mierze zależy od tego, jaki mamy typ szeregu wariacyjnego: dyskretny czy przedziałowy. W pierwszym przypadku mediana w statystykach jest dość prosta. Wszystko, co musisz zrobić, to znaleźć sumę częstotliwości, podzielić przez 2, a następnie dodać ½ do wyniku. Zasadę obliczeń najlepiej będzie wyjaśnić na poniższym przykładzie. Załóżmy, że mamy pogrupowane dane dotyczące płodności i chcemy dowiedzieć się, jaka jest mediana.

Numer grupy rodzinnej według liczby dzieci

Liczba rodzin

Po przeprowadzeniu kilku prostych obliczeń otrzymujemy, że pożądany wskaźnik jest równy: 195/2 + ½ = opcja. Aby dowiedzieć się, co to oznacza, należy sekwencyjnie akumulować częstotliwości, zaczynając od najmniejszych opcji. Tak więc suma pierwszych dwóch wierszy daje nam 30. Oczywiście nie ma tutaj 98 opcji. Ale jeśli do wyniku dodamy częstość trzeciej opcji (70), otrzymamy sumę równą 100. Zawiera ona tylko 98. opcję, co oznacza, że ​​medianą będzie rodzina z dwójką dzieci.

Jeśli chodzi o szeregi interwałowe, zwykle stosuje się tutaj następujący wzór:

M e \u003d X Me + ja Ja * (∑f / 2 - S Me-1) / f Ja, w którym:

  • X Me - pierwsza wartość przedziału mediany;
  • ∑f to numer serii (suma jej częstotliwości);
  • i Me - wartość mediany rozpiętości;
  • f Me - częstotliwość zakresu mediany;
  • S Me-1 – suma skumulowanych częstości w przedziałach poprzedzających medianę.

Ponownie, trudno to rozgryźć bez przykładu. Załóżmy, że istnieją dane dotyczące wartości

Wynagrodzenie, tysiąc rubli

Skumulowane częstotliwości

Aby skorzystać z powyższego wzoru, musimy najpierw określić medianę przedziału. Jako taki wybiera się taki zakres, którego skumulowana częstotliwość przekracza lub jest równa połowie całkowitej sumy częstotliwości. Tak więc, dzieląc 510 przez 2, otrzymujemy, że to kryterium odpowiada przedziałowi o wartości wynagrodzenia 250 000 rubli. do 300 000 rubli Teraz możesz zastąpić wszystkie dane we wzorze:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 tysięcy rubli.

Mamy nadzieję, że nasz artykuł był przydatny, a teraz masz jasne pojęcie, czym jest mediana w statystykach i jak należy ją obliczać.

Do obliczenia mediany w MS EXCEL służy specjalna funkcja MEDIAN() . W tym artykule zdefiniujemy medianę i nauczymy się ją obliczać dla próby i dla danego rozkładu zmiennej losowej.

Zacznijmy mediany dla próbki(tj. dla ustalonego zestawu wartości).

Przykładowa mediana

Mediana(mediana) to liczba będąca środkiem zbioru liczb: połowa liczb w zbiorze jest większa niż mediana, a połowa liczb jest mniejsza niż mediana.

Liczyć mediany potrzebne jako pierwsze (wartości w próbowanie). Na przykład, mediana dla próbki (2; 3; 3; 4 ; 5; 7; 10) będzie 4. Ponieważ. tylko w próbowanie 7 wartości, w tym trzy mniejsze niż 4 (tj. 2; 3; 3) i trzy wartości większe niż (tj. 5; 7; 10).

Jeśli zestaw zawiera parzystą liczbę liczb, to jest obliczany dla dwóch liczb w środku zestawu. Na przykład, mediana dla próbki (2; 3; 3 ; 6 ; 7; 10) wyniesie 4,5, ponieważ (3+6)/2=4,5.

Do ustalenia mediany w MS EXCEL istnieje funkcja o tej samej nazwie MEDIAN() , angielska wersja MEDIAN().

Mediana niekoniecznie pasuje. Dopasowanie występuje tylko wtedy, gdy wartości w próbce są rozmieszczone symetrycznie środek. Na przykład dla próbki (1; 2; 3 ; 4 ; 5; 6) mediana oraz przeciętny są równe 3,5.

Jeśli jest znany funkcja dystrybucyjna F(x) lub Funkcja gęstości prawdopodobieństwa p(X), następnie mediana można znaleźć z równania:

Na przykład, rozwiązując to równanie analitycznie dla rozkładu logarytmiczno-normalnego lnN(μ; σ 2), otrzymujemy, że mediana oblicza się według wzoru =EXP(μ). Dla μ=0 mediana wynosi 1.

Zwróć uwagę na kropkę Funkcje dystrybucji, dla którego F(x)=0,5(patrz zdjęcie powyżej) . Odcięta tego punktu wynosi 1. Jest to wartość mediany, która w naturalny sposób pokrywa się z wcześniej obliczoną wartością za pomocą wzoru em.

w MS EXCEL mediana dla rozkład logarytmiczno-normalny LnN(0;1) można obliczyć za pomocą wzoru =ROZKŁ.NORMALNY.ODWR(0;5;0;1).

Notatka: Przypomnijmy, że całka z na całym obszarze ustawienia zmiennej losowej jest równa jeden.

Dlatego linia środkowa (x=mediana) dzieli obszar pod wykresem funkcje gęstości prawdopodobieństwa na dwie równe części.

Ze względu na to, że badacz nie dysponuje danymi o wolumenie sprzedaży w każdym kantorze, wyliczenie średniej arytmetycznej w celu określenia średniej ceny za dolara jest niewłaściwe.

Mediana szeregu liczb

Możliwe jest jednak określenie wartości atrybutu, który nazywa się medianą (Me). Mediana

w naszym przykładzie

Mediana liczby: NoMe = ;

Moda

Tabela 3.6.

f jest sumą częstotliwości szeregu;

Skumulowane częstotliwości

12_

_

S to skumulowane częstotliwości.

na ryc. 3.2. Przedstawiono histogram szeregu rozkładów banków według zysku (zgodnie z tabelą 3.6.).

x to kwota zysku, milion rubli,

f to liczba banków.

„MEDIANA SERII ZAMÓWIONEJ”

Tekstowa wersja HTML publikacji


Podsumowanie lekcji algebry w klasie 7

Temat lekcji: „MEDIANA SERII ZAMÓWIONEJ”.

nauczyciel filii Lake School gimnazjum MKOU Burkovskaya Eremenko Tatyana Alekseevna
Cele:
koncepcja mediany jako cechy statystycznej uporządkowanego szeregu; kształtowanie umiejętności znajdowania mediany dla uporządkowanych szeregów o parzystej i nieparzystej liczbie członków; wykształcić umiejętność interpretacji wartości mediany w zależności od sytuacji praktycznej, utrwalić pojęcie średniego arytmetycznego zbioru liczb. Rozwijaj umiejętności niezależnej pracy. Buduj zainteresowanie matematyką.
Podczas zajęć

praca ustna.
Podane są rzędy: 1) 4; jeden; osiem; 5; jeden; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; cztery; 6; 7,3; 6. Znajdź: a) największe i najmniejsze wartości każdego wiersza; b) zasięg każdego rzędu; c) fason każdego rzędu.
II. Wyjaśnienie nowego materiału.
Praca podręcznikowa. 1. Rozważ problem z paragrafu 10 podręcznika. Co oznacza rząd uporządkowany? Podkreślam, że przed znalezieniem mediany zawsze należy posortować serie danych. 2. Na tablicy zapoznajemy się z zasadami znajdowania mediany szeregów o parzystej i nieparzystej liczbie członków:
Mediana

uporządkowany

wiersz
liczby
Z

dziwne

numer

członkowie

zadzwonił pod numer zapisany w środku i
mediana

uporządkowany rząd
liczby
z parzystą liczbą członków
nazywa się średnią arytmetyczną dwóch liczb zapisanych w środku.
Mediana

arbitralny

wiersz
nazywa się medianą 1 3 1 7 5 4 odpowiedniego uporządkowanego szeregu.
Zaznaczam, że wskaźnikami są średnia arytmetyczna, tryb i mediana dla

różnie

charakteryzować

dane,

Odebrane

wynik

obserwacje.

III. Kształtowanie umiejętności i zdolności.
1. grupa. Ćwiczenia z zastosowania wzorów do wyznaczania mediany szeregu uporządkowanego i nieuporządkowanego. jeden.
№ 186.
Rozwiązanie: a) Liczba członków serii P= 9; mediana Ja= 41; b) P= 7, rząd jest uporządkowany, Ja= 207; w) P= 6, rząd jest uporządkowany, Ja== 21; G) P= 8, rząd jest uporządkowany, Ja== 2,9. Odpowiedź: a) 41; b) 207; o 21; d) 2.9. Uczniowie komentują sposób znajdowania mediany. 2. Znajdź średnią arytmetyczną i medianę ciągu liczb: a) 27, 29, 23, 31, 21, 34; w) ; 1. b) 56, 58, 64, 66, 62, 74. Rozwiązanie: Aby znaleźć medianę, należy posortować każdy wiersz: a) 21, 23, 27, 29, 31, 34. P = 6; X = = 27,5; Ja== 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Jak znaleźć medianę w statystykach

P = 6; X = 63,3; Ja== 63; w) ; jeden. P = 5; X = : 5 = 3: 5 = 0,6; Ja = . 3.
№ 188
(doustnie). Odpowiedź: tak; b) nie; c) nie; d) tak. 4. Wiedząc, że zamawiana seria zawiera t numery, gdzie t jest liczbą nieparzystą, wskaż numer wyrazu będącego medianą if t jest równa: a) 5; b) 17; c) 47; d) 201. Odpowiedź: a) 3; b) 9; c) 24; d) 101. 2. grupa. Praktyczne zadania polegające na znalezieniu mediany odpowiedniego szeregu i interpretacji wyniku. jeden.
№ 189.
Rozwiązanie: Liczba członków wiersza P= 12. Aby znaleźć medianę, należy uporządkować szeregi: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Mediana szeregu Ja= = 176. Produkcja miesięczna była większa od mediany dla następujących członków artelu: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 22 xx+ + = 1) Kwitko; 4) Bobków; 2) Baranów; 5) Ryłow; 3) Antonow; 6) Astafiew. Odpowiedź: 176. 2.
№ 192.
Rozwiązanie: Ułóżmy serie danych: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; liczba członków rzędu P= 20. Przesuń A = x maks- x min = 42 - 30 = 12. Tryb pn= 32 (ta wartość występuje 6 razy - częściej niż inne). Mediana Ja= = 35. W tym przypadku zakres pokazuje największy rozrzut czasu obróbki części; tryb pokazuje najbardziej typową wartość czasu przetwarzania; mediana to czas przetwarzania, którego nie przekroczyła połowa tokarzy. Odpowiedź: 12; 32; 35.
IV. Podsumowanie lekcji.
Jaka jest mediana szeregu liczb? – Czy mediana szeregu liczb może nie pokrywać się z żadną z liczb w szeregu? – Jaka liczba jest medianą uporządkowanego szeregu zawierającego 2 P liczby? 2 P– 1 cyfra? Jak znaleźć medianę szeregu nieuporządkowanego?
Praca domowa:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

W dziale podstawowe wykształcenie ogólne

Tryb i mediana

Średnie wartości obejmują również tryb i medianę.

Mediana i tryb są często używane jako średnia charakterystyka w populacjach, w których obliczenie średniej (arytmetyczne, harmoniczne itp.) jest niemożliwe lub niepraktyczne.

Na przykład badanie reprezentacyjne w mieście Omsk 12 komercyjnych kantorów wymiany walut umożliwiło ustalenie różnych cen dolara w momencie jego sprzedaży (dane na dzień 10 października 1995 r. Przy kursie dolara -4493 rubli) .

Ze względu na to, że badacz nie dysponuje danymi o wolumenie sprzedaży w każdym kantorze, wyliczenie średniej arytmetycznej w celu określenia średniej ceny za dolara jest niewłaściwe. Możliwe jest jednak określenie wartości atrybutu, który nazywa się medianą (Me). Mediana leży na środku uszeregowanego rzędu i przecina go na pół.

Obliczenie mediany dla danych niezgrupowanych odbywa się w następujący sposób:

a) uporządkować poszczególne wartości cechy w porządku rosnącym:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) określić numer seryjny mediany według wzoru:

w naszym przykładzie oznacza to, że mediana w tym przypadku znajduje się między szóstą a siódmą wartością cechy w szeregu rankingowym, ponieważ szereg ten ma parzystą liczbę wartości indywidualnych. Zatem Me jest równe średniej arytmetycznej sąsiednich wartości: 4550, 4560.

c) rozważyć procedurę obliczania mediany w przypadku nieparzystej liczby poszczególnych wartości.

Załóżmy, że obserwujemy nie 12, ale 11 punktów wymiany walut, wtedy szereg rankingowy będzie wyglądał tak (odrzucamy 12. punkt):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Mediana liczby: NoMe = ;

na szóstym miejscu jest = 4560, czyli mediana: Ja = 4560. Po obu stronach jest taka sama liczba punktów.

Moda- jest to najczęstsza wartość atrybutu w jednostkach tej populacji. Odpowiada określonej wartości charakterystycznej.

W naszym przypadku cenę modalną za dolara można nazwać 4560 rubli: ta wartość powtarza się 4 razy, częściej niż wszystkie inne.

W praktyce tryb i medianę można zwykle znaleźć na podstawie zgrupowanych danych. W wyniku grupowania uzyskano szereg rozkładów banków według wielkości otrzymanego zysku za dany rok (Tabela 3.6.).

Tabela 3.6.

Pogrupowanie banków według wielkości uzyskanego zysku za dany rok

Aby określić medianę, konieczne jest obliczenie sumy skumulowanych częstości. Wzrost sumy trwa do momentu, gdy skumulowana suma częstotliwości przekroczy połowę sumy częstotliwości. W naszym przykładzie suma skumulowanych częstotliwości (12) przekracza połowę wszystkich wartości (20:2). Wartość ta odpowiada przedziałowi mediany, który zawiera medianę (5,5 - 6,4). Określmy jego wartość według wzoru:

gdzie jest początkową wartością przedziału zawierającego medianę;

- wartość mediany przedziału;

f jest sumą częstotliwości szeregu;

jest sumą skumulowanych częstości poprzedzających średni przedział;

jest częstotliwością średniego przedziału.

Tak więc 50% banków ma zysk w wysokości 6,1 mln rubli, a 50% banków - ponad 6,1 mln rubli.

Najwyższa częstotliwość odpowiada również przedziałowi 5,5 – 6,4, tj. tryb musi być w tym przedziale. Jego wartość określa wzór:

gdzie jest początkową wartością przedziału zawierającego tryb;

- wartość przedziału modalnego;

jest częstotliwością przedziału modalnego;

- częstotliwość interwału poprzedzającego modal;

- częstotliwość interwału następującego po modalu.

Podana formuła mody może być stosowana w szeregach wariacyjnych o równych odstępach czasu.

Tak więc w tym agregacie najczęstszy zysk wynosi 6,10 mln rubli.

Medianę i modę można określić graficznie. Mediana jest wyznaczana przez kumulację (ryc. 3.1.). Aby go skonstruować, konieczne jest obliczenie skumulowanych częstotliwości i częstotliwości. Częstości skumulowane pokazują, ile jednostek populacji ma wartości cech nie większe niż rozważana wartość i jest określane przez kolejne sumowanie częstości przedziałów. Przy konstruowaniu skumulowanego szeregu rozkładów przedziałów dolna granica pierwszego przedziału odpowiada częstotliwości równej zeru, a górna granica odpowiada całej częstotliwości danego przedziału. Górna granica drugiego przedziału odpowiada skumulowanej częstotliwości równej sumie częstotliwości pierwszych dwóch przedziałów i tak dalej.

Zbudujmy krzywą skumulowaną zgodnie z tabelą. 6 w sprawie podziału banków według zysku.

Skumulowane częstotliwości

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х zysk

Ryż. 3.1. Skumulowany podział banków według zysku:

x to kwota zysku, milion rubli,

S to skumulowane częstotliwości.

Aby określić medianę, wysokość największej rzędnej, która odpowiada całej populacji, dzieli się na pół. Przez uzyskany punkt prowadzi się linię prostą, równoległą do osi odciętych, aż do przecięcia się z kumulatem. Odciętą punktu przecięcia jest mediana.

Tryb jest określany na podstawie histogramu rozkładu. Histogram jest zbudowany w następujący sposób:

na osi odciętych nanoszone są równe segmenty, które na przyjętej skali odpowiadają wielkości przedziałów szeregu wariacyjnego. Prostokąty są zbudowane na odcinkach, których pola są proporcjonalne do częstotliwości (lub częstotliwości) interwału.

Mediana w statystykach

3.2. Przedstawiono histogram szeregu rozkładów banków według zysku (zgodnie z tabelą 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2

Ryż. 3.2. Podział banków komercyjnych według zysku:

x to kwota zysku, milion rubli,

f to liczba banków.

Aby określić modę, łączymy prawy wierzchołek prostokąta modalnego z prawym górnym rogiem poprzedniego prostokąta, a lewy wierzchołek prostokąta modalnego z lewym górnym rogiem następnego prostokąta. Odcięta punktu przecięcia tych prostych będzie trybem rozkładu.

Mediana (statystyka)

Mediana (statystyka), w statystyce matematycznej, liczba charakteryzująca próbkę (na przykład zbiór liczb). Jeśli wszystkie elementy w próbie są różne, to mediana jest taką liczbą elementów w próbie, że dokładnie połowa elementów w próbie jest od niej większa, a druga połowa jest od niej mniejsza. W bardziej ogólnym przypadku medianę można znaleźć, porządkując elementy próby w porządku rosnącym lub malejącym i biorąc element środkowy. Na przykład próbka (11, 9, 3, 5, 5) po uporządkowaniu zamienia się w (3, 5, 5, 9, 11), a jej medianą jest liczba 5. Jeżeli próbka ma parzystą liczbę elementów, mediana może nie być jednoznacznie określona: w przypadku danych liczbowych najczęściej używana jest połowa sumy dwóch sąsiednich wartości (to znaczy mediana zestawu (1, 3, 5, 7) jest równa 4).

Innymi słowy, mediana w statystyce to wartość, która dzieli szereg na pół w taki sposób, że po obu jego stronach (w górę lub w dół) znajduje się taka sama liczba jednostek danej populacji.

Zadanie numer 1. Obliczanie średniej arytmetycznej, wartości modalnej i mediany

Ze względu na tę właściwość wskaźnik ten ma kilka innych nazw: 50. percentyl lub kwantyl 0,5.

  • Oznaczać
  • Mediana
  • Moda

Mediana (statystyka)

Mediana (statystyka), w statystyce matematycznej, liczba charakteryzująca próbkę (na przykład zbiór liczb). Jeśli wszystkie elementy w próbie są różne, to mediana jest taką liczbą elementów w próbie, że dokładnie połowa elementów w próbie jest od niej większa, a druga połowa jest od niej mniejsza. W bardziej ogólnym przypadku medianę można znaleźć, porządkując elementy próby w porządku rosnącym lub malejącym i biorąc element środkowy. Na przykład próbka (11, 9, 3, 5, 5) po uporządkowaniu zamienia się w (3, 5, 5, 9, 11), a jej medianą jest liczba 5.

5.5 Tryb i mediana. Ich obliczanie w szeregach dyskretnych i interwałowych

Jeśli próbka ma parzystą liczbę elementów, mediany nie można jednoznacznie określić: w przypadku danych liczbowych najczęściej stosuje się połowę sumy dwóch sąsiednich wartości (czyli medianę zbioru (1, 3, 5, 7) przyjmuje się jako równe 4).

Innymi słowy, mediana w statystyce to wartość, która dzieli szereg na pół w taki sposób, że po obu jego stronach (w górę lub w dół) znajduje się taka sama liczba jednostek danej populacji. Ze względu na tę właściwość wskaźnik ten ma kilka innych nazw: 50. percentyl lub kwantyl 0,5.

Medianę stosuje się zamiast średniej arytmetycznej, gdy skrajne warianty szeregów rankingowych (najmniejszy i największy) w porównaniu z resztą okazują się zbyt duże lub zbyt małe.

Funkcja MEDIANA mierzy trend centralny, który jest środkiem zbioru liczb w rozkładzie statystycznym. Istnieją trzy najczęstsze sposoby określania trendu centralnego:

  • Oznaczać- średnia arytmetyczna, która jest obliczana poprzez dodanie zestawu liczb, a następnie podzielenie otrzymanej sumy przez ich liczbę.
    Na przykład średnia dla liczb 2, 3, 3, 5, 7 i 10 wynosi 5, co jest wynikiem podzielenia ich sumy, która wynosi 30, przez ich liczbę, która wynosi 6.
  • Mediana- liczba będąca środkiem zbioru liczb: połowa liczb ma wartości większe od mediany, a połowa liczb jest mniejsza.
    Na przykład mediana liczb 2, 3, 3, 5, 7 i 10 wynosi 4.
  • Moda jest liczbą, która występuje najczęściej w danym zbiorze liczb.
    Na przykład tryb dla liczb 2, 3, 3, 5, 7 i 10 to 3.

Lekcja algebry w 7 klasie.

Temat „Mediana jako cecha statystyczna”.

Nauczyciel Egorova N.I.

Cel lekcji: kształtowanie u uczniów zrozumienia mediany zbioru liczb i umiejętności jej obliczania dla prostych zbiorów liczbowych, ustalenie pojęcia średniego arytmetycznego zbioru liczb.

Rodzaj lekcji: wyjaśnienie nowego materiału.

Podczas zajęć

1. Moment organizacyjny.

Poinformuj temat lekcji i sformułuj jej cele.

2. Aktualizacja dotychczasowej wiedzy.

Pytania do studentów:

Jaka jest średnia arytmetyczna zbioru liczb?

Gdzie znajduje się średnia arytmetyczna w zbiorze liczb?

Co charakteryzuje średnią arytmetyczną zbioru liczb?

Gdzie często używana jest średnia arytmetyczna zestawu liczb?

Zadania ustne:

Znajdź średnią arytmetyczną zestawu liczb:

Sprawdzanie pracy domowej.

Podręcznik: nr 169, nr 172.

3. Nauka nowego materiału.

Na poprzedniej lekcji poznaliśmy taką cechę statystyczną, jak średnia arytmetyczna zbioru liczb. Dzisiaj poświęcimy lekcję innej charakterystyce statystycznej - medianie.

Nie tylko średnia arytmetyczna pokazuje, gdzie na osi liczbowej znajdują się liczby dowolnego zestawu i gdzie znajduje się ich środek. Kolejnym wskaźnikiem jest mediana.

Mediana zbioru liczb to liczba, która dzieli zbiór na dwie równe części. Zamiast „mediany” można by powiedzieć „środek”.

Najpierw na przykładach przeanalizujemy, jak znaleźć medianę, a następnie podamy ścisłą definicję.

Rozważ następujący słowny przykład użycia projektora

Na koniec roku szkolnego 11 uczniów klasy 7 zdało sztandar biegu na 100 metrów. Zanotowano następujące wyniki:

Po tym, jak chłopaki przebiegli dystans, Petya podszedł do nauczyciela i zapytał, jaki jest jego wynik.

„Najbardziej średnio: 16,9 sekundy” – odpowiedział nauczyciel

"Czemu?" — zdziwił się Petya. - W końcu średnia arytmetyczna wszystkich wyników to około 18,3 sekundy, a ja pobiegłem o sekundę lub więcej lepiej. I ogólnie wynik Katyi (18,4) jest znacznie bliższy średniej niż mój.”

„Twój wynik jest średni, bo pięć osób pobiegło lepiej od Ciebie, a pięć gorzej. Więc jesteś dokładnie pośrodku” – powiedział nauczyciel.

Napisz algorytm znajdowania mediany zbioru liczb:

Zamów zestaw numeryczny (ułóż serię rankingową).

Jednocześnie przekreślamy „największe” i „najmniejsze” liczby z tego zestawu liczb, aż pozostanie jedna liczba lub dwie liczby.

Jeśli jest tylko jedna liczba, to jest to mediana.

Jeśli pozostały dwie liczby, mediana będzie średnią arytmetyczną dwóch pozostałych liczb.

Poproś uczniów, aby samodzielnie sformułowali definicję mediany zbioru liczb, a następnie przeczytali definicję mediany w podręczniku (s. 40), a następnie rozwiązali zadanie nr 186 (a, b), nr 187 (a) z podręcznik (s. 41).

Komentarz:

Zwróć uwagę uczniów na ważną okoliczność: mediana jest praktycznie niewrażliwa na znaczne odchylenia poszczególnych skrajnych wartości zbiorów liczb. W statystyce ta właściwość nazywana jest stabilnością. Stabilność wskaźnika statystycznego jest bardzo ważną właściwością, zabezpiecza nas przed przypadkowymi błędami i indywidualnymi niewiarygodnymi danymi.

4. Konsolidacja badanego materiału.

Rozwiązywanie problemów.

Oznacz x-średnią arytmetyczną, Me-medianę.

Zestaw liczb: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Zestaw liczb: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Zestaw liczb: 3,4,11,17,21

b) Zestaw liczb: 17,18,19,25,28

c) Zestaw numerów: 25, 25, 27, 28, 29, 40, 50

Wniosek: mediana zbioru liczb składającego się z nieparzystej liczby członków jest równa liczbie w środku.

a) Zestaw liczb: 2, 4, 8, 9.

Ja = (4+8):2=12:2=6

b) Zestaw liczb: 1,3,5,7,8,9.

Ja = (5+7):2=12:2=6

Mediana zbioru liczb zawierającego parzystą liczbę członków jest połową sumy dwóch liczb w środku.

Student otrzymał następujące oceny z algebry w ciągu kwartału:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Znajdź średni wynik i medianę tego zestawu.

Znajdźmy średni wynik, czyli średnią arytmetyczną:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Znajdź medianę tego zestawu liczb:

Zamówmy zestaw liczb: 2,4,4,4,5,5,5,5,5,5

Tylko 10 liczb, aby znaleźć medianę, musisz wziąć dwie środkowe liczby i znaleźć ich połowę sumy.

Ja = (5+5):2 = 5

Pytanie do uczniów: Gdybyś był nauczycielem, jaką ocenę dałbyś temu uczniowi za ćwierćdolarówkę? Uzasadnij odpowiedź.

Prezes firmy otrzymuje wynagrodzenie w wysokości 300 000 rubli. trzech jego zastępców otrzymuje po 150 000 rubli, czterdziestu pracowników - po 50 000 rubli. a pensja sprzątacza wynosi 10 000 rubli. Znajdź średnią arytmetyczną i medianę wynagrodzeń w firmie. Która z tych cech bardziej opłaca się prezydentowi wykorzystać do celów reklamowych?

x \u003d (300000 + 3 150000 + 40 50000 + 10000): (1 + 3 + 40 + 1) \u003d 2760000: 45 \u003d 61333,33 (rubli)

Nr 6. Doustnie.

A) Ile liczb jest w zbiorze, jeśli jego mediana jest jego dziewiątym elementem?

B) Ile liczb jest w zbiorze, jeśli jego mediana jest średnią arytmetyczną 7. i 8. elementu?

C) W zbiorze siedmiu liczb największą liczbę zwiększono o 14. Czy zmieni to zarówno średnią arytmetyczną, jak i medianę?

D) Każda z liczb w zbiorze została zwiększona o 3. Co stanie się ze średnią arytmetyczną i medianą?

Słodycze w sklepie sprzedawane są na wagę. Aby dowiedzieć się, ile cukierków zawiera jeden kilogram, Masza postanowiła obliczyć wagę jednego cukierka. Zważyła kilka cukierków i uzyskała następujące wyniki:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Obie charakterystyki nadają się bowiem do oszacowania masy jednego cukierka nie różnią się zbytnio od siebie.

Tak więc, aby scharakteryzować informacje statystyczne, stosuje się średnią arytmetyczną i medianę. W wielu przypadkach niektóre cechy mogą nie mieć żadnego znaczenia (np. mając informacje o czasie wypadków drogowych, nie ma sensu mówić o średniej arytmetycznej tych danych).

Zadanie domowe: akapit 10, nr 186 (c, d), nr 190.

5. Wyniki lekcji. Odbicie.

  1. „Badania statystyczne: zbieranie i grupowanie danych statystycznych”

    Lekcja

    Tematy proponowany na siódmy klasa. PLANOWANIE TEMATYCZNE. § jeden. Statystycznycechy. P 1. Średnia arytmetyczna, zakres i moda 1h. P 2. MedianaJakstatystycznyCharakterystyka

  2. Program pracy kursu „Algebra” w klasie 7 (poziom podstawowy) nota wyjaśniająca

    Program roboczy

    ... punkt 10 MedianaJakstatystycznyCharakterystyka 23 s.9 Średnia arytmetyczna, zakres i tryb 24 Egzamin nr 2 dn temat

  3. Program roboczy. Matematyka. 5 klasa str. Kanashiego. 2011

    Program roboczy

    ... równania. Średnia arytmetyczna, zakres i moda. MedianaJakstatystycznyCharakterystyka. Celem jest usystematyzowanie i podsumowanie informacji o… i umiejętnościach zdobytych w Lekcje według tematy(dobrze algebra 10 klasa). 11 Klasa(4 godziny tygodniowo...

  4. Rozkaz nr 51 z dnia 30 sierpnia 2012 r. Program pracy z algebrą, stopień 7

    Program roboczy

    … materiał do nauki MedianaJakstatystycznyCharakterystyka Znajomość definicji średniej arytmetycznej, zakresu, trybu i medianyJakstatystycznycechy Przednie i indywidualne...

  5. Program pracy z matematyki klasa 7 ii poziom podstawowy (1)

    Program roboczy

    Jak znaleźć medianę szeregu

    to samo, Jak na 6 klasa. Badania Tematy kończy się wprowadzeniem uczniów w najprostsze statystycznycechy: średni ... M .: Wydawnictwo „Genzher”, 2009. 3. Żochow, V.I. Lekcjealgebra w 7 klasa: książka. dla nauczyciela / V. I. Żochow ...

Inne powiązane dokumenty..

W 1906 roku wielki naukowiec i znany eugenik Francis Galton odwiedził doroczną wystawę zwierząt i drobiu w zachodniej Anglii, gdzie przypadkowo przeprowadził interesujący eksperyment.

Według Jamesa Surowetsky'ego, autora The Wisdom of the Crowd, na jarmarku w Galton odbył się konkurs, w którym ludzie musieli odgadnąć wagę zabitego byka. Zwycięzcą został ten, który podał najbliższą prawdziwej liczbę.

Galton był znany z pogardy dla zdolności intelektualnych zwykłych ludzi. Uważał, że tylko prawdziwi eksperci będą w stanie dokonać dokładnych oświadczeń na temat wagi byka. A 787 uczestników konkursu nie było ekspertami.

Naukowiec zamierzał udowodnić niekompetencję tłumu, wyliczając średnią z odpowiedzi uczestników. Jakie było jego zdziwienie, gdy okazało się, że otrzymany wynik odpowiadał niemal dokładnie rzeczywistej wadze byka!

Średnia wartość - późny wynalazek

Oczywiście dokładność odpowiedzi zdumiała badacza. Ale jeszcze bardziej niezwykły jest fakt, że Galton w ogóle pomyślał o wykorzystaniu średniej.

W dzisiejszym świecie średnie i tak zwane mediany są wszędzie: średnia temperatura w Nowym Jorku w kwietniu wynosi 52 stopnie Fahrenheita; Stephen Curry zdobywa średnio 30 punktów na mecz; Średni dochód gospodarstwa domowego w USA wynosi 51 939 USD rocznie.

Jednak pomysł, że wiele różnych wyników może być reprezentowanych przez jedną liczbę, jest całkiem nowy. Aż do XVII wieku średnie nie były powszechnie używane.

Jak powstała i rozwinęła się koncepcja średnich i median? I jak to się stało, że stała się główną techniką pomiarową w naszych czasach?

Przewaga średnich nad medianami miała daleko idące konsekwencje dla naszego rozumienia informacji. I często sprowadzało to ludzi na manowce.

Wartości średnie i mediany

Wyobraź sobie, że opowiadasz historię o czterech osobach, które jadły z tobą wczoraj kolację w restauracji. Dałbyś jednemu z nich 20 lat, drugiemu 30, trzeciemu 40, a czwartemu 50. Co powiedziałbyś o ich wieku w swojej historii?

Najprawdopodobniej nazwiesz ich średnim wiekiem.

Średnia jest często używana do przekazywania informacji o czymś, a także do opisu zestawu pomiarów. Technicznie średnia jest tym, co matematycy nazywają „średnią arytmetyczną” – sumą wszystkich pomiarów podzieloną przez liczbę pomiarów.

Chociaż słowo „średnia” jest często używane jako synonim słowa „mediana” (mediana), to drugie jest częściej określane jako środek czegoś. To słowo pochodzi od łacińskiego „medianus”, co oznacza „środek”.

Mediana wartości w starożytnej Grecji

Historia wartości mediany wywodzi się z nauk starożytnego greckiego matematyka Pitagorasa. Dla Pitagorasa i jego szkoły mediana miała jasną definicję i bardzo różniła się od dzisiejszego rozumienia średniej. Był używany tylko w matematyce, a nie w analizie danych.

W szkole pitagorejskiej medianą była średnia liczba w trzyczłonowym ciągu liczb, w stosunku „równym” do sąsiednich wyrazów. „Równy” stosunek może oznaczać tę samą odległość. Na przykład numer 4 w rzędzie 2,4,6. Jednak może również wyrażać postęp geometryczny, na przykład 10 w sekwencji 1,10,100.

Statystyk Churchill Eisenhart wyjaśnia, że ​​w starożytnej Grecji mediana nie była używana jako przedstawiciel ani substytut żadnego zestawu liczb. Po prostu oznaczało środek i było często używane w dowodach matematycznych.

Eisenhart spędził dziesięć lat badając średnią i medianę. Początkowo próbował znaleźć reprezentatywną funkcję mediany we wczesnych konstrukcjach naukowych. Zamiast tego odkrył jednak, że większość wczesnych fizyków i astronomów polegała na pojedynczych, umiejętnie wykonanych pomiarach i nie mieli metodologii wyboru najlepszego wyniku spośród wielu obserwacji.

Współcześni badacze opierają swoje wnioski na gromadzeniu dużych ilości danych, jak na przykład biolodzy badający ludzki genom. Z drugiej strony starożytni naukowcy mogli wykonać kilka pomiarów, ale do budowy swoich teorii wybrali tylko najlepsze.

Jak napisał historyk astronomii Otto Neugebauer, „jest to zgodne ze świadomym pragnieniem starożytnych ludzi, aby zminimalizować ilość danych empirycznych w nauce, ponieważ nie wierzyli oni w trafność bezpośrednich obserwacji”.

Na przykład grecki matematyk i astronom Ptolemeusz obliczył średnicę kątową Księżyca za pomocą metody obserwacji i teorii ruchu Ziemi. Jego wynik to 31'20. Dziś wiemy, że średnica Księżyca wynosi od 29'20 do 34'6, w zależności od odległości od Ziemi. Ptolemeusz wykorzystał niewiele danych w swoich obliczeniach, ale miał wszelkie powody, by sądzić, że są one dokładne.

Eisenhart pisze: „Należy pamiętać, że stosunek między obserwacją a teorią w starożytności był inny niż obecnie. Wyniki obserwacji rozumiano nie jako fakty, do których teoria powinna być dostosowana, ale jako konkretne przypadki, które mogą być użyteczne jedynie jako przykłady ilustrujące prawdziwość teorii.

W końcu naukowcy zwrócą się do reprezentatywnych pomiarów danych, ale początkowo nie używano w tej roli ani średnich, ani median. Od starożytności do współczesności używano innego pojęcia matematycznego jako takiego reprezentatywnego środka - połowy sumy wartości skrajnych.

Połowa sumy wartości ekstremalnych

Nowe narzędzia naukowe prawie zawsze wynikają z potrzeby rozwiązania określonego problemu w jakiejś dyscyplinie. Potrzeba znalezienia najlepszej wartości spośród wielu pomiarów wynikała z potrzeby dokładnego określenia położenia geograficznego.

Gigant intelektualny z XI wieku, Al-Biruni, jest znany jako jeden z pierwszych ludzi, którzy zastosowali metodologię reprezentatywnych znaczeń. Al-Biruni napisał, że gdy miał do dyspozycji wiele miar i chciał spośród nich znaleźć najlepszy, stosował następującą „regułę”: trzeba znaleźć liczbę odpowiadającą środku między dwiema skrajnymi wartościami. Przy obliczaniu połowy sumy wartości ekstremalnych wszystkie liczby między wartościami maksymalnymi i minimalnymi nie są brane pod uwagę, ale znajduje się tylko średnia z tych dwóch liczb.

Al-Biruni stosował tę metodę w różnych dziedzinach, w tym do obliczania długości geograficznej miasta Ghazni, które znajduje się na terytorium współczesnego Afganistanu, a także w swoich badaniach właściwości metali.

Jednak w ciągu ostatnich kilku stuleci połowa sumy skrajności była używana coraz rzadziej. W rzeczywistości we współczesnej nauce nie ma to żadnego znaczenia. Wartość mediany zastąpiła połowę sumy.

Przejście do średnich

Na początku XIX wieku użycie mediany / średniej stało się powszechną metodą znajdowania najdokładniej reprezentatywnej wartości z grupy danych. Friedrich von Gauss, wybitny matematyk swoich czasów, napisał w 1809 r.: „Uważano, że jeśli pewna liczba została określona na podstawie kilku bezpośrednich obserwacji przeprowadzonych w tych samych warunkach, to średnia arytmetyczna jest najbardziej prawdziwą wartością. Jeśli nie jest to do końca ścisłe, to przynajmniej bliskie rzeczywistości, dlatego zawsze można na nim polegać.

Dlaczego nastąpiła taka zmiana metodologii?

Odpowiedź na to pytanie jest dość trudna. W swoich badaniach Churchill Eisenhart sugeruje, że metoda znajdowania średniej arytmetycznej mogła wywodzić się z dziedziny pomiaru dewiacji magnetycznej, czyli znajdowania różnicy między kierunkiem igły kompasu wskazującej północ a północą rzeczywistą. Pomiar ten był niezwykle ważny w epoce odkryć.

Eisenhart stwierdził, że do końca XVI wieku większość naukowców mierzących dewiację magnetyczną stosowała metodę ad hoc (z łac. „do tego, na tę okazję, w tym celu”) przy wyborze najdokładniejszego pomiaru.

Ale w 1580 roku naukowiec William Borough podszedł do problemu inaczej. Dokonał ośmiu różnych pomiarów ugięcia, porównał je i doszedł do wniosku, że najdokładniejszy odczyt mieści się w przedziale od 11 ⅓ do 11 ¼ stopnia. Prawdopodobnie wyliczył średnią arytmetyczną, która mieściła się w tym przedziale. Jednak sam Borough nie nazwał otwarcie swojego podejścia nową metodą.

Przed 1635 r. w ogóle nie było jednoznacznych przypadków używania wartości średniej jako liczby reprezentatywnej. Jednak właśnie wtedy angielski astronom Henry Gellibrand wykonał dwa różne pomiary odchylenia magnetycznego. Jeden wykonano rano (11 stopni), a drugi po południu (11 stopni i 32 minuty). Obliczając najprawdziwszą wartość, napisał:

„Jeżeli znajdziemy średnią arytmetyczną, możemy z dużym prawdopodobieństwem stwierdzić, że wynik dokładnego pomiaru powinien wynosić około 11 stopni 16 minut”.

Jest prawdopodobne, że po raz pierwszy użyto średniej jako najbliższej prawdy!

Słowo „średnia” było używane w języku angielskim na początku XVI wieku w odniesieniu do strat finansowych spowodowanych uszkodzeniem statku lub ładunku podczas podróży. Przez kolejne sto lat oznaczał dokładnie te straty, które obliczano jako średnią arytmetyczną. Na przykład, jeśli statek uległ uszkodzeniu podczas rejsu i załoga musiała wyrzucić jakiś towar za burtę, aby uratować wagę statku, inwestorzy ponieśli stratę finansową równą kwocie ich inwestycji – straty te zostały obliczone w taki sam sposób, jak Średnia arytmetyczna. Tak więc stopniowo wartości średniej (średniej) i średniej arytmetycznej zbiegły się.

Wartość mediany

Obecnie średnia lub średnia arytmetyczna jest głównym sposobem wyboru reprezentatywnej wartości zestawu pomiarów. Jak to się stało? Dlaczego tej roli nie przypisano wartości mediany?

Francis Galton był środkowym mistrzem

Termin „wartość mediany” (mediana) – wyraz środkowy w szeregu liczb, dzielący ten szereg przez połowę – pojawił się mniej więcej w tym samym czasie, co średnia arytmetyczna. W 1599 roku matematyk Edward Wright, który pracował nad problemem odchylenia normalnego kompasu, po raz pierwszy zasugerował użycie wartości mediany.

„... Powiedzmy, że wielu łuczników strzela do jakiegoś celu. Cel jest następnie usuwany. Jak dowiedzieć się, gdzie był cel? Musisz znaleźć środkowe miejsce między wszystkimi strzałkami. Podobnie wśród zbioru wyników obserwacji najbliższy prawdy będzie ten pośrodku.

Mediana była szeroko stosowana w XIX wieku, stając się wówczas nieodzowną częścią każdej analizy danych. Posługiwał się nim także Francis Galton, wybitny dziewiętnastowieczny analityk. W historii ważenia byków na początku tego artykułu Galton pierwotnie użył mediany jako reprezentacji opinii tłumu.

Wielu analityków, w tym Galton, preferowało medianę, ponieważ łatwiej jest ją obliczyć dla mniejszych zbiorów danych.

Jednak mediana nigdy nie była bardziej popularna niż średnia. Najprawdopodobniej stało się tak ze względu na specjalne właściwości statystyczne związane z wartością średnią, a także jej związek z rozkładem normalnym.

Zależność między rozkładem średnim a rozkładem normalnym

Kiedy wykonujemy wiele pomiarów, wyniki mają, jak mówią statystycy, „rozkład normalny”. Oznacza to, że jeśli te dane zostaną wykreślone na wykresie, to punkty na nim będą przedstawiać coś podobnego do dzwonka. Jeśli je połączysz, otrzymasz krzywą w kształcie dzwonu. Wiele statystyk pasuje do rozkładu normalnego, takich jak wzrost ludzi, IQ i najwyższa roczna temperatura.

Gdy dane mają rozkład normalny, średnia będzie bardzo zbliżona do najwyższego punktu na krzywej dzwonowej, a bardzo duża liczba pomiarów będzie zbliżona do średniej. Istnieje nawet wzór, który przewiduje, ile pomiarów będzie w pewnej odległości od średniej.

Obliczenie średniej daje więc badaczom wiele dodatkowych informacji.

Związek średniej z odchyleniem standardowym daje jej wielką zaletę, ponieważ mediana takiej zależności nie ma. To połączenie jest ważną częścią analizy danych eksperymentalnych i statystycznego przetwarzania informacji. Dlatego średnia stała się rdzeniem statystyki i wszystkich nauk, które wyciągają wnioski z wielu danych.

Zaletą średniej jest również to, że jest ona łatwo obliczana przez komputery. Chociaż wartość mediany dla małej grupy danych jest dość łatwa do samodzielnego obliczenia, znacznie łatwiej jest napisać program komputerowy, który znalazłby wartość średnią. Jeśli korzystasz z programu Microsoft Excel, prawdopodobnie wiesz, że funkcja mediany nie jest tak łatwa do obliczenia, jak funkcja wartości średniej.

W rezultacie, ze względu na dużą wartość naukową i łatwość obsługi, wartość średnia stała się główną wartością reprezentatywną. Jednak ta opcja nie zawsze jest najlepsza.

Zalety wartości mediany

W wielu przypadkach, gdy chcemy obliczyć środek rozkładu, mediana jest najlepszą miarą. Wynika to z faktu, że wartość średnia jest w dużej mierze określana przez pomiary ekstremalne.

Wielu analityków uważa, że ​​bezmyślne posługiwanie się średnią negatywnie wpływa na nasze rozumienie informacji ilościowych. Ludzie patrzą na średnią i myślą, że to „normalne”. Ale w rzeczywistości można go zdefiniować za pomocą jednego terminu, który mocno wyróżnia się z jednorodnych szeregów.

Wyobraź sobie analityka, który chce poznać reprezentatywną wartość pięciu domów. Cztery domy są warte 100 000 $, a piąty 900 000 $. Średnia wynosiłaby wówczas 200 000 USD, a mediana 100 000 USD. W tym, podobnie jak w wielu innych przypadkach, wartość mediany pozwala lepiej zrozumieć to, co można nazwać „standardem”.

Rozumiejąc, jak skrajne wartości mogą wpływać na średnią, wartość mediany jest używana do odzwierciedlenia zmian w dochodach gospodarstw domowych w USA.

Mediana jest też mniej wrażliwa na „brudne” dane, z którymi mają dziś do czynienia analitycy. Wielu statystyków i analityków zbiera informacje, przeprowadzając wywiady z ludźmi w Internecie. Jeśli użytkownik przypadkowo doda dodatkowe zero do odpowiedzi, co zmieni 100 w 1000, wówczas ten błąd wpłynie na średnią znacznie bardziej niż na medianę.

Średnia czy mediana?

Wybór między medianą a średnią ma daleko idące implikacje, od naszego zrozumienia wpływu leków na zdrowie po naszą wiedzę o tym, jaki jest standardowy budżet rodziny.

Ponieważ gromadzenie i analiza danych w coraz większym stopniu decyduje o tym, jak rozumiemy świat, tak samo jak wartość ilości, których używamy. W idealnym świecie analitycy użyliby zarówno średniej, jak i mediany do wykreślenia danych.

Ale żyjemy w warunkach ograniczonego czasu i uwagi. Z powodu tych ograniczeń często musimy wybrać tylko jeden. W wielu przypadkach preferowana jest wartość mediany.

KATEGORIE

POPULARNE ARTYKUŁY

2022 „kingad.ru” - badanie ultrasonograficzne narządów ludzkich