Медіана вибіркових даних. Функція медіана в excel для виконання статистичного аналізу

Поряд із середніми величинами як статистичні характеристики варіаційних рядів розподілу розраховуються структурні середні – модаі медіана.
Мода(Mo) є значення досліджуваного ознаки, що повторюється з найбільшою частотою, тобто. мода - значення ознаки, що зустрічається найчастіше.
Медіаною(Me) називається значення ознаки, що припадає на середину ранжированной (упорядкованої) сукупності, тобто. медіана – центральне значення варіаційного ряду.
Головна властивість медіани полягає в тому, що сума абсолютних відхилень значень ознаки від медіани менша, ніж від будь-якої іншої величини ∑|x i - Me|=min.

Визначення моди та медіани за несгрупованими даними

Розглянемо визначення моди та медіани за несгрупованими даними. Припустимо, робочі бригади, що з 9 людина, мають такі тарифні розряди: 4 3 4 5 3 3 6 2 6 . Оскільки у цій бригаді найбільше робочих 3-го розряду, цей тарифний розряд буде модальним. Mo = 3.
Для визначення медіани необхідно провести ранжування: 2 3 3 3 4 4 5 6 6 . Центральним у цьому ряду є робітник 4-го розряду, отже, цей розряд і буде медіанним. Якщо ранжований ряд включає парне число одиниць, медіана визначається як середня з двох центральних значень.
Якщо мода відбиває найпоширеніший варіант значення ознаки, то медіана практично виконує функції середньої для неоднорідної, яка підпорядковується нормальному закону розподілу сукупності. Проілюструємо її пізнавальне значення наступним прикладом.
Допустимо, нам необхідно дати характеристику середнього доходу групи людей, що налічує 100 осіб, з яких 99 мають доходи в інтервалі від 100 до 200 доларів на місяць, а місячні доходи останнього становлять 50 000 доларів (табл. 1).
Таблиця 1 – Місячні доходи досліджуваної групи людей. Якщо скористатися середньою арифметичною, то отримаємо середній дохід, що дорівнює приблизно 600 – 700 доларів, який має мало спільного з доходами основної частини групи. Медіана ж, рівна у разі Me = 163 долара, дозволить дати об'єктивну характеристику рівня доходів 99 % цієї групи людей.
Розглянемо визначення моди та медіани за згрупованими даними (рядами розподілу).
Припустимо, розподіл робітників всього підприємства загалом за тарифним розрядом має такий вид (табл. 2).
Таблиця 2 - Розподіл робітників підприємства за тарифним розрядом

Розрахунок моди та медіани для дискретного ряду

Розрахунок моди та медіани для інтервального ряду

Розрахунок моди та медіани для варіаційного ряду

Визначення моди по дискретному варіаційному ряду

Використовується побудований раніше ряд значень ознаки, відсортованих за величиною. Якщо обсяг вибірки непарний, беремо центральне значення; якщо обсяг вибірки парний, беремо середнє арифметичне двох центральних значень.
Визначення моди по дискретному варіаційному ряду: найбільшу частоту (60 осіб) має 5-й тарифний розряд, отже, він і є модальним. Mo = 5.
Для визначення медіанного значення ознаки за такою формулою знаходять номер медіанної одиниці ряду (N Me): де n - обсяг сукупності.
У нашому випадку: .
Отримане дробове значення, що завжди має місце при парному числі одиниць сукупності, вказує, що точна середина знаходиться між 95 і 96 робітниками. Необхідно визначити, до якої групи належать робітники із цими порядковими номерами. Це можна зробити, розрахувавши накопичені частоти. Робітників із цими номерами немає у першій групі, де лише 12 людина, немає їх у другій групі (12+48=60). 95-й та 96-й робітники перебувають у третій групі (12+48+56=116), отже, медіанним є 4-й тарифний розряд.

Розрахунок моди та медіани в інтервальному ряду

На відміну від дискретних варіаційних рядів визначення моди та медіани за інтервальними рядами вимагає проведення певних розрахунків на основі таких формул:
, (5.6)
де x 0- нижня межа модального інтервалу (модальним називається інтервал, що має найбільшу частоту);
i- Величина модального інтервалу;
f Mo- Частота модального інтервалу;
f Mo -1– частота інтервалу, що передує модальному;
f Mo +1- Частота інтервалу, наступного за модальним.
(5.7)
де x 0- нижня межа медіанного інтервалу (медіанним називається перший інтервал, накопичена частота якого перевищує половину загальної суми частот);
i- Величина медіанного інтервалу;
S Me -1– накопичена інтервалу, що передує медіанному;
f Me- Частота медіанного інтервалу.
Проілюструємо застосування цих формул, використовуючи дані табл. 3.
Інтервал із межами 60 – 80 у цьому розподілі буде модальним, т.к. він має максимальну частоту. Використовую формулу (5.6), визначимо моду:

Для встановлення медіанного інтервалу необхідно визначати накопичену частоту кожного наступного інтервалу доти, доки вона не перевищить половини суми накопичених частот (у нашому випадку 50%) (табл. 5.11).
Встановили, що медіанним є інтервал із межами 100 – 120 тис. руб. Визначимо тепер медіану:

Таблиця 3 - Розподіл населення РФ за рівнем середньодушових номінальних грошових доходів у березні 1994р.
групи за рівнем середньодушового місячного доходу, тис. руб.Питома вага населення, %
До 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Понад 3007,7
Разом100,0

Таблиця 4 - Визначення медіанного інтервалу
Таким чином, як узагальнену характеристику значень певної ознаки в одиниць ранжованої сукупності можуть бути використані середня арифметична, мода і медіана.
Основною характеристикою центру розподілу є середня арифметична, для якої характерно те, що всі відхилення від неї (позитивні та негативні) у сумі дорівнюють нулю. Для медіани характерно, що сума відхилень від неї за модулем є мінімальною, а мода є значенням ознаки, яке найчастіше зустрічається.
Співвідношення моди, медіани та середньої арифметичної вказує на характер розподілу ознаки в сукупності, що дозволяє оцінити його асиметрію. У симетричних розподілах всі три показники збігаються. Чим більша розбіжність між модою і середньою арифметичною, тим асиметричніший ряд. Для помірно асиметричних рядів різниця між модою та середньою арифметичною приблизно втричі перевищує різницю між медіаною та середньою, тобто:
|Mo –`x| = 3 | Me - x |.

Визначення моди та медіани графічним методом

Моду та медіану в інтервальному ряду можна визначити графічно. Мода визначається за гістограмою розподілу. Для цього вибирається найвищий прямокутник, який є в даному випадку модальним. Потім праву вершину модального прямокутника з'єднуємо з верхнім правим кутом попереднього прямокутника. А ліву вершину модального прямокутника – з верхнім лівим кутом наступного прямокутника. З точки їхнього перетину опускаємо перпендикуляр на вісь абсцис. Абсцис точки перетину цих прямих і буде модою розподілу (рис. 5.3).


Мал. 5.3. Графічне визначення моди за гістограмою.


Мал. 5.4. Графічне визначення медіани за кумулятом
Для визначення медіани з точки на шкалі накопичених частот (частин), що відповідає 50%, проводиться пряма, паралельна осі абсцис до перетину з кумулятою. Потім із точки перетину опускається перпендикуляр на вісь абсцис. Абсцис точки перетину є медіаною.

Квартили, децилі, перцентілі

Аналогічно з знаходженням медіани в варіаційних рядах розподілу можна знайти значення ознаки у будь-якій порядку одиниці ранжованого ряду. Так, наприклад, можна знайти значення ознаки у одиниць, що ділять ряд на чотири рівні частини, на 10 або на 100 частин. Ці величини називаються "квартілі", "децили", "перцентілі".
Квартілі є значенням ознаки, що ділить ранжовану сукупність на 4 рівновеликі частини.
Розрізняють квартиль нижній (Q 1), що відокремлює ¼ частина сукупності з найменшими значеннями ознаки, і квартиль верхній (Q 3), що осікає ¼ частина з найбільшими значеннями ознаки. Це означає, що 25 % одиниць сукупності будуть меншими за величиною Q 1 ; 25% одиниць будуть укладені між Q1 і Q2; 25% - між Q2 і Q3, а решта 25% перевищують Q3. Середнім квартилем Q2 є медіана.
Для розрахунку квартилів за інтервальним варіаційним рядом використовуються формули:
, ,
де x Q 1– нижня межа інтервалу, що містить нижній квартиль (інтервал визначається за накопиченою частотою, що перша перевищує 25 %);
x Q 3- нижня межа інтервалу, що містить верхній квартиль (інтервал визначається за накопиченою частотою, першою, що перевищує 75%);
i- Величина інтервалу;
S Q 1-1– накопичена частота інтервалу, що передує інтервалу, що містить нижній квартиль;
S Q 3-1- накопичена частота інтервалу, що передує інтервалу, що містить верхній квартиль;
f Q 1- Частота інтервалу, що містить нижній квартиль;
f Q 3- Частота інтервалу, що містить верхній квартиль.
Розглянемо розрахунок нижнього та верхнього квартилів за даними табл. 5.10. Нижній квартиль знаходиться в інтервалі 60 - 80, накопичена частота якого дорівнює 335%. Верхній квартиль лежить в інтервалі 160 – 180 із накопиченою частотою 75,8 %. З урахуванням цього отримаємо:
,
.
Окрім квартилів у варіаційних радах розподілу можуть визначатися децилі – варіанти, що ділять ранжований варіаційний ряд на десять рівних частин. Перший дециль (d 1) ділить сукупність у співвідношенні 1/10 до 9/10, другий дециль (d 1) - у співвідношенні 2/10 до 8/10 і т.д.
Обчислюються вони за формулами:
, .
Значення ознаки, що ділять ряд на 100 частин, називаються перцентилями. Співвідношення медіани, квартилів, децилів та перцентилів представлені на рис. 5.5.

Зарплат в різних галузях економіки, температуру і рівень опадів на одній і тій же території за порівняні періоди часу, врожайність культур, що вирощуються в різних географічних регіонах і т. д. Втім, середня є аж ніяк не єдиним узагальнюючим показником - у ряді випадків для більш точної оцінки підходить така величина як медіана. У статистиці вона широко застосовується як допоміжна описова характеристика розподілу будь-якої ознаки в окремо взятій сукупності. Давайте розберемося, чим вона відрізняється від середньої, і чим викликана необхідність її використання.

Медіана у статистиці: визначення та властивості

Уявіть собі таку ситуацію: на фірмі разом із директором працюють 10 осіб. Прості працівники отримують по 1000 грн., а їхній керівник, який, до того ж, є власником, – 10000 грн. Якщо обчислити середнє арифметичне, то вийде, що у середньому зарплата цьому підприємстві дорівнює 1900 грн. Чи буде справедливим це твердження? Або візьмемо такий приклад, в одній і тій же лікарняній палаті знаходиться дев'ять осіб з температурою 36,6 °С, і одна людина, яка має 41 °С. Арифметичне середнє у разі одно: (36,6*9+41)/10 = 37,04 °С. Але це зовсім не означає, що кожен із присутніх хворий. Все це наштовхує на думку, що однієї середньої часто буває недостатньо, і саме тому на додаток до неї використовується медіана. У статистиці цим показником називають варіант, розташований рівно посередині упорядкованого варіаційного ряду. Якщо порахувати її для наших прикладів, то вийде відповідно 1000 грн. та 36,6 °С. Іншими словами, медіаною в статистиці називається значення, яке ділить ряд навпіл таким чином, що по обидва боки від неї (вниз або вгору) розташована однакова кількість одиниць цієї сукупності. Через цю властивість цей показник має ще кілька назв: 50-й перцентиль або квантиль 0,5.

Як знайти медіану у статистиці

Спосіб розрахунку цієї величини багато в чому залежить від того, який тип варіаційного ряду ми маємо: дискретний чи інтервальний. У першому випадку медіана в статистиці знаходиться досить просто. Все, що потрібно зробити, це знайти суму частот, розділити її на 2 і потім додати результату ½. Найкраще пояснити принцип розрахунку на наступному прикладі. Припустимо, у нас є згруповані дані народжуваності, і потрібно з'ясувати, чому дорівнює медіана.

Номер групи сімей за кількістю дітей

Кількість сімей

Провівши нехитрі підрахунки, отримаємо, що показник, що шукається, дорівнює: 195/2 + ½ = варіанти. Щоб з'ясувати, що це означає, слід послідовно накопичувати частоти, починаючи з найменшої варіанти. Отже, сума перших двох рядків дає нам 30. Зрозуміло, що тут 98 варіантів немає. Але якщо додати до результату частоту третьої варіанти (70), то вийде сума, що дорівнює 100. У ній якраз і знаходиться 98 варіанта, а значить медіаною буде сім'я, у якої є двоє дітей.

Що ж до інтервального ряду, то тут зазвичай використовують таку формулу:

М е = Х Ме + i Ме * (∑f/2 - S Me-1)/f Ме, в якій:

  • Х Ме – перше значення медіанного інтервалу;
  • ∑f – чисельність ряду (сума його частот);
  • i Ме – величина медіанного діапазону;
  • f Ме – частота медіанного діапазону;
  • S Ме-1 – сума кумулятивних частот у діапазонах, що передують медіанному.

Знову ж таки, без прикладу тут розібратися досить складно. Припустимо, є дані за величиною

Зарплата, тис. руб.

Накопичені частоти

Щоб скористатися наведеною вище формулою, спочатку нам потрібно визначити медіанний інтервал. Як такий діапазон вибирають той, накопичена частота якого перевищує половину всієї суми частот або дорівнює їй. Отже, розділивши 510 на 2, отримуємо, що цьому критерію відповідає інтервал зі значенням зарплати від 250 000 руб. до 300 000 руб. Тепер можна підставляти всі дані у формулу:

М е = Х Ме + i Ме * (∑f/2 - S Ме-1) / f Ме = 250 + 50 * (510/2 - 170) / 115 = 286,96 тис. руб.

Сподіваємося, наша стаття виявилася корисною, і тепер ви маєте чітке уявлення про те, що таке медіана у статистиці та як її слід розраховувати.

Для обчислення медіани у MS EXCEL існує спеціальна функція МЕДІАНА (). У цій статті дамо визначення медіани та навчимося обчислювати її для вибірки та для заданого закону розподілу випадкової величини.

Почнемо з медіанидля вибірок(Тобто для фіксованого набору значень).

Медіана вибірки

Медіана(median) – це число, яке є серединою множини чисел: половина чисел множини більше, ніж медіана, а половина чисел менше, ніж медіана.

Для обчислення медіанинеобхідно спочатку (значення в вибірці). Наприклад, медіаноюдля вибірки (2; 3; 3; 4 ; 5; 7; 10) буде 4. Т.к. всього в вибірці 7 значень, три з них менше, ніж 4 (тобто 2; 3; 3), а три значення більше (тобто 5; 7; 10).

Якщо множина містить парну кількість чисел, то обчислюється для двох чисел, що знаходяться в середині множини. Наприклад, медіаноюдля вибірки (2; 3; 3 ; 6 ; 7; 10) буде 4,5, т.к. (3+6)/2=4,5.

Для визначення медіаниу MS EXCEL існує однойменна функція МЕДІАНА(), англійський варіант MEDIAN().

Медіанане обов'язково збігається з . Збіг має місце лише в тому випадку, якщо значення у вибірці розподілені симетрично щодо середнього. Наприклад, для вибірки (1; 2; 3 ; 4 ; 5; 6) медіанаі середнядорівнюють 3,5.

Якщо відома Функція розподілу F(х) або функція щільності ймовірності p(х), то медіануможна знайти з рівняння:

Наприклад, вирішивши аналітичним способом це рівняння для Логнормального розподілу lnN(μ; σ 2), отримаємо, що медіанаобчислюється за такою формулою =EXP(μ). При μ=0, медіана дорівнює 1.

Зверніть увагу на точку Функції розподілу, для котрої F(х) = 0,5(Див. картинку вище) . Абсцис цієї точки дорівнює1. Це і є значення медіани, що збігається з раніше обчисленим значенням за формулою em.

У MS EXCEL медіанудля логнормального розподілу LnN(0;1) можна обчислити за формулою =ЛОГНОРМ.ОБР(0,5;0;1).

Примітка: Нагадаємо, що інтеграл від по всій області завдання випадкової величини дорівнює одиниці.

Тому лінія медіани (х = Медіана) ділить площу під графіком функції щільності ймовірностіна дві рівні частини.

У силу того, що дослідник не має даних про обсяг продажу в кожному обмінному пункті, розрахунок середньої арифметичної з метою визначення середньої ціни за долар недоцільний.

Медіана ряду чисел

Однак можна визначити значення ознаки, яке носить назву медіана (Ме). Медіана

у нашому прикладі

Номер медіани: №Ме =;

Мода

Таблиця 3.6.

f- Сума частот ряду;

S накопичувальні частоти

12_

_

S – накопичені частоти.

На рис. 3.2. Зображено гістограму низки розподілу банків за розміром прибутку (за даними табл. 3.6.).

х - розмір прибутку, млн. руб.,

f - Число банків.

"МЕДІАНА ПОРЯДОЧНОГО РЯДУ"

Текстова HTML-версія публікації


Конспект уроку алгебри у 7 класі

Тема уроку: «МЕДІАНА ПОРЯДОЧНОГО РЯДУ».

вчитель Озерної школи філія МКОУ Бурківська ЗОШ Єрьоменко Тетяна Олексіївна
Цілі:
поняття медіани як статистичної характеристики упорядкованого ряду; формувати вміння знаходити медіану для впорядкованих рядів з парним та непарним числом членів; формувати вміння інтерпретувати значення медіани залежно від практичної ситуації; закріплення поняття середнього арифметичного набору чисел. Розвивати навички самостійної роботи. Формувати інтерес до математики.
Хід уроку

Усна робота.
Дано ряди: 1) 4; 1; 8; 5; 1; 2); 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7,3; 6. Знайдіть: а) найбільше та найменше значення кожного ряду; б) розмах кожного ряду; в) моду кожного ряду.
ІІ. Пояснення нового матеріалу.
Робота з підручника. 1. Розглянемо завдання з п. 10 підручника. Що означає впорядкований ряд? Підкреслю, що перед знаходженням медіани потрібно завжди впорядкувати низку даних. 2.На дошці знайомимося з правилами знаходження медіани для рядів з парним та непарним числом членів:
Медіаною

упорядкованого

ряду
чисел
з

непарним

числом

членів

називається число, записане посередині, а
медіаною

упорядкованого ряду
чисел
з парною кількістю членів
називається середнє арифметичне двох чисел, записаних посередині.
Медіаною

довільного

ряду
називається медіана 1 3 1 7 5 4 відповідного впорядкованого ряду.
Зазначу, що показники-середнє арифметичне, мода та медіана по

різному

характеризують

дані,

отримані

результаті

спостережень.

ІІІ. Формування умінь та навичок.
1-ша група. Вправи застосування формул знаходження медіани впорядкованого і невпорядкованого ряду. 1.
№ 186.
Рішення:а) Число членів ряду п= 9; медіана Ме= 41; б) п= 7, ряд упорядкований, Ме= 207; в) п= 6, ряд упорядкований, Ме= = 21; г) п= 8, ряд упорядкований, Ме= = 2,9. Відповідь: а) 41; б) 207; в) 21; г) 2,9. Учні коментують спосіб знаходження медіани. 2. Знайдіть середнє арифметичне та медіану ряду чисел: а) 27, 29, 23, 31, 21, 34; в); 1. б) 56, 58, 64, 66, 62, 74. Рішення:Для знаходження медіани необхідно кожен ряд упорядкувати: а) 21, 23, 27, 29, 31, 34. п = 6; X = = 27,5; Ме= = 28; 20 22 2 + 2, 6 3, 2 2 + 1125; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + б) 56, 58, 62, 64, 66, 74.

Як знайти медіану у статистиці

п = 6; X = 63,3; Ме= = 63; в); 1. п = 5; X = : 5 = 3: 5 = 0,6; Ме = . 3.
№ 188
(Усно). Відповідь: так; б) ні; в) ні; г) так. 4. Знаючи, що в упорядкованому ряді міститься тчисел, де т– непарне число, вкажіть номер члена, який є медіаною, якщо тодно: а) 5; б) 17; в) 47; г) 201. Відповідь: а) 3; б) 9; в) 24; г) 101. 2-я група. Практичні завдання на знаходження медіани відповідного ряду та інтерпретацію отриманого результату. 1.
№ 189.
Рішення:Число членів ряду п= 12. Для знаходження медіани ряд потрібно впорядкувати: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Ме= = 176. Виробіток за місяць був більшим за медіану у наступних членів артілі: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125 ; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 2 XX+ + = 1) Квітко; 4) Бобків; 2) Баранів; 5) Рилов; 3) Антонов; 6) Астаф'єв. Відповідь: 176. 2.
№ 192.
Рішення:Упорядкуємо ряд даних: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; кількість членів ряду п= 20. Розмах A = x max – x min = 42 - 30 = 12. Мода Мо= 32 (це значення зустрічається 6 разів – частіше за інші). Медіана Ме= = 35. У разі розмах показує найбільший розкид часу на обробку деталі; мода показує найбільш типове значення часу обробки; медіана – час обробки, який перевищили половина токарів. Відповідь: 12; 32; 35.
IV. Підсумок уроку.
– Що називається медіаною низки чисел? – Чи може медіана ряду чисел не співпадати з жодним із чисел ряду? – Яка кількість є медіаною впорядкованого ряду, що містить 2 пчисел? 2 п- 1 чисел? – Як знайти медіану невпорядкованого ряду?
Домашнє завдання:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 XX + + =

У розділі основна загальна освіта

Мода та медіана

До середніх величин відносять також моду та медіану.

Медіану та моду часто використовують як середню характеристику в тих сукупностях, де розрахунок середньої (арифметичної, гармонійної та ін.) неможливий чи недоцільний.

Наприклад, вибіркове обстеження м. Омську 12 комерційних пунктів обміну валюти дозволило зафіксувати різні ціни за долар за його продажу (дані на 10 жовтня 1995 р. при біржовому курсі долара -4493руб).

У силу того, що дослідник не має даних про обсяг продажу в кожному обмінному пункті, розрахунок середньої арифметичної з метою визначення середньої ціни за долар недоцільний. Однак можна визначити значення ознаки, яке носить назву медіана (Ме). Медіаналежить у середині ранжованого ряду і ділить його навпіл.

Розрахунок медіани за несгрупованими даними проводиться так:

а) розташуємо індивідуальні значення ознаки у порядку, що зростає:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

б) визначимо порядковий номер медіани за такою формулою:

у нашому прикладі це означає, що медіана в даному випадку розташована між шостим і сьомим значеннями ознаки ранжированному ряду, так як ряд має парне число індивідуальних значень. Таким чином, Ме дорівнює середній арифметичній із сусідніх значень: 4550, 4560.

в) розглянемо порядок обчислення медіани у разі непарного числа індивідуальних значень.

Припустимо, ми спостерігаємо не 12, а 11 пунктів обміну валюти, тоді ранжований ряд буде виглядати так (відкидаємо 12-й пункт):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Номер медіани: №Ме =;

на шостому місці стоїть = 4560, який є медіаною: Ме=4560. По обидва боки від неї є однакове число пунктів.

Мода- Це найбільш часто зустрічається значення ознаки одиниць даної сукупності. Вона відповідає певному значенню ознаки.

У нашому випадку модальною ціною за долар можна назвати 4560 руб. Це значення повторюється 4 рази, частіше, ніж всі інші.

На практиці моду та медіану знаходять, як правило, за згрупованими даними. У результаті угруповання було отримано низку розподілу банків за величиною отриманого прибутку протягом року (табл. 3.6.).

Таблиця 3.6.

Угруповання банків за величиною отриманого прибутку за рік

Для визначення медіани слід підрахувати суму накопичувальних частот. Нарощування разом продовжується до отримання накопичувальної суми частот, що перевищує половину суми частот. У прикладі сума накопичених частот (12), перевищує половину всіх значень (20:2). Цього значення відповідає медіанний інтервал, який містить медіану (5,5 - 6,4). Визначимо її значення за такою формулою:

де початкове значення інтервалу, що містить медіану;

- Величина медіанного інтервалу;

f- Сума частот ряду;

- Сума накопичувальних частот, що передують медіанному інтервалу;

- Частота медіанного інтервалу.

Отже, 50% банків мають прибуток 6,1 млн. крб., а 50% банків — понад 6,1 млн. крб.

Найбільша частота відповідає інтервалу 5,5 - 6,4, тобто. мода повинна бути в цьому інтервалі. Її величину визначимо за такою формулою:

де - Початкове значення інтервалу, що містить моду;

- Величина модального інтервалу;

- Частота модального інтервалу;

- Частота інтервалу, що передує модальному;

- Частота інтервалу, наступного за модальним.

Наведена формула моди може бути використана у варіаційних рядах із рівними інтервалами.

Отже, у цій сукупності найчастіше зустрічається обсяг прибутку 6,10 млн. крб.

Медіану та моду можна визначити графічно. Медіана визначається за кумулятом (рис. 3.1.). Для її побудови треба розрахувати накопичувальні частоти та частоти. Накопичувальні частоти показують, скільки одиниць сукупності мають значення ознаки не більше, ніж значення, що розглядається, і визначається послідовним підсумовуванням частот інтервалів. При побудові кумулятии інтервального ряду розподілу нижньої межі першого інтервалу відповідає частота, що дорівнює нулю, а верхній межі - вся частота даного інтервалу. Верхній межі другого інтервалу відповідає накопичувальна частота, що дорівнює сумі частот перших двох інтервалів, і т.д.

Побудуємо кумулятивну криву за даними табл. 6 про розподіл банків за розміром прибутку.

S накопичувальні частоти

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х прибуток

Мал. 3.1. Кумулята низки розподілу банків за розміром прибутку:

х - розмір прибутку, млн. руб.,

S – накопичені частоти.

Для визначення медіани висоту найбільшої ординати, що відповідає загальній чисельності сукупності, поділяють навпіл. Через отриману точку проводять пряму, паралельну осі абсцис до перетину її з кумулятою. Абсцис точки перетину є медіаною.

Мода визначається за гістограмою розподілу. Гістограма будується так:

на осі абсцис відкладаються рівні відрізки, що у прийнятому масштабі відповідають величині інтервалів варіаційного ряду. На відрізках будуються прямокутники, площі яких пропорційні до частот (або частостей) інтервалу.

Медіана у статистиці

3.2. Зображено гістограму низки розподілу банків за розміром прибутку (за даними табл. 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х

Мал. 3.2. Розподіл комерційних банків за розміром прибутку:

х - розмір прибутку, млн. руб.,

f - Число банків.

Для визначення моди праву вершину модального прямокутника з'єднуємо з верхнім правим кутом попереднього прямокутника, а ліву вершину модального прямокутника - з лівим верхнім кутом наступного прямокутника. Абсцис точки перетину цих прямих і буде модою розподілу.

Медіана (статистика)

Медіана (статистика), у математичній статистиці - число, що характеризує вибірку (наприклад, набір чисел). Якщо всі елементи вибірки різні, то медіана - це таке число вибірки, що рівно половина з елементів вибірки більше за нього, а інша половина менше за нього. У загальному випадку медіану можна знайти, упорядкувавши елементи вибірки за зростанням або спаданням і взявши середній елемент. Наприклад, вибірка (11, 9, 3, 5, 5) після впорядкування перетворюється на (3, 5, 5, 9, 11) та її медіаною є число 5. Якщо у вибірці парне число елементів, медіана може бути не визначена однозначно: для числових даних найчастіше використовують напівсуму двох сусідніх значень (тобто медіану набору (1, 3, 5, 7) приймають 4).

Іншими словами, медіаною в статистиці називається значення, яке ділить ряд навпіл таким чином, що по обидва боки від неї (вниз або вгору) розташована однакова кількість одиниць цієї сукупності.

Завдання №1. Розрахунок середньої арифметичної, модального та медіанного значення

Через цю властивість цей показник має ще кілька назв: 50-й перцентиль або квантиль 0,5.

  • Середнє значення
  • Медіана
  • Мода

Медіана (статистика)

Медіана (статистика), у математичній статистиці - число, що характеризує вибірку (наприклад, набір чисел). Якщо всі елементи вибірки різні, то медіана - це таке число вибірки, що рівно половина з елементів вибірки більше за нього, а інша половина менше за нього. У загальному випадку медіану можна знайти, упорядкувавши елементи вибірки за зростанням або спаданням і взявши середній елемент. Наприклад, вибірка (11, 9, 3, 5, 5) після впорядкування перетворюється на (3, 5, 5, 9, 11) та її медіаною є число 5.

5.5 Мода та медіана. Їх обчислення в дискретних та інтервальних варіаційних рядах

Якщо у вибірці парне число елементів, медіана може бути не визначена однозначно: для числових даних найчастіше використовують напівсуму двох сусідніх значень (тобто медіану набору (1, 3, 5, 7) приймають 4).

Іншими словами, медіаною в статистиці називається значення, яке ділить ряд навпіл таким чином, що по обидва боки від неї (вниз або вгору) розташована однакова кількість одиниць цієї сукупності. Через цю властивість цей показник має ще кілька назв: 50-й перцентиль або квантиль 0,5.

Медіану використовують замість середньої арифметичної, коли крайні варіанти ранжованого ряду (найменша та найбільша) порівняно з іншими виявляються надмірно більшими або надмірно малими.

Функція МЕДІАНА вимірює центральну тенденцію, яка є центром множини чисел у статистичному розподілі. Існує три найбільш поширені способи визначення центральної тенденції:

  • Середнє значення- Середнє арифметичне, яке обчислюється додаванням безлічі чисел з наступним розподілом отриманої суми на їх кількість.
    Наприклад, середнім значенням для чисел 2, 3, 3, 5, 7 і 10 буде 5, яке є результатом розподілу їх суми, що дорівнює 30, на їх кількість, що дорівнює 6.
  • Медіана- Число, яке є серединою безлічі чисел: половина чисел мають значення більші, ніж медіана, а половина чисел - менші.
    Наприклад, медіаною для чисел 2, 3, 3, 5, 7 та 10 буде 4.
  • Мода- Число, що найчастіше зустрічається в даній множині чисел.
    Наприклад, модою для чисел 2, 3, 3, 5, 7 та 10 буде 3.

Урок алгебри у 7 класі.

Тема "Медіана як статистична характеристика".

Вчитель Єгорова Н.І.

Мета уроку: сформувати в учнів уявлення про медіану набору чисел та вміння обчислювати її для нескладних числових наборів, закріплення поняття середнього арифметичного набору чисел.

Тип уроку: пояснення нового матеріалу.

Хід уроку

1. Організаційний момент.

Повідомити тему уроку та сформулювати його цілі.

2. Актуалізація колишніх знань.

Запитання учням:

Що називається середнім арифметичним набором чисел?

Де знаходиться середнє арифметичне всередині набору чисел?

Що характеризує середнє арифметичне набору чисел?

Де часто застосовується середнє арифметичне набір чисел?

Усні завдання:

Знайти середнє арифметичне набору чисел:

Перевірка домашнього завдання.

Підручник: №169, №172.

3. Вивчення нового матеріалу.

На попередньому уроці ми познайомилися з такою статистичною характеристикою, як середнє арифметичне набору чисел. Сьогодні ми присвятимо урок ще одній статистичній характеристиці медіані.

Не тільки середнє арифметичне показує, де на числовій прямій розташовуються числа якогось набору та де їхній центр. Іншим показником є ​​медіана.

Медіаною набору чисел називається таке число, яке поділяє набір дві рівні за чисельністю частини. Замість "медіана" можна було б сказати "середина".

Спочатку на прикладах розберемо, як знайти медіану, а потім дамо суворе визначення.

Розглянемо наступний усний приклад із застосуванням проектора

Наприкінці навчального року 11 учнів 7-го класу здали норматив із бігу на 100 метрів. Були зафіксовані такі результати:

Після того, як хлопці пробігли дистанцію, до викладача підійшов Петя і запитав, який у нього результат.

"Найсередній результат: 16,9 секунди", - відповів вчитель

"Чому?" - Здивувався Петя. – Адже середнє арифметичне всіх результатів – приблизно 18,3 секунди, а я пробіг на секунду з лишком краще. І взагалі, результат Каті (18,4) набагато ближчий до середнього, ніж мій”.

“Твій результат середній, тому що п'ять людей пробігли краще, ніж ти, і п'ять – гірше. Тобто ти якраз посередині”, – сказав учитель.

Записати алгоритм знаходження медіани набору чисел:

Упорядкувати числовий набір (скласти ранжований ряд).

Одночасно закреслюємо "найбільше" і "найменше" числа даного набору чисел до тих пір, поки не залишиться одне чи два числа.

Якщо залишилося одне число, воно і є медіана.

Якщо залишилося два числа, то медіаною буде середнє арифметичне двох чисел, що залишилися.

Запропонувати учням самостійно сформулювати визначення медіани набору чисел, потім прочитати у підручнику визначення медіани (стор. 40), далі вирішити № 186(а,б), № 187(а) підручника (стор.41).

Примітка:

Звернути увагу учнів на важливу обставину: медіана практично не є чутливою до значних відхилень окремих крайніх значень наборів чисел. У статистиці це властивість називається стійкістю. Стійкість статистичного показника – дуже важлива властивість, вона страхує нас від випадкових помилок та окремих недостовірних даних.

4. Закріплення вивченого матеріалу.

Вирішення задач.

Позначимо х-середнє арифметичне, Ме-медіана.

Набір чисел: 1,3,5,7,9.

х = (1 +3 +5 +7 +9): 5 = 25:5 = 5,

Набір чисел: 1,3,5,7,14.

х = (1 +3 +5 +7 +14): 5 = 30:5 = 6.

а) Набір чисел: 3,4,11,17,21

б) Набір чисел: 17,18,19,25,28

в) Набір чисел: 25, 25, 27, 28, 29, 40, 50

Висновок: медіана набору чисел, що складається з непарного числа членів дорівнює числу, що стоїть посередині.

а) Набір чисел: 2, 4, 8, 9.

Ме = (4 +8): 2 = 12: 2 = 6

б) Набір чисел: 1,3,5,7,8,9.

Ме = (5 +7): 2 = 12: 2 = 6

Медіана набору чисел, що містить парне число членів дорівнює напівсумі двох чисел, що стоять посередині.

Учень отримав протягом чверті такі оцінки з алгебри:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Знайдіть середній бал та медіану цього набору.

Знайдемо середній бал, тобто середнє арифметичне:

х = (5 +4 +2 +5 +5 +4 +4 +5 +5 +5): 10 = 44:10 = 4,4

Знайдемо медіану цього набору чисел:

Упорядкуємо набір чисел: 2,4,4,4,5,5,5,5,5,5

Усього 10 чисел, щоб знайти медіану треба взяти два середні числа і знайти їхню суму.

Ме = (5+5): 2 = 5

Питання до учнів: Якби ви були вчителем, яку ви поставили б оцінку за чверть цьому учневі? Відповідь обґрунтуйте.

Президент компанії отримує зарплату 300 000 руб. три його заступники одержують по 150000 руб., Сорок службовців - по 50000 руб. та зарплата прибиральниці становить 10000 руб. Знайдіть середнє арифметичне та медіану зарплат у компанії. Яку з цих характеристик вигідніше використати президенту з рекламною метою?

х = (300000 +3 · 150000 +40 · 50000 +10000): (1 +3 +40 +1) = 2760000: 45 = 61333,33 (руб.)

№ 6. Усно.

А) Скільки чисел у наборі, якщо його медіаною служить її дев'ятий член?

Б) Скільки чисел у наборі, якщо його медіаною служить середнє арифметичне 7-го та 8-го членів?

В) У наборі з семи чисел найбільше збільшили на 14. Чи зміниться при цьому і як середнє арифметичне і медіана?

Г) Кожне з чисел набору збільшили на 3. Що станеться із середнім арифметичним та медіаною?

Цукерки у магазині продають на вагу. Щоб дізнатися, скільки цукерок міститься в одному кілограмі, Маша вирішила знайти вагу однієї цукерки. Вона зважила кілька цукерок і отримала такі результати:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Для оцінки ваги однієї цукерки придатні обидві показники, т.к. вони не дуже відрізняються один від одного.

Отже, для характеристики статистичної інформації використовують середнє арифметичне та медіану. У багатьох випадках якась із характеристик може не мати жодного змістовного змісту (наприклад, маючи відомості про час дорожньо-транспортних пригод, навряд чи має сенс говорити про середнє арифметичне цих даних).

Домашнє завдання: пункт 10, № 186 (в, г), № 190.

5. Підсумки уроку. Рефлексія.

  1. «Статистичні дослідження: збір та угруповання статистичних даних»

    Урок

    теми, пропоновані для сьомого класу. ТЕМАТИЧНЕ ПЛАНУВАННЯ. § 1. СтатистичніХарактеристики. П 1. Середнє арифметичне, розмах та мода 1ч. П2. Медіанаякстатистичнахарактеристика

  2. Робоча програма навчального курсу «алгебра» у 7 класі (базовий рівень) пояснювальна записка

    Робоча програма

    … п.10 Медіанаякстатистичнахарактеристика 23 п.9 Середнє арифметичне, розмах та мода 24 Контрольна робота № 2 з темі

  3. Робоча програма. Математика. 5 клас с. Канаші. 2011р

    Робоча програма

    … рівнянь. Середнє арифметичне, розмах та мода. Медіанаякстатистичнахарактеристика. Мета – систематизувати та узагальнити відомості про … та навички, отримані на урокахза даними темам(курс алгебри 10 класу). 11 клас(4 години на тиждень...

  4. Наказ №51 від «30» серпень 2012 р. Робоча програма з алгебри 7 клас

    Робоча програма

    … навчальним матеріалом МедіанаякстатистичнахарактеристикаЗнати визначення середнього арифметичного, розмаху, моди та медіаниякстатистичноїХарактеристикиФронтальна та індивідуальна …

  5. Робоча програма з математики 7 клас ii ступінь базовий рівень (1)

    Робоча програма

    Як знайти медіану ряду

    ж, яко 6 класі. Вивчення темизавершується ознайомленням учнів із найпростішими статистичнимихарактеристиками: середнім … М.: Видавничий дім «Генжер», 2009. 3. Жохов, В. І. Урокиалгебрио 7 класі: кн. для вчителя / В. І. Жохов …

Інші схожі документи.

У 1906 році великий вчений і відомий фахівець з євгеніки Френсіс Гальтон відвідав щорічну виставку досягнень тваринництва та птахівництва у західній Англії, де випадково провів цікавий експеримент.

Як зазначає Джеймс Суровецьки, автор книги «Мудрість натовпу», на ярмарку Гальтона зацікавило одне змагання, в рамках якого люди мали вгадати вагу забитого бика. Який назвав найближче до справжнього число оголошувався переможцем.

Гальтон був відомий своєю зневагою до інтелектуальних здібностей пересічних людей. Він вважав, що лише справжні експерти зможуть зробити точні твердження про вагу бика. А 787 учасників змагання не були експертами.

Вчений збирався довести некомпетентність натовпу, обчисливши середню кількість відповідей учасників. Яке ж було його здивування, коли виявилося, що отриманий ним результат майже точно відповідав справжній вазі бика!

Середнє значення - пізніше винахід

Звісно, ​​точність відповіді вразила дослідника. Але ще примітнішим є той факт, що Гальтон взагалі здогадався скористатися середнім значенням.

У сьогоднішньому світі середні і так звані медіанні показники зустрічаються на кожному кроці: середня температура в Нью-Йорку у квітні дорівнює 52 градусам за Фаренгейтом; Стівен Каррі в середньому заробляє 30 очок за гру; медіанний сімейний дохід у США становить $51 939/рік.

Однак ідея про те, що безліч різних результатів можна репрезентувати одним числом, задоволена нова. До 17 століття середні числа взагалі не використовувалися.

Яким чином з'явилася і розвинулася концепція середніх і медіанних значень? І як їй удалося стати головною вимірювальною методикою в наш час?

Переважання середніх значень над медіанними мало далекосяжні наслідки для нашого розуміння інформації. І нерідко воно приводило людей в оману.

Середнє та медіанне значення

Уявіть, що ви розповідаєте історію про чотирьох людей, які вечеряли минулого вечора з вами в ресторані. Одному з них ви дали б 20 років, іншому — 30, третьому — 40, а четвертому — 50. Що ви скажете про їх вік у своїй історії?

Швидше за все, ви назвете їхній середній вік.

Середнє значення часто використовується передачі інформації про що-небудь, і навіть для опису деякого безлічі вимірів. Технічно, середнє значення — те, що математики називають «середнім арифметичним» — сума всіх вимірів, поділена на число вимірів.

Хоча слово "середнє" (average) часто використовується як синонім слова "медіанне" (median), останнім частіше позначається середина чогось. Це слово походить від латинського "medianus", що означає "середина".

Медіанне значення у Стародавній Греції

Історія медіанного значення бере свій початок із вчення давньогрецького математика Піфагора. Для Піфагора та його школи медіана мала чітке визначення і дуже відрізнялася від того, як ми розуміємо середнє значення сьогодні. Воно використовувалося лише у математиці, а чи не в аналізі даних.

У школі піфагорійців медіанне значення було середнім числом у тричленній послідовності чисел, що перебуває у «рівному» відношенні із сусідніми членами. «Рівне» ставлення могло означати однакову відстань. Наприклад, число 4 у рядку 2,4,6. Однак воно також могло виражати геометричну прогресію, наприклад 10 послідовності 1,10,100.

Статистик Черчілль Ейзенхарт пояснює, що в Стародавній Греції, медіанне значення не використовувалося як репрезентуючий чи заміняє якийсь набір чисел. Воно просто означало середину і часто використовувалося в математичних доказах.

Ейзенхарт присвятив цілих десять років вивченню середнього та медіанного значень. Спочатку він намагався знайти репрезентуючу функцію медіани в ранніх наукових побудовах. Однак натомість він виявив, що більшість ранніх фізиків і астрономів спиралися на поодинокі, вміло проведені виміри, і вони не мали методології, що дозволяла вибрати найкращий результат серед безлічі спостережень.

Сучасні дослідники ґрунтують свої висновки на збиранні великих обсягів даних, як, наприклад, біологи, які вивчають людський геном. Давні вчені могли провести кілька вимірів, але вибирали лише найкраще для побудови своїх теорій.

Як писав історик астрономії Отто Нойгебауер, "це узгоджується з усвідомленим прагненням античних людей мінімізувати кількість емпіричних даних у науці, тому що вони не вірили в точність безпосередніх спостережень".

Наприклад, грецький математик та астроном Птолемей обчислив кутовий діаметр Місяця, використовуючи метод спостереження та теорію руху землі. Його результат дорівнював 31'20. Сьогодні ми знаємо, що діаметр Місяця коливається від 29'20 до 34'6 залежно від відстані від Землі. Птолемей у своїх обчисленнях використовував мало даних, але він мав усі підстави вважати, що вони були точними.

Ейзенхарт пише: «Необхідно мати на увазі, що зв'язок між спостереженням і теорією в античності був інший, ніж сьогодні. Результати спостережень розумілися не як факти, під які повинна підлаштовуватися теорія, але як конкретні випадки, які можуть бути корисними лише як ілюстративні приклади істинності теорії»

Зрештою, вчені звернуться до репрезентативних вимірювань даних, але спочатку ні середні, ні медіанні значення не використовувалися в цій ролі. З часів античності до сьогодні як такий репрезентативний засіб використовувався інший математичний концепт — напівсума крайніх значень.

Напівсума крайніх значень

Нові наукові засоби майже завжди виникають із необхідності вирішити певне завдання у будь-якій дисципліні. Необхідність знайти найкраще значення серед безлічі вимірів виникло з потреби точно визначити географічне положення.

Інтелектуальний гігант 11-го століття Аль-Біруні відомий як один з перших людей, які використовували методологію значень, що репрезентують. Аль-Біруні писав, що коли в його розпорядженні було безліч вимірів, і він хотів знайти найкраще серед них, він використав таке «правило»: потрібно відшукати число, що відповідає середині між двома крайніми значеннями. При обчисленні напівсуми крайніх значень не беруться до уваги всі числа між максимальним та мінімальним значеннями, а перебуває середнє лише цих двох чисел.

Аль-Біруні застосовував цей метод у різних галузях, у тому числі для обчислення довготи міста Газні, що знаходиться на території сучасного Афганістану, а також у своїх дослідженнях властивостей металів.

Проте останні кілька століть напівсума крайніх значень використовується дедалі рідше. Насправді, в сучасній науці вона зовсім не актуальна. На місце напівсуми прийшло медіанне значення.

Перехід до середніх значень

На початку 19-го століття використання медіанного/середнього значення стало поширеним методом знаходження найбільш точно репрезентує значення групи даних. Фрідріх фон Гаусс, видатний математик свого часу, в 1809-му році писав: «Вважалося, що якщо деяке число було визначено кількома прямими спостереженнями, досконалими в однакових умовах, то середнє арифметичне значення є справжнім значенням. Якщо воно й не зовсім строге, то принаймні воно близьке до дійсності, і тому на нього завжди можна покластися».

Чому відбулося подібне зрушення в методології?

На це питання важко відповісти. У своєму дослідженні Черчілль Ейзенхарт припускає, що метод знаходження середнього арифметичного міг зародитися в галузі вимірювання магнітного відхилення, тобто у відшуканні відмінності між напрямком стрілки компаса, що вказує на північ і реальною північчю. Цей вимір був украй важливим в епоху Великих Географічних Відкриттів.

Ейзенхарт з'ясував, що до кінця 16-го століття більшість вчених, що вимірювали магнетичне відхилення, використовували метод ad hoc (від лат. «до цього, для даного випадку, для цієї мети») при виборі найбільш точного вимірювання.

Але в 1580 році вчений Вільям Боро підійшов до проблеми інакше. Він взяв вісім різних вимірів відхилення і, порівнявши їх, дійшов висновку, що найбільш точне значення було між 11⅓ і 11? градусами. Ймовірно, він вирахував середнє арифметичне, яке знаходилось у цьому діапазоні. Проте сам Боро відкрито не називав свого підходу новим методом.

До 1635-го року взагалі було однозначних випадків використання середнього значення як репрезентуючого числа. Однак саме тоді англійський астроном Генрі Геллібренд взяв два різні результати вимірювання магнетичного відхилення. Одна з них була зроблена вранці (11 градусів), а інша — вдень (11 градусів та 32 хвилини). Обчислюючи найбільш справжнє значення, він писав:

"Якщо ми знайдемо середнє арифметичне, ми з великою ймовірністю можемо стверджувати, що результат точного вимірювання має бути близько 11 градусів 16 хвилин".

Цілком імовірно, що це був перший випадок використання середнього значення як найближчого до істинного!

Слово "середнє" (average) застосовувалося в англійській мові на початку 16-го століття для позначення фінансових втрат від шкоди, яке отримало судно або вантаж, що перевозився під час плавання. Протягом наступних ста років воно означало саме ці втрати, які вираховувалися як середнє арифметичне. Наприклад, якщо корабель під час плавання був пошкоджений, і команді доводилося викидати за борт деякі товари, щоб зберегти вагу судна, інвестори зазнавали фінансових втрат, еквівалентних сумі їх інвестиції — ці втрати обчислювалися так само, як середнє арифметичне. Так поступово значення середнього (average) та середнього арифметичного зближалися.

Медіанне значення

У наші дні середнє або середнє арифметичне використовуються як основний спосіб для вибору репрезентативного значення безлічі вимірювань. Як це сталося? Чому ця роль була відведена медіанному значенню?

Френк Гальтон був чемпіоном медіанного значення

Термін «медіанне значення» (median) - середній член у ряді чисел, що розділяє цей ряд наполовину - з'явився приблизно в той же час, що середнє арифметичне. У 1599 році математик Едвард Райт, який працював над проблемою нормального відхилення в компасі, вперше запропонував використовувати медіанне значення.

«…Припустимо, безліч лучників стріляють у певну мету. Мету згодом прибирають. Як можна дізнатися, де була мета? Потрібно знайти середнє місце між усіма стрілами. Аналогічно, серед багатьох результатів спостережень найближче до істини буде те, що знаходиться посередині».

Медіанне значення широко використовувалося у ХІХ столітті, ставши обов'язковою частиною будь-якого аналізу даних у той час. Ним також користувався і Френк Гальтон, видатний аналітик дев'ятнадцятого століття. В історії про зважування бика, розказаної на початку цієї статті, Гальтон спочатку використовував медіанне значення як думка натовпу.

Безліч аналітиків, включаючи Гальтона, надавали перевагу медіанному значенню, оскільки його легше розрахувати для невеликих наборів даних.

Тим не менш, медіа значення ніколи не було більш популярним, ніж середнє. Швидше за все, це сталося через особливі статистичні властивості, властиві середньому значенню, а також його ставлення до нормального розподілу.

Зв'язок середнього значення та нормального розподілу

Коли ми проводимо безліч вимірів, їх результати, як свідчать статистики, «нормально розподілені». Це означає, що якщо ці дані нанести на графік, то точки на ньому зображатимуть щось схоже на дзвін. Якщо їх з'єднати, вийде «дзвоноподібна» крива. Нормальному розподілу відповідають багато статистичних даних, наприклад, зростання людей, показник інтелекту, а також показник найвищої річної температури.

Коли дані нормально розподілені, середнє значення буде дуже близьким до вищої точки на дзвоноподібну криву, і дуже велика кількість вимірювань буде близькою до середнього значення. Існує навіть формула, яка передбачає, як багато результатів вимірювань будуть знаходитися на деякій відстані від середнього значення.

Отже, обчислення середнього значення дає дослідникам багато додаткової інформації.

Зв'язок середнього значення зі стандартним відхиленням дає йому велику перевагу, адже у медіанного значення такого зв'язку немає. Цей зв'язок - важлива частина аналізу експериментальних даних та статистичної обробки інформації. Саме тому середнє значення стало ядром статистики та всіх наук, які покладаються у своїх висновках на численні дані.

Перевага середнього значення також пов'язана з тим, що легко обчислюється комп'ютерами. Хоча медіанне значення для невеликої групи даних досить легко обчислити самостійно, все ж таки набагато простіше написати комп'ютерну програму, яка знаходила б середнє значення. Якщо ви користуєтеся Microsoft Excel, то, напевно, знаєте, що медіанну функцію не так просто розрахувати, як функцію середнього значення.

У результаті завдяки великому науковому значенню і простоті використання середнє значення стало головною репрезентативною величиною. Тим не менш, цей варіант далеко не завжди є найкращим.

Переваги медіанного значення

У багатьох випадках, коли хочемо обчислити центральне значення розподілу, медіанне значення є найкращим показником. Так відбувається тому, що середнє значення багато в чому визначається крайніми результатами вимірів.

Багато аналітиків вважають, що бездумне використання середнього значення негативно позначається на нашому розумінні кількісної інформації. Люди дивляться на середнє значення і думають, що це норма. Але насправді воно може бути визначене якимось одним дуже видатним із однорідного ряду членом.

Уявіть собі аналітика, який бажає дізнатися репрезентативне значення вартості п'яти будинків. Чотири будинки коштують $100,000, а п'ятий - $900,000. Середнє значення, таким чином, дорівнюватиме $200,000, а медіанне - $100,000. У цьому, як і в багатьох інших випадках, медіанне значення дає найкраще розуміння того, що можна назвати «стандартом».

Розуміючи, наскільки дуже крайні значення можуть позначитися середньому, відображення змін у сімейних доходах США використовується медіанне значення.

Медіанний показник також менш чутливий до «брудних» даних, з якими сьогодні мають справу аналітики. Багато статистики та аналітики збирають інформацію, опитуючи людей в інтернеті. Якщо користувач випадково додасть у відповідь зайвий нуль, який перетворить 100 на 1000, то ця помилка набагато сильніше позначиться на середньому значенні, ніж медіанному.

Середнє чи медіанне?

Вибір між медіанним та середнім значенням має далекосяжні наслідки — від нашого розуміння впливу ліків на здоров'я до знань щодо того, який сімейний бюджет можна назвати стандартним.

Оскільки збирання та аналіз даних дедалі більше визначає те, як ми розуміємо світ, зростає і значення використовуваних нами величин. В ідеальному світі аналітики використовували б і середнє, і медіа значення для графічного вираження даних.

Але ми живемо в умовах обмеженого часу та уваги. Через ці обмеження часто нам необхідно вибрати лише щось одне. І в багатьох випадках краще саме медіанне значення.

КАТЕГОРІЇ

ПОПУЛЯРНІ СТАТТІ

2024 «kingad.ru» - УЗД дослідження органів людини