Медиана на извадкови данни. Медиана функция в Excel за извършване на статистически анализ

Наред със средните стойности се изчисляват структурни средни като статистически характеристики на вариационния ред на разпределение - модаИ Медиана.
Мода(Mo) представлява стойността на изследвания признак, повтарящ се с най-висока честота, т.е. mode е стойността на характеристиката, която се среща най-често.
Медиана(Me) е стойността на атрибута, който попада в средата на класираната (подредена) популация, т.е. медиана - централната стойност на вариационната серия.
Основното свойство на медианата е, че сумата от абсолютните отклонения на стойностите на атрибута от медианата е по-малка от всяка друга стойност ∑|x i - Me|=min.

Определяне на режим и медиана от негрупирани данни

Обмисли определяне на режим и медиана от негрупирани данни. Да приемем, че работните бригади, състоящи се от 9 души, имат следните категории заплати: 4 3 4 5 3 3 6 2 6 . Тъй като в този екип има най-много работници от 3-та категория, тази тарифна категория ще бъде модална. Mo = 3.
За определяне на медианата е необходимо да се класира: 2 3 3 3 4 4 5 6 6 . Централен в тази серия е работникът от 4-та категория, следователно тази категория ще бъде медианата. Ако класираната поредица включва четен брой единици, тогава медианата се определя като средната стойност на двете централни стойности.
Ако режимът отразява най-често срещания вариант на стойността на атрибута, тогава медианата практически изпълнява функциите на средна стойност за хетерогенна популация, която не се подчинява на нормалния закон на разпределение. Нека илюстрираме когнитивното му значение със следния пример.
Да предположим, че трябва да характеризираме средния доход на група хора от 100 души, от които 99 имат доходи в диапазона от $100 до $200 на месец, а месечният доход на последните е $50 000 (Таблица 1).
Таблица 1 - Месечни доходи на изследваната група хора. Ако използваме средно аритметично, получаваме среден доход от около 600 - 700 долара, който няма много общо с доходите на основната част от групата. Медианата, в този случай равна на Me = 163 долара, ще ни позволи да дадем обективна характеристика на нивото на доходите на 99% от тази група хора.
Разгледайте дефиницията на режима и медианата чрез групирани данни (серия на разпределение).
Да предположим, че разпределението на работниците на цялото предприятие като цяло според тарифната категория има следната форма (Таблица 2).
Таблица 2 - Разпределение на работниците в предприятието според тарифната категория

Изчисляване на режим и медиана за дискретна серия

Изчисляване на режим и медиана за интервална серия

Изчисляване на режим и медиана за вариационна серия

Определяне на режима от серия от дискретни вариации

Използва се поредицата от стойности на функции, изградени по-рано, сортирани по стойност. Ако размерът на извадката е нечетен, вземете централната стойност; ако размерът на извадката е четен, вземаме средната аритметична стойност на двете централни стойности.
Определяне на режима от серия от дискретни вариации: 5-та тарифна категория има най-висока честота (60 души), следователно е модална. Mo = 5.
За да се определи средната стойност на атрибута, числото на средната единица на серията (N Me) се намира по следната формула: , където n е обемът на съвкупността.
В нашия случай: .
Получената дробна стойност, която винаги се среща при четен брой единици от съвкупността, показва, че точната среда е между 95 и 96 работници. Необходимо е да се определи към коя група принадлежат работниците с тези поредни номера. Това може да стане чрез изчисляване на натрупаните честоти. В първата група, където са само 12 души, няма работници с тези бройки, а във втора група ги няма (12+48=60). 95-ти и 96-ти работници са в трета група (12+48+56=116), следователно 4-та категория заплата е медианата.

Изчисляване на мода и медиана в интервална серия

За разлика от дискретните вариационни серии, определянето на модата и медианата от интервални серии изисква определени изчисления въз основа на следните формули:
, (5.6)
Където x0- долната граница на модалния интервал (интервалът с най-висока честота се нарича модален);
азе стойността на модалния интервал;
fMoе честотата на модалния интервал;
f Mo-1е честотата на интервала, предхождащ модала;
f Mo +1е честотата на интервала след модала.
(5.7)
Където x0– долната граница на медианния интервал (медианата е първият интервал, чиято натрупана честота надвишава половината от общата сума на честотите);
азе стойността на средния интервал;
S Me-1- натрупан интервал, предхождащ медианата;
е азе честотата на средния интервал.
Ние илюстрираме приложението на тези формули с помощта на данните в табл. 3.
Интервалът с граници 60 - 80 в това разпределение ще бъде модален, т.к има най-висока честота. Използвайки формула (5.6), определяме режима:

За да се установи медианният интервал, е необходимо да се определи натрупаната честота на всеки следващ интервал, докато тя надхвърли половината от сумата на натрупаните честоти (в нашия случай 50%) (Таблица 5.11).
Установено е, че медианата е интервалът с граници от 100 - 120 хиляди рубли. Сега определяме медианата:

Таблица 3 - Разпределение на населението на Руската федерация по нивото на средния номинален паричен доход на глава от населението през март 1994 г.
Групи по ниво на среден месечен доход на глава от населението, хиляди рублиДял от населението, %
до 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Над 3007,7
Обща сума100,0

Таблица 4 - Дефиниция на медианния интервал
По този начин средната аритметична стойност, модата и медианата могат да се използват като обобщена характеристика на стойностите на определен атрибут за единици от класирана популация.
Основната характеристика на разпределителния център е средноаритметичното, което се характеризира с това, че всички отклонения от него (положителни и отрицателни) се събират до нула. Характерно за медианата е, че сумата на отклоненията от нея по модул е ​​минимална, а модата е стойността на най-често срещания признак.
Съотношението на режима, медианата и средното аритметично показва естеството на разпределението на признака в съвкупността, позволява да се оцени неговата асиметрия. При симетричните разпределения и трите характеристики са еднакви. Колкото по-голямо е несъответствието между модата и средната аритметична стойност, толкова по-асиметрична е серията. За умерено изкривени серии разликата между режима и средната аритметична стойност е приблизително три пъти разликата между медианата и средната стойност, т.е.:
|Mo–`x| = 3 |Me –`x|.

Определяне на мода и медиана по графичен метод

Модата и медианата в интервална серия могат да се определят графично. Режимът се определя от хистограмата на разпределението. За целта се избира най-високият правоъгълник, който в случая е модален. След това свързваме десния връх на модалния правоъгълник с горния десен ъгъл на предишния правоъгълник. И левият връх на модалния правоъгълник е с горния ляв ъгъл на следващия правоъгълник. От точката на тяхното пресичане спускаме перпендикуляра към абсцисната ос. Абсцисата на пресечната точка на тези линии ще бъде режимът на разпределение (фиг. 5.3).


Ориз. 5.3. Графично дефиниране на модата чрез хистограма.


Ориз. 5.4. Графично определяне на медианата чрез кумулат
За определяне на медианата от точка на скалата на натрупаните честоти (честоти), съответстваща на 50%, се начертава права линия, успоредна на абсцисната ос до пресечната точка с кумулата. След това от точката на пресичане се спуска перпендикуляр към абсцисната ос. Абсцисата на пресечната точка е медианата.

Квартили, децили, процентили

По същия начин, с намирането на медианата във вариационната серия на разпределение, можете да намерите стойността на характеристика за всяка единица от класираната серия по ред. Така например можете да намерите стойността на характеристика в единици, които разделят серията на четири равни части, на 10 или 100 части. Тези стойности се наричат ​​"квартили", "децили", "перцентили".
Квартилите са стойността на характеристика, която разделя обособената съвкупност на 4 равни части.
Правете разлика между долния квартил (Q 1), който разделя ¼ от съвкупността с най-ниските стойности на атрибута, и горния квартил (Q 3), който отрязва ¼ частта с най-високите стойности на атрибута . Това означава, че 25% от единиците на съвкупността ще бъдат по-малки от Q 1 ; 25% единици ще бъдат затворени между Q 1 и Q 2; 25% - между Q 2 и Q 3, а останалите 25% са по-добри от Q 3. Средният квартил на Q 2 е медианата.
За изчисляване на квартилите чрез интервални вариационни серии се използват следните формули:
, ,
Където x Q 1– долната граница на интервала, съдържащ долния квартил (интервалът се определя от натрупаната честота, като първата надвишава 25%);
x Q 3– долната граница на интервала, съдържащ горния квартил (интервалът се определя от натрупаната честота, като първата надвишава 75%);
аз– интервална стойност;
S Q 1-1е кумулативната честота на интервала, предхождащ интервала, съдържащ долния квартил;
S Q 3-1е кумулативната честота на интервала, предхождащ интервала, съдържащ горния квартил;
f Q 1е честотата на интервала, съдържащ долния квартил;
f Q 3е честотата на интервала, съдържащ горния квартил.
Помислете за изчисляването на долния и горния квартил съгласно табл. 5.10. Долният квартил е в диапазона 60 - 80, чиято кумулативна честота е 33,5%. Горният квартил е в диапазона 160 - 180 с акумулирана честота от 75,8%. Имайки това предвид, получаваме:
,
.
В допълнение към квартилите, децилите могат да бъдат определени в ранговете на вариационното разпределение - опции, които разделят класираната вариационна серия на десет равни части. Първият децил (d 1) разделя съвкупността от 1/10 до 9/10, вторият децил (d 1) от 2/10 до 8/10 и т.н.
Те се изчисляват по формулите:
, .
Стойностите на характеристиките, които разделят серията на сто части, се наричат ​​процентили. Съотношенията на медианата, квартилите, децилите и процентилите са показани на фиг. 5.5.

Заплати в различни сектори на икономиката, температура и валежи в една и съща област за съпоставими периоди от време, добиви в различни географски региони и т.н. Средната стойност обаче съвсем не е единственият обобщаващ показател – в някои случаи за по-точна оценка стойност като медианата е подходяща. В статистиката се използва широко като спомагателна описателна характеристика на разпределението на признак в отделна популация. Нека да видим как се различава от средното, както и какво е причинило необходимостта от използването му.

Медиана в статистиката: определение и свойства

Представете си следната ситуация: 10 души работят заедно с директора в една фирма. Обикновените служители получават по 1000 гривни, а техният мениджър, който освен това е собственик, получава 10 000 гривни. Ако изчислим средноаритметичната стойност, се оказва, че средната заплата в това предприятие е 1900 UAH. Ще бъде ли вярно това твърдение? Или да вземем този пример, в една и съща болнична стая има девет души с температура 36,6°C и един човек с температура 41°C. Средната аритметична стойност в този случай е: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. Но това не означава, че всички присъстващи са болни. Всичко това подсказва, че самата средна стойност често не е достатъчна и затова се използва медиана като допълнение към нея. В статистиката този индикатор се нарича вариант, който се намира точно в средата на подредена вариационна серия. Ако го изчислите за нашите примери, получавате съответно 1000 UAH. и 36,6 °С. С други думи, медианата в статистиката е стойността, която разделя серията наполовина по такъв начин, че от двете й страни (надолу или нагоре) да се намират еднакъв брой единици от дадената съвкупност. Поради това свойство този показател има няколко други имена: 50-ти персентил или 0,5 квантил.

Как да намерите медианата в статистиката

Методът за изчисляване на тази стойност до голяма степен зависи от това какъв тип вариационна серия имаме: дискретна или интервална. В първия случай медианата в статистиката е доста проста. Всичко, което трябва да направите, е да намерите сумата от честотите, да разделите на 2 и след това да добавите ½ към резултата. Най-добре би било да обясните принципа на изчисление със следния пример. Да предположим, че сме групирали данни за раждаемостта и искаме да разберем каква е медианата.

Номер на семейната група по брой деца

Брой семейства

След като извършихме някои прости изчисления, получаваме, че желаният индикатор е равен на: 195/2 + ½ = опция. За да разберете какво означава това, трябва последователно да натрупвате честоти, като започнете от най-малките опции. И така, сумата от първите два реда ни дава 30. Ясно е, че тук няма 98 опции. Но ако добавим честотата на третата опция (70) към резултата, получаваме сума, равна на 100. Тя съдържа само 98-та опция, което означава, че медианата ще бъде семейство, което има две деца.

Що се отнася до интервалните серии, тук обикновено се използва следната формула:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, в което:

  • X Me - първата стойност на медианния интервал;
  • ∑f е номерът на серията (сумата от нейните честоти);
  • i Me - стойността на медианния диапазон;
  • f Me - честота на медианния диапазон;
  • S Me-1 - сумата от кумулативните честоти в диапазоните, предхождащи медианата.

Отново е трудно да се разбере това без пример. Да предположим, че има данни за стойността

Заплата, хиляди рубли

Натрупани честоти

За да използваме горната формула, първо трябва да определим средния интервал. Като такъв диапазон се избира такъв, чиято натрупана честота надвишава или е равна на половината от общата сума на честотите. Така че, разделяйки 510 на 2, получаваме, че този критерий съответства на интервал със стойност на заплатата от 250 000 рубли. до 300 000 рубли Сега можете да замените всички данни във формулата:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 хиляди рубли.

Надяваме се, че нашата статия е била полезна и сега имате ясна представа какво е медианата в статистиката и как трябва да се изчислява.

За изчисляване на медианата в MS EXCEL има специална функция MEDIAN() . В тази статия ще дефинираме медианата и ще научим как да я изчисляваме за извадка и за даден закон на разпределение на случайна променлива.

Да започнем с медианиЗа проби(т.е. за фиксиран набор от стойности).

Примерна медиана

Медиана(медиана) е числото, което е средата на набора от числа: половината от числата в набора са по-големи от Медиана, а половината от числата са по-малки от Медиана.

Да изчисля медианинеобходимо първо (стойности в вземане на проби). Например, Медианаза проба (2; 3; 3; 4 ; 5; 7; 10) ще бъде 4. Тъй като. само в вземане на проби 7 стойности, три от които по-малки от 4 (т.е. 2; 3; 3) и три стойности по-големи от (т.е. 5; 7; 10).

Ако наборът съдържа четен брой числа, тогава той се изчислява за две числа в средата на набора. Например, Медианаза проба (2; 3; 3 ; 6 ; 7; 10) ще бъде 4,5, защото (3+6)/2=4,5.

За определяне медианив MS EXCEL има функция със същото име MEDIAN() , английската версия на MEDIAN().

Медианане съвпада непременно. Съвпадение възниква само ако стойностите в извадката са разпределени симетрично средата. Например за проби (1; 2; 3 ; 4 ; 5; 6) МедианаИ средно аритметичноса равни на 3,5.

Ако е известно разпределителна функция F(x) или функция на плътността на вероятността стр(Х), Че Медианаможе да се намери от уравнението:

Например, чрез аналитично решаване на това уравнение за логнормалното разпределение lnN(μ; σ 2), получаваме, че Медианасе изчислява по формулата =EXP(μ). За μ=0 медианата е 1.

Обърнете внимание на точката Функции на разпределение, за което Е(x)=0,5(вижте снимката по-горе) . Абсцисата на тази точка е 1. Това е стойността на медианата, която естествено съвпада с предварително изчислената стойност по формулата em.

в MS EXCEL МедианаЗа логнормално разпределение LnN(0;1) може да се изчисли с помощта на формулата =LOGNORM.INV(0,5,0,1).

Забележка: Припомнете си, че интегралът на в цялата област на настройка на случайна променлива е равна на единица.

Следователно средната линия (x=медиана) разделя областта под графиката функции на плътност на вероятносттана две равни части.

Поради факта, че изследователят не разполага с данни за обема на продажбите във всяко обменно бюро, изчисляването на средноаритметичното за определяне на средната цена на долар е неподходящо.

Медиана на поредица от числа

Въпреки това е възможно да се определи стойността на атрибута, който се нарича медиана (Me). Медиана

в нашия пример

Средно число: NoMe = ;

Мода

Таблица 3.6.

fе сумата от честотите на серията;

S кумулативни честоти

12_

_

S са натрупани честоти.

На фиг. 3.2. Показана е хистограма на поредица от разпределение на банките по печалба (съгласно таблица 3.6.).

x е размерът на печалбата, милиони рубли,

f е броят на банките.

„МЕДИАНА НА ПОДРЕДЕНАТА СЕРИЯ“

Текстова HTML версия на публикацията


Обобщение на урока по алгебра в 7 клас

Тема на урока: "МЕДИАНА НА ПОРЯДНАТА СЕРИЯ".

учител в клона на езерното училище на MKOU Burkovskaya средно училище Еременко Татяна Алексеевна
Цели:
понятието медиана като статистическа характеристика на подреден ред; да формират способността да намират медианата за подредени серии с четен и нечетен брой членове; да се формира способността да се интерпретират стойностите на медианата в зависимост от практическата ситуация, да се консолидира концепцията за средния аритметичен набор от числа. Развийте умения за самостоятелна работа. Изградете интерес към математиката.
По време на часовете

устна работа.
Дадени са редове: 1) 4; 1; 8; 5; 1; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7.3; 6. Намерете: а) най-големите и най-малките стойности на всеки ред; б) обхватът на всеки ред; в) модата на всеки ред.
II. Обяснение на нов материал.
Работа по учебник. 1. Разгледайте проблема от параграф 10 от учебника. Какво означава подреден ред? Подчертавам, че преди да намерите медианата, винаги трябва да сортирате сериите от данни. 2. На дъската се запознаваме с правилата за намиране на медианата за серии с четен и нечетен брой членове:
Медиана

подреден

ред
числа
с

странно

номер

членове

нарече числото, написано в средата, и
Медиана

подреден ред
числа
с четен брой членове
се нарича средно аритметично на две числа, записани в средата.
Медиана

произволен

ред
се нарича медиана 1 3 1 7 5 4 на съответната подредена серия.
Отбелязвам, че показателите са средно аритметично, мода и медиана за

различно

характеризират

данни,

получени

резултат

наблюдения.

III. Формиране на умения и способности.
1-ва група. Упражнения за прилагане на формули за намиране на медиана на подредена и неподредена редица. 1.
№ 186.
Решение:а) Брой членове на поредицата П= 9; Медиана аз= 41; б) П= 7, редът е подреден, аз= 207; V) П= 6, редът е подреден, аз== 21; G) П= 8, редът е подреден, аз== 2,9. Отговор: а) 41; б) 207; на 21; г) 2.9. Учениците коментират как се намира медианата. 2. Намерете средноаритметичното и медианата на редица от числа: а) 27, 29, 23, 31, 21, 34; V) ; 1. б) 56, 58, 64, 66, 62, 74. Решение:За да намерите медианата, е необходимо да сортирате всеки ред: а) 21, 23, 27, 29, 31, 34. П = 6; х = = 27,5; аз== 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Как да намерите медианата в статистиката

П = 6; х = 63,3; аз== 63; V) ; 1. П = 5; х = : 5 = 3: 5 = 0,6; аз = . 3.
№ 188
(устно). Отговор: да; б) не; в) не; г) да. 4. Знаейки, че поръчаната серия съдържа Tчисла, къде Tе нечетно число, посочете номера на термина, който е медианата, ако Tе равно на: а) 5; б) 17; в) 47; г) 201. Отговор: а) 3; б) 9; в) 24; г) 101. 2-ра група. Практически задачи за намиране на медианата на съответния ред и интерпретиране на резултата. 1.
№ 189.
Решение:Брой членове на реда П= 12. За да се намери медианата, серията трябва да бъде подредена: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Медианата на серията аз= = 176. Месечната продукция е била повече от медианата за следните членове на артела: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 22 xx+ + = 1) Квитко; 4) Бобков; 2) Баранов; 5) Рилов; 3) Антонов; 6) Астафиев. Отговор: 176. 2.
№ 192.
Решение:Нека подредим сериите от данни: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; брой членове на реда П= 20. Плъзнете А = хмакс- х min = 42 - 30 = 12. Режим мо= 32 (тази стойност се среща 6 пъти - по-често от останалите). Медиана аз= = 35. В този случай диапазонът показва най-голямото разпределение на времето за обработка на детайла; режимът показва най-типичната стойност на времето за обработка; медианата е времето за обработка, което половината от стругарите не са превишили. Отговор: 12; 32; 35.
IV. Обобщение на урока.
Каква е медианата на поредица от числа? – Може ли медианата на редица от числа да не съвпада с нито едно от числата в редицата? – Какво число е медианата на подредена серия, съдържаща 2 Пчисла? 2 П– 1 числа? Как да намерим медианата на неподредена серия?
Домашна работа:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

В раздела основно общо образование

Режим и медиана

Средните стойности включват също модата и медианата.

Медианата и модата често се използват като средна характеристика в тези популации, където изчисляването на средната (аритметична, хармонична и т.н.) е невъзможно или непрактично.

Например, извадково проучване в град Омск на 12 търговски бюра за обмяна на валута позволи да се определят различни цени за долара, когато се продава (данни към 10 октомври 1995 г. при обменния курс на долара -4493 рубли) .

Поради факта, че изследователят не разполага с данни за обема на продажбите във всяко обменно бюро, изчисляването на средноаритметичното за определяне на средната цена на долар е неподходящо. Въпреки това е възможно да се определи стойността на атрибута, който се нарича медиана (Me). Медианалежи в средата на класирания ред и го разполовява.

Изчисляването на медианата за негрупирани данни се извършва, както следва:

а) подредете отделните стойности на характеристиката във възходящ ред:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

б) определете поредния номер на медианата по формулата:

в нашия пример това означава, че медианата в този случай се намира между шестата и седмата стойност на характеристиките в класираната серия, тъй като серията има четен брой отделни стойности. Така Me е равно на средноаритметичното на съседни стойности: 4550, 4560.

в) разгледайте процедурата за изчисляване на медианата в случай на нечетен брой отделни стойности.

Да предположим, че наблюдаваме не 12, а 11 точки за обмяна на валута, тогава класираната серия ще изглежда така (изхвърляме 12-та точка):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Средно число: NoMe = ;

на шесто място е = 4560, което е медианата: Me = 4560. От двете му страни има еднакъв брой точки.

Мода- това е най-често срещаната стойност на атрибута в единици от тази съвкупност. Съответства на определена характерна стойност.

В нашия случай модалната цена на долар може да се нарече 4560 рубли: тази стойност се повтаря 4 пъти, по-често от всички останали.

На практика модата и медианата обикновено се намират от групирани данни. В резултат на групирането се получава поредица от разпределение на банките според размера на получената печалба за годината (Таблица 3.6.).

Таблица 3.6.

Групиране на банките по размера на получената печалба за годината

За да се определи медианата, е необходимо да се изчисли сумата от кумулативните честоти. Увеличаването на общото продължава, докато кумулативният сбор от честоти надхвърли половината от сбора на честотите. В нашия пример сумата от натрупаните честоти (12) е повече от половината от всички стойности (20:2). Тази стойност съответства на медианния интервал, който съдържа медианата (5,5 - 6,4). Нека определим стойността му по формулата:

където е началната стойност на интервала, съдържащ медианата;

- стойността на средния интервал;

fе сумата от честотите на серията;

е сумата от кумулативните честоти, предхождащи медианния интервал;

е честотата на средния интервал.

Така 50% от банките имат печалба от 6,1 милиона рубли, а 50% от банките - повече от 6,1 милиона рубли.

Най-високата честота също съответства на интервала 5,5 - 6,4, т.е. режимът трябва да е в този интервал. Стойността му се определя по формулата:

където е началната стойност на интервала, съдържащ режима;

- стойността на модалния интервал;

е честотата на модалния интервал;

- честотата на интервала, предхождащ модалния;

- честотата на интервала след модала.

Дадената модна формула може да се използва във вариационни серии с равни интервали.

По този начин в този агрегат най-често срещаната печалба е 6,10 милиона рубли.

Медианата и модата могат да се определят графично. Медианата се определя от кумулата (фиг. 3.1.). За да се конструира, е необходимо да се изчислят кумулативните честоти и честоти. Кумулативните честоти показват колко единици от съвкупността имат стойности на характеристики не по-големи от разглежданата стойност и се определят чрез последователно сумиране на интервални честоти. При конструирането на кумулативната серия на интервално разпределение долната граница на първия интервал съответства на честота, равна на нула, а горната граница съответства на цялата честота на дадения интервал. Горната граница на втория интервал съответства на кумулативната честота, равна на сумата от честотите на първите два интервала и т.н.

Нека изградим кумулативна крива според табл. 6 относно разпределението на банките по печалба.

S кумулативни честоти

12_

_

3.7-4.6 4.6-5.5 5.5-6.4 6.4-7.3 7.3-8.2 Х печалба

Ориз. 3.1. Кумулативното разпределение на банките по печалба:

x е размерът на печалбата, милиони рубли,

S са натрупани честоти.

За да се определи медианата, височината на най-голямата ордината, която съответства на общото население, се разделя наполовина. През получената точка се прекарва права линия, успоредна на абсцисната ос, до пресичането й с кумулата. Абсцисата на пресечната точка е медианата.

Режимът се определя от хистограмата на разпределението. Хистограмата е изградена по следния начин:

На абсцисната ос се нанасят равни сегменти, които в приетия мащаб съответстват на размера на интервалите на вариационната серия. Върху сегментите са изградени правоъгълници, чиито площи са пропорционални на честотите (или честотите) на интервала.

Медиана в статистиката

3.2. Показана е хистограма на поредица от разпределение на банките по печалба (съгласно таблица 3.6.).

3.7-4.6 4.6-5.5 5.5-6.4 6.4-7.3 7.3-8.2 Х

Ориз. 3.2. Разпределение на търговските банки по печалба:

x е размерът на печалбата, милиони рубли,

f е броят на банките.

За да определим модата, свързваме десния връх на модалния правоъгълник с горния десен ъгъл на предишния правоъгълник, а левия връх на модалния правоъгълник с горния ляв ъгъл на следващия правоъгълник. Абсцисата на пресечната точка на тези линии ще бъде режимът на разпределение.

Медиана (статистика)

Медиана (статистика), в математическата статистика, число, което характеризира извадка (например набор от числа). Ако всички елементи в извадката са различни, тогава медианата е числото на извадката, така че точно половината от елементите в извадката са по-големи от нея, а другата половина са по-малки от нея. В по-общ случай медианата може да се намери чрез подреждане на елементите на извадката във възходящ или низходящ ред и вземане на средния елемент. Например извадката (11, 9, 3, 5, 5) след подреждане се превръща в (3, 5, 5, 9, 11) и нейната медиана е числото 5. Ако извадката има четен брой елементи, медианата може да не е уникално определена: за числови данни най-често се използва полусумата от две съседни стойности (т.е. медианата на набора (1, 3, 5, 7) се приема равна на 4).

С други думи, медианата в статистиката е стойността, която разделя серията наполовина по такъв начин, че от двете й страни (надолу или нагоре) да се намират еднакъв брой единици от дадената съвкупност.

Задача номер 1. Изчисляване на средно аритметично, модална и медианна стойност

Поради това свойство този показател има няколко други имена: 50-ти персентил или 0,5 квантил.

  • Средна стойност
  • Медиана
  • Мода

Медиана (статистика)

Медиана (статистика), в математическата статистика, число, което характеризира извадка (например набор от числа). Ако всички елементи в извадката са различни, тогава медианата е числото на извадката, така че точно половината от елементите в извадката са по-големи от нея, а другата половина са по-малки от нея. В по-общ случай медианата може да се намери чрез подреждане на елементите на извадката във възходящ или низходящ ред и вземане на средния елемент. Например извадката (11, 9, 3, 5, 5) след подреждане се превръща в (3, 5, 5, 9, 11) и нейната медиана е числото 5.

5.5 Мода и медиана. Изчисляването им в дискретни и интервални вариационни редове

Ако извадката има четен брой елементи, медианата може да не е уникално определена: за числови данни най-често се използва полусумата от две съседни стойности (т.е. медианата на набора (1, 3, 5, 7) се приема равно на 4).

С други думи, медианата в статистиката е стойността, която разделя серията наполовина по такъв начин, че от двете й страни (надолу или нагоре) да се намират еднакъв брой единици от дадената съвкупност. Поради това свойство този показател има няколко други имена: 50-ти персентил или 0,5 квантил.

Медианата се използва вместо средноаритметично, когато крайните варианти на класираната серия (най-малката и най-голямата) в сравнение с останалите се оказват прекалено големи или прекалено малки.

Функцията MEDIAN измерва централната тенденция, която е центърът на набор от числа в статистическо разпределение. Има три най-често срещани начина за определяне на централната тенденция:

  • Средна стойност- средно аритметично, което се изчислява чрез добавяне на набор от числа, последвано от разделяне на получената сума на техния брой.
    Например средната стойност за числата 2, 3, 3, 5, 7 и 10 е 5, което е резултат от разделянето на сбора им, който е 30, на техния брой, който е 6.
  • Медиана- число, което е средата на набор от числа: половината от числата имат стойности, по-големи от медианата, а половината от числата са по-малки.
    Например медианата за числата 2, 3, 3, 5, 7 и 10 е 4.
  • Модае числото, което се среща най-често в даден набор от числа.
    Например режимът за числата 2, 3, 3, 5, 7 и 10 ще бъде 3.

Урок по алгебра в 7 клас.

Тема "Медиана като статистическа характеристика".

Учител Егорова Н.И.

Целта на урока: да се формира разбирането на учениците за медианата на набор от числа и способността да се изчислява за прости числови набори, като се фиксира понятието средноаритметично множество от числа.

Тип урок: обяснение на нов материал.

По време на часовете

1. Организационен момент.

Информирайте темата на урока и формулирайте неговите цели.

2. Актуализиране на предишни знания.

Въпроси към учениците:

Какво е средноаритметичното на набор от числа?

Къде се намира средната аритметична стойност в набор от числа?

Какво характеризира средноаритметичната стойност на набор от числа?

Къде е често използваната средна аритметична стойност на набор от числа?

Устни задачи:

Намерете средната аритметична стойност на набор от числа:

Проверка на домашните.

Учебник: № 169, № 172.

3. Учене на нов материал.

В предишния урок се запознахме с такава статистическа характеристика като средната аритметична стойност на набор от числа. Днес ще посветим урок на друга статистическа характеристика - медианата.

Не само средното аритметично показва къде на числовата ос са разположени числата от произволно множество и къде е техният център. Друг показател е медианата.

Медианата на набор от числа е числото, което разделя набора на две равни части. Вместо "медиана" може да се каже "среда".

Първо, използвайки примери, ще анализираме как да намерим медианата и след това ще дадем строго определение.

Помислете за следния вербален пример с помощта на проектор

В края на учебната година 11 ученици от 7 клас преминаха норматив за бягане на 100 метра. Бяха записани следните резултати:

След като момчетата пробягаха разстоянието, Петя се приближи до учителя и попита какъв е резултатът му.

„Най-средно: 16,9 секунди“, отговори учителят

"Защо?" – изненада се Петя. - Все пак средноаритметичното от всички резултати е около 18,3 секунди, а аз бягах със секунда и повече по-добре. И като цяло резултатът на Катя (18,4) е много по-близо до средния от моя.

„Резултатът ви е среден, защото петима души бягаха по-добре от вас и петима по-зле. Така че вие ​​сте точно по средата“, каза учителят.

Напишете алгоритъм за намиране на медианата на набор от числа:

Подредете числовия набор (съставете класирана серия).

В същото време задраскваме „най-големите“ и „най-малките“ числа от този набор от числа, докато остане едно число или две числа.

Ако има само едно число, то това е медианата.

Ако останат две числа, тогава медианата ще бъде средната аритметична на двете останали числа.

Поканете учениците самостоятелно да формулират дефиницията на медианата на набор от числа, след това да прочетат дефиницията на медианата в учебника (стр. 40), след което да решат № 186 (а, б), № 187 (а) от учебника (стр. 41).

коментар:

Обърнете внимание на учениците към важно обстоятелство: медианата е практически нечувствителна към значителни отклонения на отделни екстремни стойности на набори от числа. В статистиката това свойство се нарича стабилност. Стабилността на статистическия показател е много важно свойство, то ни предпазва от случайни грешки и отделни недостоверни данни.

4. Затвърдяване на изучения материал.

Разрешаване на проблем.

Означава х-средно аритметично, Ме-медиана.

Набор от числа: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Набор от числа: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

а) Набор от числа: 3,4,11,17,21

б) Набор от числа: 17,18,19,25,28

в) набор от числа: 25, 25, 27, 28, 29, 40, 50

Заключение: медианата на набор от числа, състояща се от нечетен брой членове, е равна на числото в средата.

а) Набор от числа: 2, 4, 8, 9.

Аз = (4+8):2=12:2=6

б) набор от числа: 1,3,5,7,8,9.

Аз = (5+7):2=12:2=6

Медианата на набор от числа, съдържащ четен брой членове, е половината от сумата на двете числа в средата.

През тримесечието ученикът получи следните оценки по алгебра:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Намерете средния резултат и медианата на този набор.

Нека намерим средния резултат, тоест средноаритметичното:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Намерете медианата на този набор от числа:

Да поръчаме набор от числа: 2,4,4,4,5,5,5,5,5,5

Само 10 числа, за да намерите медианата, трябва да вземете две средни числа и да намерите полусумата им.

Аз = (5+5):2 = 5

Въпрос към учениците: Ако бяхте учител, каква оценка бихте поставили на този ученик за една четвърт? Обосновете отговора.

Президентът на компанията получава заплата от 300 000 рубли. трима от неговите заместници получават по 150 000 рубли, четиридесет служители - по 50 000 рубли. и заплатата на чистач е 10 000 рубли. Намерете средноаритметичната и медианата на заплатите във фирмата. Коя от тези характеристики е по-изгодно президентът да използва за рекламни цели?

x \u003d (300000 + 3 150000 + 40 50000 + 10000): (1 + 3 + 40 + 1) \u003d 2760000: 45 \u003d 61333,33 (рубли)

No 6. Устно.

А) Колко числа има в множеството, ако медианата му е деветият член?

Б) Колко числа има в множеството, ако неговата медиана е средноаритметичната на 7-ия и 8-ия член?

В) В набор от седем числа най-голямото число е увеличено с 14. Това ще промени ли както средното аритметично, така и медианата?

Г) Всяко от числата в комплекта е увеличено с 3. Какво ще се случи със средното аритметично и медианата?

Сладките в магазина се продават на тегло. За да разбере колко сладки се съдържат в един килограм, Маша реши да намери теглото на един бонбон. Тя претегли няколко бонбона и получи следните резултати:

12, 13, 14, 12, 15, 16, 14, 13, 11.

И двете характеристики са подходящи за оценка на теглото на един бонбон, тъй като те не се различават много един от друг.

Така че, за да се характеризира статистическата информация, се използват средната аритметична стойност и медианата. В много случаи някои от характеристиките може да нямат никакво смислено значение (например, имайки информация за времето на пътните произшествия, едва ли има смисъл да говорим за средноаритметичното на тези данни).

Домашна работа: параграф 10, № 186 (c, d), № 190.

5. Резултатите от урока. Отражение.

  1. "Статистически изследвания: събиране и групиране на статистически данни"

    Урок

    Темипредложен за седми клас. ТЕМАТИЧНО ПЛАНИРАНЕ. § 1. Статистическихарактеристики. P 1. Средно аритметично, диапазон и мода 1h. П 2. МедианакакстатистическиХарактеристика

  2. Работната програма на учебния курс "алгебра" в 7. клас (основно ниво) обяснителна бележка

    Работна програма

    ... т.10 МедианакакстатистическиХарактеристика 23 стр.9 Средно аритметично, диапазон и мода 24 Изпит No 2 на тема

  3. Работна програма. Математика. 5 клас Стр. Канаши. 2011 г

    Работна програма

    ... уравнения. Средно аритметично, диапазон и мода. МедианакакстатистическиХарактеристика. Целта е да се систематизира и обобщи информацията за ... и умения, придобити при УроциСпоред теми(добре алгебра 10 клас). 11 Клас(4 часа седмично...

  4. Заповед № 51 от 30 август 2012 г. Работна програма по алгебра 7 клас

    Работна програма

    … учебен материал МедианакакстатистическиХарактеристикаПознайте определението за средно аритметично, диапазон, режим и медианикакстатистическихарактеристикиФронтални и индивидуални ...

  5. Работна програма по математика 7 клас ii ниво основно ниво (1)

    Работна програма

    Как да намерим медианата на серия

    един и същ, какна 6 класна стая. Изучаване Темизавършва като запознава учениците с най-простите статистическихарактеристики: среден ... М .: Издателство "Генжер", 2009. 3. Жохов, В.И. Уроциалгебрана 7 класна стая: Книга. за учителя / В. И. Жохов ...

Други свързани документи..

През 1906 г. великият учен и известен евгеник Франсис Галтън посещава годишната изложба за животни и птици в Западна Англия, където съвсем случайно провежда интересен експеримент.

Според Джеймс Суровецки, автор на „Мъдростта на тълпата“, на панаира в Галтън имаше състезание, в което хората трябваше да познаят теглото на заклан бик. Този, който посочи най-близкото до истинското число, беше обявен за победител.

Галтън беше известен с презрението си към интелектуалните способности на обикновените хора. Той вярваше, че само истински експерти биха могли да направят точни твърдения за теглото на бика. А 787 участници в състезанието не са били експерти.

Ученият щеше да докаже некомпетентността на тълпата, като изчисли средния брой от отговорите на участниците. Каква беше изненадата му, когато се оказа, че полученият резултат отговаря почти точно на реалното тегло на бика!

Средна стойност - късно изобретение

Разбира се, точността на отговора учуди изследователя. Но още по-забележителен е фактът, че Галтън изобщо се сети да използва средната стойност.

В днешния свят средните стойности и така наречените медиани са навсякъде: средната температура в Ню Йорк през април е 52 градуса по Фаренхайт; Стивън Къри има средно 30 точки на мач; Средният доход на домакинство в САЩ е 51 939 долара на година.

Идеята обаче, че много различни резултати могат да бъдат представени с едно число, е доста нова. До 17 век средните стойности обикновено не са били използвани.

Как се появи и разви концепцията за средни и медиани? И как успя да се превърне в основна измервателна техника в наше време?

Преобладаването на средните стойности над медианите имаше далечни последици за нашето разбиране на информацията. И често подвеждаше хората.

Средни и медианни стойности

Представете си, че разказвате история за четирима души, които вечеряха с вас снощи в ресторант. Бихте дали на един от тях 20 години, на друг 30, на трети 40 и на четвърти 50. Какво ще кажете за възрастта им във вашата история?

Най-вероятно ще ги наречете средна възраст.

Средната стойност често се използва за предаване на информация за нещо, както и за описание на набор от измервания. Технически средната стойност е това, което математиците наричат ​​„средно аритметично“ – сумата от всички измервания, разделена на броя на измерванията.

Въпреки че думата "среден" често се използва като синоним на думата "медиана" (медиана), последната по-често се нарича средата на нещо. Тази дума идва от латинското "medianus", което означава "среден".

Средна стойност в Древна Гърция

Историята на средната стойност води началото си от учението на древногръцкия математик Питагор. За Питагор и неговата школа медианата имаше ясна дефиниция и беше много различна от начина, по който разбираме средната стойност днес. Използва се само в математиката, не и в анализа на данни.

В питагорейската школа средната стойност е средното число в тричленна последователност от числа, в "равно" отношение към съседните членове. „Равно“ съотношение може да означава същото разстояние. Например числото 4 в реда 2,4,6. Въпреки това, той може също да изрази геометрична прогресия, като например 10 в редицата 1,10,100.

Статистикът Чърчил Айзенхарт обяснява, че в древна Гърция медианата не е била използвана като представител или заместител на набор от числа. Той просто обозначаваше средата и често се използваше в математически доказателства.

Айзенхарт прекарва десет години в изучаване на средната стойност и медианата. Първоначално той се опитва да намери представителната функция на медианата в ранните научни конструкции. Вместо това обаче той открива, че повечето от ранните физици и астрономи разчитат на единични, умело направени измервания и не разполагат с методология за избор на най-добрия резултат сред много наблюдения.

Съвременните изследователи базират заключенията си на събирането на големи количества данни, както например биолозите, изучаващи човешкия геном. Древните учени, от друга страна, са можели да направят няколко измервания, но са избрали само най-доброто за изграждане на своите теории.

Както пише историкът на астрономията Ото Нойгебауер, „това е в съответствие със съзнателното желание на древните хора да сведат до минимум количеството емпирични данни в науката, тъй като те не вярваха в точността на преките наблюдения“.

Например гръцкият математик и астроном Птолемей изчислява ъгловия диаметър на Луната, използвайки метода на наблюдение и теорията за движението на Земята. Резултатът му беше 31'20. Днес знаем, че диаметърът на Луната варира от 29'20 до 34'6, в зависимост от разстоянието от Земята. Птолемей използва малко данни в изчисленията си, но имаше всички основания да вярва, че са точни.

Айзенхарт пише: „Трябва да се има предвид, че връзката между наблюдението и теорията в древността е била различна от тази днес. Резултатите от наблюденията се разбират не като факти, към които теорията трябва да се коригира, а като конкретни случаи, които могат да бъдат полезни само като илюстративни примери за истинността на теорията.

В крайна сметка учените ще се обърнат към представителни измервания на данните, но първоначално нито средства, нито медиани са били използвани в тази роля. От древността до наши дни като такова представително средство се използва друго математическо понятие – полусумата на екстремните стойности.

Половин сбор от екстремни стойности

Новите научни инструменти почти винаги възникват от необходимостта да се реши определен проблем в дадена дисциплина. Необходимостта да се намери най-добрата стойност сред много измервания възникна от необходимостта да се определи точно географското местоположение.

Интелектуалният гигант от 11-ти век Ал-Бируни е известен като един от първите хора, използвали методологията на представителните значения. Ал-Бируни пише, че когато е имал много измервания на свое разположение и е искал да намери най-доброто сред тях, той е използвал следното "правило": трябва да намерите число, съответстващо на средата между две крайни стойности. При изчисляване на полусумата на екстремните стойности не се вземат предвид всички числа между максималните и минималните стойности, а се намира само средната стойност на тези две числа.

Ал-Бируни прилага този метод в различни области, включително за изчисляване на географската дължина на град Газни, който се намира на територията на съвременен Афганистан, както и в изследванията си на свойствата на металите.

През последните няколко века обаче полусумата на екстремумите се използва все по-рядко. Всъщност в съвременната наука то изобщо не е актуално. Средната стойност замени полусумата.

Преход към средни стойности

До началото на 19 век използването на медианата/средната стойност се е превърнало в обичаен метод за намиране на най-точно представителната стойност от група данни. Фридрих фон Гаус, изключителен математик на своето време, пише през 1809 г.: „Смяташе се, че ако определено число е определено чрез няколко преки наблюдения, направени при едни и същи условия, тогава средното аритметично е най-вярната стойност. Ако не е съвсем строг, то поне е близо до реалността и затова винаги може да се разчита на него.

Защо е настъпила такава промяна в методологията?

На този въпрос е доста трудно да се отговори. В своето изследване Чърчил Айзенхарт предполага, че методът за намиране на средната аритметична стойност може да е възникнал в областта на измерването на магнитното отклонение, тоест при намирането на разликата между посоката на стрелката на компаса, сочеща на север, и реалния север. Това измерване е било изключително важно през епохата на откритията.

Айзенхарт установява, че до края на 16 век повечето учени, които измерват магнитното отклонение, са използвали ad hoc метода (от латински „към това, за този случай, за тази цел“) при избора на най-точното измерване.

Но през 1580 г. ученият Уилям Боро подходи към проблема по различен начин. Той направи осем различни измервания на отклонението и ги сравни и заключи, че най-точното отчитане е между 11 ⅓ и 11 ¼ градуса. Вероятно е изчислил средноаритметичното, което е в този диапазон. Самият Бороу обаче не нарича открито своя подход новия метод.

Преди 1635 г. изобщо не е имало недвусмислени случаи на използване на средната стойност като представително число. Тогава обаче английският астроном Хенри Хелибранд направи две различни измервания на магнитното отклонение. Едната е направена сутрин (11 градуса), а другата следобед (11 градуса и 32 минути). Изчислявайки най-истинската стойност, той написа:

„Ако намерим средната аритметична стойност, можем да кажем с голяма вероятност, че резултатът от точно измерване трябва да бъде около 11 градуса и 16 минути.“

Вероятно това е първият път, когато средната стойност е използвана като най-близка до истината!

Думата "среден" е била използвана на английски в началото на 16-ти век за означаване на финансови загуби от щети, претърпени от кораб или товар по време на пътуване. През следващите сто години той обозначава точно тези загуби, които се изчисляват като средно аритметично. Например, ако кораб е бил повреден по време на пътуване и екипажът е трябвало да изхвърли някои стоки зад борда, за да спести теглото на кораба, инвеститорите са претърпели финансова загуба, еквивалентна на сумата на тяхната инвестиция - тези загуби са изчислени по същия начин като средно аритметично. Така постепенно стойностите на средната (средната) и средната аритметична стойност се сближиха.

Средна стойност

Днес средната или средната аритметична стойност се използва като основен начин за избор на представителна стойност на набор от измервания. Как се случи това? Защо тази роля не е приписана на средната стойност?

Франсис Галтън беше средният шампион

Терминът "средна стойност" (медиана) - средният член в редица числа, разделящи тази серия наполовина - се появи приблизително по същото време като средното аритметично. През 1599 г. математикът Едуард Райт, който работи върху проблема за нормалното отклонение в компаса, за първи път предложи да се използва средната стойност.

„... Да речем, че много стрелци стрелят по някаква цел. Впоследствие целта се премахва. Как можете да разберете къде е била целта? Трябва да намерите средното място между всички стрелки. По същия начин, сред набора от резултати от наблюдения, най-близо до истината ще бъде този в средата.

Медианата се използва широко през деветнадесети век, превръщайки се в незаменима част от всеки анализ на данни по това време. Използван е и от Франсис Галтън, видният анализатор от деветнадесети век. В историята с претеглянето на бика в началото на тази статия Галтън първоначално използва медианата като представяне на мнението на тълпата.

Много анализатори, включително Галтън, предпочетоха медианата, защото е по-лесна за изчисляване за по-малки набори от данни.

Медианата обаче никога не е била по-популярна от средната. Най-вероятно това се е случило поради специалните статистически свойства, присъщи на средната стойност, както и връзката й с нормалното разпределение.

Връзка между средно и нормално разпределение

Когато правим много измервания, резултатите са, както казват статистиците, „нормално разпределени“. Това означава, че ако тези данни се начертаят на графика, тогава точките върху нея ще изобразяват нещо подобно на камбана. Ако ги свържете, ще получите "камбановидна" крива. Много статистики отговарят на нормалното разпределение, като ръст на хората, IQ и най-висока годишна температура.

Когато данните са нормално разпределени, средната стойност ще бъде много близо до най-високата точка на камбанообразната крива и много голям брой измервания ще бъдат близо до средната стойност. Има дори формула, която предвижда колко измервания ще бъдат на известно разстояние от средното.

По този начин изчисляването на средната стойност дава на изследователите много допълнителна информация.

Връзката на средната стойност със стандартното отклонение му дава голямо предимство, тъй като медианата няма такава връзка. Тази връзка е важна част от анализа на експерименталните данни и статистическата обработка на информацията. Ето защо средната стойност се превърна в ядрото на статистиката и всички науки, които разчитат на множество данни за своите заключения.

Предимството на средната стойност се дължи и на факта, че тя лесно се изчислява от компютри. Въпреки че средната стойност за малка група от данни е доста лесно да се изчисли самостоятелно, много по-лесно е да се напише компютърна програма, която да намери средната стойност. Ако използвате Microsoft Excel, вероятно знаете, че функцията на медианата не е толкова лесна за изчисляване, колкото функцията на средната стойност.

В резултат на това, поради голямата си научна стойност и лекотата на използване, средната стойност се превърна в основна представителна стойност. Тази опция обаче не винаги е най-добрата.

Предимства на медианната стойност

В много случаи, когато искаме да изчислим центъра на разпределението, медианата е най-добрата мярка. Това е така, защото средната стойност до голяма степен се определя от екстремните измервания.

Много анализатори смятат, че необмисленото използване на средната стойност се отразява негативно на разбирането ни за количествената информация. Хората гледат средното и смятат, че е „нормално“. Но всъщност може да се определи с някакъв термин, който силно се откроява от хомогенната серия.

Представете си анализатор, който иска да знае представителна стойност за стойността на пет къщи. Четири къщи струват 100 000 долара, а петата е 900 000 долара. Тогава средната стойност ще бъде $200 000, а медианата ще бъде $100 000. В този, както и в много други случаи, средната стойност дава по-добро разбиране на това, което може да се нарече "стандарт".

Разбирайки как екстремните стойности могат да повлияят на средната стойност, средната стойност се използва за отразяване на промените в доходите на домакинствата в САЩ.

Медианата също е по-малко чувствителна към "мръсните" данни, с които анализаторите работят днес. Много статистици и анализатори събират информация, като интервюират хора в Интернет. Ако потребителят случайно добави допълнителна нула към отговора, което превръща 100 в 1000, тогава тази грешка ще повлияе на средната стойност много повече от медианата.

Средна стойност или медиана?

Изборът между медианата и средната стойност има далечни последици, от разбирането ни за ефектите на лекарствата върху здравето до познанията ни за стандартния бюджет на семейството.

Тъй като събирането и анализът на данни все повече определя начина, по който разбираме света, се променя и стойността на количествата, които използваме. В един идеален свят анализаторите биха използвали както средната, така и медианата, за да начертаят данните.

Но ние живеем в условия на ограничено време и внимание. Поради тези ограничения често трябва да изберем само един. И в много случаи средната стойност е за предпочитане.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 "kingad.ru" - ултразвуково изследване на човешки органи