Медиана на извадкови данни. Медиана функция в Excel за извършване на статистически анализ

Наред със средните стойности, структурните средни се изчисляват като статистически характеристики на вариационни серии от разпределения - модаИ Медиана.
Мода(Mo) представлява стойността на изследваната характеристика, повтаряна с най-голяма честота, т.е. режим – стойността на характеристика, която се среща най-често.
Медиана(Me) е стойността на атрибута, който попада в средата на класираната (подредена) популация, т.е. медианата е централната стойност на вариационна серия.
Основното свойство на медианата е, че сумата от абсолютните отклонения на стойностите на атрибута от медианата е по-малка от всяка друга стойност ∑|x i - Me|=min.

Определяне на режим и медиана от негрупирани данни

Нека помислим определяне на режим и медиана от негрупирани данни. Да предположим, че работен екип от 9 души има следните тарифни категории: 4 3 4 5 3 3 6 2 6. Тъй като тази бригада има най-много работници от 3-та категория, тази тарифна категория ще бъде модална. Mo = 3.
За определяне на медианата е необходимо да се извърши класиране: 2 3 3 3 4 4 5 6 6 . Централният работник в тази серия е работник от 4-та категория, следователно тази категория ще бъде медианата. Ако класираната поредица включва четен брой единици, тогава медианата се определя като средната стойност на двете централни стойности.
Ако режимът отразява най-често срещания вариант на стойността на атрибута, тогава медианата практически изпълнява функциите на средната за разнородна популация, която не се подчинява на нормалния закон на разпределение. Нека илюстрираме когнитивното му значение със следния пример.
Да кажем, че трябва да характеризираме средния доход на група хора, състояща се от 100 души, 99 от които имат доходи в диапазона от 100 до 200 долара на месец, а месечният доход на последните е 50 000 долара (Таблица 1).
Таблица 1 - Месечен доход на изследваната група хора. Ако използваме средно аритметично, получаваме среден доход от приблизително $600 - $700, което няма много общо с доходите на основната част от групата. Медианата, равна в този случай на Me = 163 долара, ще ни позволи да дадем обективно описание на нивото на доходите на 99% от тази група хора.
Нека разгледаме определянето на режима и медианата, като използваме групирани данни (серия на разпределение).
Да приемем, че разпределението на работниците на цялото предприятие като цяло според тарифната категория има следната форма (таблица 2).
Таблица 2 - Разпределение на работниците в предприятието по тарифен разряд

Изчисляване на режим и медиана за дискретна серия

Изчисляване на режим и медиана за интервални серии

Изчисляване на режим и медиана за вариационна серия

Определяне на режима от дискретна вариационна серия

Използва се предварително конструирана поредица от стойности на атрибути, сортирани по стойност. Ако размерът на извадката е нечетен, вземаме централната стойност; ако размерът на извадката е четен, вземаме средната аритметична стойност на двете централни стойности.
Определяне на режима от дискретна вариационна серия: 5-та тарифна категория има най-висока честота (60 души), следователно е модална. Mo = 5.
За да се определи средната стойност на дадена характеристика, числото на средната единица на серията (N Me) се намира по следната формула: , където n е обемът на съвкупността.
В нашия случай: .
Получената дробна стойност, която винаги се появява, когато броят на единиците в популацията е четен, показва, че точната средна точка е между 95 и 96 работници. Необходимо е да се определи към коя група принадлежат работниците с тези поредни номера. Това може да стане чрез изчисляване на натрупаните честоти. В първата група, където са само 12 души, няма работници с тези бройки, а във втората група (12+48=60) няма нито един. 95-ти и 96-ти работници са в трета група (12+48+56=116), следователно медианата е 4-ти тарифен разряд.

Изчисляване на мода и медиана в интервални серии

За разлика от дискретните вариационни серии, определянето на модата и медианата от интервални серии изисква определени изчисления въз основа на следните формули:
, (5.6)
Където х 0– долната граница на модалния интервал (интервалът с най-висока честота се нарича модален);
аз– стойността на модалния интервал;
f Mo– честота на модалния интервал;
f Mo -1– честота на интервала, предхождащ модалния;
f Mo +1– честота на интервала, следващ модалния.
(5.7)
Където х 0– долната граница на медианния интервал (медианата е първият интервал, чиято натрупана честота надвишава половината от общата сума на честотите);
аз– стойността на медианния интервал;
S Me -1– натрупан интервал, предхождащ медианата;
е аз– честота на медианния интервал.
Нека илюстрираме приложението на тези формули с помощта на данните в табл. 3.
Интервалът с граници 60 – 80 в това разпределение ще бъде модален, т.к има най-висока честота. Използвайки формула (5.6), дефинираме режима:

За да се установи медианният интервал, е необходимо да се определи натрупаната честота на всеки следващ интервал, докато тя надхвърли половината от сумата на натрупаните честоти (в нашия случай 50%) (Таблица 5.11).
Установено е, че медианата е интервалът с граници от 100 - 120 хиляди рубли. Нека сега определим медианата:

Таблица 3 - Разпределение на населението на Руската федерация по ниво на средния номинален паричен доход на глава от населението през март 1994 г.
Групи по ниво на среден месечен доход на глава от населението, хиляди рубли.Дял от населението, %
До 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Над 3007,7
Обща сума100,0

Таблица 4 - Определяне на средния интервал
По този начин средната аритметична стойност, модата и медианата могат да се използват като обобщена характеристика на стойностите на определен атрибут за единици от класирана популация.
Основната характеристика на разпределителния център е средноаритметичното, което се характеризира с това, че всички отклонения от него (положителни и отрицателни) се събират до нула. Медианата се характеризира с това, че сумата на отклоненията от нея по модул е ​​минимална, а модата е стойността на атрибута, която се среща най-често.
Съотношението на режима, медианата и средната аритметична показва естеството на разпределението на характеристиката в съвкупността и ни позволява да оценим нейната асиметрия. При симетричните разпределения и трите характеристики съвпадат. Колкото по-голямо е несъответствието между модата и средната аритметична стойност, толкова по-асиметрична е серията. За умерено асиметрични серии разликата между модата и средната аритметична стойност е приблизително три пъти по-голяма от разликата между медианата и средната стойност, т.е.:
|Mo –`x| = 3 |Me –`x|.

Определяне на мода и медиана по графичен метод

Модата и медианата в интервална серия могат да се определят графично. Режимът се определя от хистограмата на разпределението. За да направите това, изберете най-високия правоъгълник, който в този случай е модален. След това свързваме десния връх на модалния правоъгълник с горния десен ъгъл на предишния правоъгълник. А левият връх на модалния правоъгълник - с горния ляв ъгъл на следващия правоъгълник. От точката на тяхното пресичане спускаме перпендикуляра към абсцисната ос. Абсцисата на пресечната точка на тези линии ще бъде режимът на разпределение (фиг. 5.3).


Ориз. 5.3. Графично определяне на режима с помощта на хистограма.


Ориз. 5.4. Графично определяне на медианата чрез кумулат
За да се определи медианата от точка на скалата на натрупаните честоти (честоти), съответстваща на 50%, се начертава права линия, успоредна на абсцисната ос, докато се пресече с кумулата. След това от пресечната точка се спуска перпендикуляр към оста x. Абсцисата на пресечната точка е медианата.

Квартили, децили, процентили

По същия начин, с намирането на медианата във вариационната серия на разпределението, можете да намерите стойността на атрибута за всяка единица от класираната серия. Така например можете да намерите стойността на атрибута за единици, разделящи серия на четири равни части, на 10 или 100 части. Тези стойности се наричат ​​"квартили", "децили", "перцентили".
Квартилите представляват стойността на характеристика, която разделя класираната съвкупност на 4 равни части.
Има долен квартил (Q 1), разделящ ¼ от съвкупността с най-ниски стойности на атрибута, и горен квартил (Q 3), разделящ ¼ от частта с най-високи стойности на атрибута. Това означава, че 25% от единиците в популацията ще бъдат с по-малка стойност Q 1 ; 25% от единиците ще се съдържат между Q 1 и Q 2; 25% са между Q 2 и Q 3, а останалите 25% надхвърлят Q 3. Средният квартил на Q2 е медианата.
За изчисляване на квартили с помощта на серия от интервални вариации се използват следните формули:
, ,
Където x Q 1– долната граница на интервала, съдържащ долния квартил (интервалът се определя от натрупаната честота, като първата надвишава 25%);
x Q 3– долната граница на интервала, съдържащ горния квартил (интервалът се определя от натрупаната честота, като първата надвишава 75%);
аз– размер на интервала;
S Q 1-1– акумулирана честота на интервала, предхождащ интервала, съдържащ долния квартил;
S Q 3-1– акумулирана честота на интервала, предхождащ интервала, съдържащ горния квартил;
f Q 1– честота на интервала, съдържащ долния квартил;
f Q 3– честота на интервала, съдържащ горния квартил.
Нека разгледаме изчисляването на долния и горния квартил според данните в табл. 5.10. Долният квартил е в диапазона 60 – 80, чиято кумулативна честота е 33,5%. Горният квартил е в диапазона 160 – 180 с акумулирана честота от 75,8%. Като вземем това предвид, получаваме:
,
.
В допълнение към квартилите, децилите могат да бъдат определени в вариационните диапазони на разпределението - опции, които разделят класираните вариационни серии на десет равни части. Първият децил (d 1) разделя населението в съотношение 1/10 към 9/10, вторият децил (d 1) - в съотношение 2/10 към 8/10 и т.н.
Те се изчисляват по формулите:
, .
Характеристичните стойности, които разделят серията на сто части, се наричат ​​процентили. Съотношенията на медианите, квартилите, децилите и процентилите са представени на фиг. 5.5.

Заплатите в различни сектори на икономиката, температурата и нивата на валежите на една и съща територия за съпоставими периоди от време, добивите от култури, отглеждани в различни географски региони и т.н. Средната стойност обаче съвсем не е единственият обобщаващ показател - в някои случаи за по-точна оценка подходяща стойност е медианата. В статистиката се използва широко като спомагателна описателна характеристика на разпределението на характеристика в определена популация. Нека да разберем как се различава от средния, както и защо е необходимо да го използваме.

Медиана в статистиката: определение и свойства

Представете си следната ситуация: 10 души работят в една фирма заедно с директора. Обикновените работници получават 1000 UAH, а техният мениджър, който е и собственик, получава 10 000 UAH. Ако изчислим средноаритметичната стойност, се оказва, че средната заплата в това предприятие е 1900 UAH. Ще бъде ли вярно това твърдение? Или да вземем този пример: в едно и също болнично отделение има девет души с температура 36,6 °C и един човек с температура 41 °C. Средната аритметична в този случай е равна на: (36,6*9+41)/10 = 37,04 °C. Но това не означава, че всички присъстващи са болни. Всичко това подсказва, че самата средна стойност често не е достатъчна и затова се използва медиана като допълнение към нея. В статистиката този индикатор се нарича опцията, която се намира точно в средата на подредената вариационна серия. Ако го изчислим за нашите примери, получаваме съответно 1000 UAH. и 36,6°С. С други думи, медианата в статистиката е стойност, която разделя серия наполовина по такъв начин, че от двете й страни (надолу или нагоре) има еднакъв брой единици в дадена популация. Поради това свойство този показател има няколко други имена: 50-ти персентил или 0,5 квантил.

Как да намерите медианата в статистиката

Методът за изчисляване на тази стойност до голяма степен зависи от това какъв тип вариационна серия имаме: дискретна или интервална. В първия случай медианата се намира съвсем просто в статистиката. Всичко, което трябва да направите, е да намерите сумата от честотите, да я разделите на 2 и след това да добавите ½ към резултата. Най-добре би било да обясните принципа на изчисление, като използвате следния пример. Да приемем, че сме групирали данни за раждаемостта и искаме да разберем каква е медианата.

Номер на семейната група по брой деца

Брой семейства

След няколко прости изчисления откриваме, че необходимият индикатор е: 195/2 + ½ = опция. За да разберете какво означава това, трябва последователно да натрупвате честоти, като започнете от най-малките опции. И така, сумата от първите два реда ни дава 30. Ясно е, че тук няма 98 опции. Но ако добавите честотата на третата опция (70) към резултата, ще получите сума, равна на 100. Тя съдържа точно 98-та опция, което означава, че медианата ще бъде семейство с две деца.

Що се отнася до интервалните серии, обикновено се използва следната формула:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me, в което:

  • X Me - първата стойност на медианния интервал;
  • ∑f - брой серии (сума от нейните честоти);
  • i Ме - стойността на медианния диапазон;
  • f Me - честота на медианния диапазон;
  • S Ме-1 е сумата от кумулативните честоти в диапазоните, предхождащи медианата.

Отново е доста трудно да се разбере без пример. Да предположим, че има данни за стойността

Заплата, хиляди рубли.

Натрупани честоти

За да използваме горната формула, първо трябва да определим средния интервал. Като такъв диапазон изберете този, чиято натрупана честота надвишава половината от общата сума от честоти или е равна на нея. И така, разделяйки 510 на 2, откриваме, че този критерий съответства на интервала със стойност на заплатата от 250 000 рубли. до 300 000 rub. Сега можете да замените всички данни във формулата:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me = 250 + 50 * (510/2 - 170) / 115 = 286,96 хиляди рубли.

Надяваме се, че нашата статия е била полезна и вече имате ясно разбиране какво е медиана в статистиката и как трябва да се изчислява.

За изчисляване на медианата в MS EXCEL има специална функция MEDIAN(). В тази статия ще дефинираме медианата и ще научим как да я изчисляваме за извадка и за даден закон на разпределение на случайна променлива.

Да започнем с медианиЗа проби(т.е. за фиксиран набор от стойности).

Примерна медиана

Медиана(медиана) е число, което е средата на набор от числа: половината от числата в набора са по-големи от Медиана, а половината числа са по-малки от Медиана.

Да изчисля медианинеобходимо първо (стойности в проба). Например, Медианаза проба (2; 3; 3; 4 ; 5; 7; 10) ще бъде 4. Защото просто вътре проба 7 стойности, три от които са по-малки от 4 (т.е. 2; 3; 3), а три стойности са по-големи (т.е. 5; 7; 10).

Ако наборът съдържа четен брой числа, тогава се изчислява за двете числа в средата на набора. Например, Медианаза проба (2; 3; 3 ; 6 ; 7; 10) ще бъде 4,5, защото (3+6)/2=4,5.

За определяне медианив MS EXCEL има функция със същото име MEDIAN(), английската версия на MEDIAN().

Медианане е задължително да съвпада с . Съвпадение възниква само ако стойностите в извадката са разпределени симетрично по отношение на средно аритметично. Например за проби (1; 2; 3 ; 4 ; 5; 6) МедианаИ средно аритметичноравно на 3,5.

Ако е известно Разпределителна функция F(x) или функция на плътността на вероятността стр(Х), Че Медианаможе да се намери от уравнението:

Например, след като решихме това уравнение аналитично за логнормалното разпределение lnN(μ; σ 2), получаваме, че Медианаизчислено по формулата =EXP(μ). Когато μ=0, медианата е 1.

Обърнете внимание на точката Функции на разпределение, за което Е(x)=0,5(вижте снимката по-горе) . Абсцисата на тази точка е равна на 1. Това е стойността на медианата, която естествено съвпада с предварително изчислената стойност по формулата em.

В MS EXCEL МедианаЗа логнормално разпределение LnN(0;1) може да се изчисли с помощта на формулата =LOGNORM.REV(0,5;0;1).

Забележка: Припомнете си, че интегралът на в цялата област на определяне на случайната променлива е равно на единица.

Следователно средната линия (x=медиана) разделя областта под графиката функции на плътност на вероятносттана две равни части.

Поради факта, че изследователят не разполага с данни за обема на продажбите във всяко обменно бюро, изчисляването на средната аритметична стойност за определяне на средната цена на долар е непрактично.

Медиана на поредица от числа

Въпреки това е възможно да се определи стойността на атрибута, който се нарича медиана (Me). Медиана

в нашия пример

Средно число: NoMe = ;

Мода

Таблица 3.6.

f— сума от честотите на серията;

S кумулативни честоти

12_

_

S—натрупани честоти.

На фиг. 3.2. Показана е хистограма на разпределението на банките по норма на печалба (съгласно таблица 3.6.).

x - размер на печалбата, милиони рубли,

f е броят на банките.

„МЕДИАНА НА ПОДРЕДЕНА СЕРИЯ“

Текстова HTML версия на публикацията


Конспекти от уроци по алгебра в 7 клас

Тема на урока: „МЕДИАНА НА ПОДРЕДЕНА СЕРИЯ.“

учител на училище Озёрная, филиал на средното училище MCOU Бурковская Еременко Татяна Алексеевна
Цели:
понятието медиана като статистическа характеристика на подреден ред; развиват способността да намират медианата за подредени серии с четен и нечетен брой членове; да развият способността да интерпретират стойностите на медианата в зависимост от практическата ситуация, да консолидират концепцията за средната аритметична стойност на набор от числа. Развийте умения за самостоятелна работа. Развийте интерес към математиката.
По време на часовете

Устна работа.
Дадени са редовете: 1) 4; 1; 8; 5; 1; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7.3; 6. Намерете: а) най-големите и най-малките стойности на всяка серия; б) обхвата на всеки ред; в) режимът на всеки ред.
II. Обяснение на нов материал.
Работа по учебника. 1. Да разгледаме задачата от параграф 10 от учебника. Какво означава поръчани серии? Бих искал да подчертая, че преди да намерите медианата, винаги трябва да подреждате сериите от данни. 2. На дъската се запознаваме с правилата за намиране на медианата за серии с четен и нечетен брой членове:
Медиана

подреден

ред
числа
с

странно

номер

членове

е числото, написано в средата, и
Медиана

поръчани серии
числа
с четен брой членове
се нарича средно аритметично на две числа, записани в средата.
Медиана

произволен

ред
се нарича медиана 1 3 1 7 5 4 на съответната подредена серия.
Отбелязвам, че показателите са средно аритметично, мода и медиана съгл

различно

характеризират

данни,

получени

резултат

наблюдения.

III. Формиране на умения и способности.
1-ва група. Упражнения за прилагане на формули за намиране на медиана на подредена и неподредена редица. 1.
№ 186.
Решение:а) Брой членове на поредицата П= 9; Медиана мех= 41; б) П= 7, редът е подреден, мех= 207; V) П= 6, редът е подреден, мех= = 21; G) П= 8, редът е подреден, мех= = 2,9. Отговор: а) 41; б) 207; на 21; г) 2.9. Учениците коментират как да намерят медианата. 2. Намерете средноаритметичното и медианата на редица от числа: а) 27, 29, 23, 31, 21, 34; V) ; 1. б) 56, 58, 64, 66, 62, 74. Решение:За да намерите медианата, е необходимо да подредите всеки ред: а) 21, 23, 27, 29, 31, 34. П = 6; х = = 27,5; мех= = 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Как да намерите медианата в статистиката

П = 6; х = 63,3; мех= = 63; V) ; 1. П = 5; х = : 5 = 3: 5 = 0,6; мех = . 3.
№ 188
(устно). Отговор: да; б) не; в) не; г) да. 4. Знаейки, че една подредена серия съдържа Tчисла, къде T– нечетно число, посочете номера на члена, който е медианата, ако Tе равно на: а) 5; б) 17; в) 47; г) 201. Отговор: а) 3; б) 9; в) 24; г) 101. 2-ра група. Практически задачи за намиране на медианата на съответния ред и интерпретиране на получения резултат. 1.
№ 189.
Решение:Брой членове на серията П= 12. За да се намери медианата, серията трябва да бъде подредена: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Медианата на серията мех= = 176. Месечната продукция е по-голяма от медианата за следните членове на артела: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125 ; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 22 xx+ + = 1) Квитко; 4) Бобков; 2) Баранов; 5) Рилов; 3) Антонов; 6) Астафиев. Отговор: 176. 2.
№ 192.
Решение:Нека сортираме сериите от данни: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; брой членове на серията П= 20. Люлка А = хмакс – х min = 42 – 30 = 12. Мода мо= 32 (тази стойност се среща 6 пъти - по-често от останалите). Медиана мех= = 35. В този случай диапазонът показва най-голяма вариация във времето за обработка на детайла; режимът показва най-типичната стойност на времето за обработка; медиана – време за обработка, което не е превишено от половината стругари. Отговор: 12; 32; 35.
IV. Обобщение на урока.
– Как се нарича медианата на поредица от числа? – Може ли медианата на редица от числа да не съвпада с нито едно от числата в редицата? – Какво число е медианата на подредена серия, съдържаща 2 Пчисла? 2 П– 1 числа? – Как да намерим медианата на неподредена серия?
Домашна работа:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

Към раздела основно общо образование

Режим и медиана

Средните стойности включват също режим и медиана.

Медианата и модата често се използват като средна характеристика в тези популации, където изчисляването на средната (аритметична, хармонична и т.н.) е невъзможно или непрактично.

Например, извадково проучване на 12 търговски бюра за обмяна на валута в Омск позволи да се запишат различни цени за долара при продажбата му (данни от 10 октомври 1995 г. при обменния курс на долара -4493 рубли).

Поради факта, че изследователят не разполага с данни за обема на продажбите във всяко обменно бюро, изчисляването на средната аритметична стойност за определяне на средната цена на долар е непрактично. Въпреки това е възможно да се определи стойността на атрибута, който се нарича медиана (Me). Медианалежи в средата на класирания ред и го разделя наполовина.

Изчисляването на медианата за негрупирани данни е както следва:

а) подредете отделните стойности на характеристиката във възходящ ред:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

б) определете поредния номер на медианата, като използвате формулата:

в нашия пример това означава, че медианата в този случай се намира между шестата и седмата стойност на атрибута в класираната серия, тъй като серията има четен брой отделни стойности. Така Me е равно на средноаритметичното на съседните стойности: 4550, 4560.

в) разгледайте процедурата за изчисляване на медианата в случай на нечетен брой отделни стойности.

Да речем, че наблюдаваме не 12, а 11 точки за обмяна на валута, тогава класираните серии ще изглеждат така (изхвърлете 12-та точка):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Средно число: NoMe = ;

на шесто място е = 4560, което е медианата: Me = 4560. От двете му страни има еднакъв брой точки.

Мода— това е най-често срещаната стойност на характеристика сред единици от дадена популация. Съответства на определена стойност на атрибута.

В нашия случай модалната цена на долар може да се нарече 4560 рубли: тази стойност се повтаря 4 пъти, по-често от всички останали.

На практика модата и медианата обикновено се намират с помощта на групирани данни. В резултат на групирането се получава поредица от разпределения на банките според размера на получената печалба за годината (Таблица 3.6.).

Таблица 3.6.

Групиране на банките по размера на получената печалба за годината

За да определите медианата, трябва да изчислите сумата от кумулативните честоти. Общото увеличение продължава, докато кумулативната сума на честотите надвиши половината от сумата на честотите. В нашия пример сумата от натрупаните честоти (12) надвишава половината от всички стойности (20:2). Тази стойност съответства на медианния интервал, който съдържа медианата (5,5 - 6,4). Нека определим стойността му по формулата:

където е началната стойност на интервала, съдържащ медианата;

— стойността на средния интервал;

f— сума от честотите на серията;

— сумата от кумулативните честоти, предхождащи медианния интервал;

— честота на средния интервал.

Така 50% от банките имат печалба от 6,1 милиона рубли, а 50% от банките имат печалба от над 6,1 милиона рубли.

Най-високата честота също съответства на интервала 5,5 - 6,4, т.е. режимът трябва да е в този интервал. Определяме стойността му по формулата:

където е началната стойност на интервала, съдържащ режима;

— стойността на модалния интервал;

— честота на модалния интервал;

— честота на интервала, предхождащ модалния;

— честота на интервала, следващ модалния.

Дадената модна формула може да се използва във вариационни серии с равни интервали.

По този начин в тази популация най-често срещаният размер на печалбата е 6,10 милиона рубли.

Медианата и модата могат да се определят графично. Медианата се определя от кумулата (фиг. 3.1.). За да се конструира, е необходимо да се изчислят кумулативните честоти и честоти. Кумулативните честоти показват колко единици на съвкупността имат стойности на атрибути не по-големи от разглежданата стойност и се определят чрез последователно сумиране на интервални честоти. При конструиране на кумулативна серия на разпределение на интервали долната граница на първия интервал съответства на честота, равна на нула, а горната граница съответства на цялата честота на даден интервал. Горната граница на втория интервал съответства на кумулативна честота, равна на сумата от честотите на първите два интервала и т.н.

Нека построим кумулативна крива според данните в табл. 6 относно разпределението на банките по норма на печалба.

S кумулативни честоти

12_

_

3.7-4.6 4.6-5.5 5.5-6.4 6.4-7.3 7.3-8.2 X печалба

Ориз. 3.1. Кумулати на сериите за разпределение на банките по марж на печалбата:

x - размер на печалбата, милиони рубли,

S—натрупани честоти.

За да се определи медианата, височината на най-голямата ордината, която съответства на общия размер на населението, се разделя наполовина. През получената точка се изчертава права линия, успоредна на абсцисната ос, докато се пресече с кумулата. Абсцисата на пресечната точка е медианата.

Режимът се определя от хистограмата на разпределението. Хистограмата е изградена по следния начин:

На абсцисната ос се нанасят равни сегменти, които в приетия мащаб съответстват на размера на интервалите на вариационната серия. Върху сегментите са изградени правоъгълници, чиито площи са пропорционални на честотите (или честотите) на интервала.

Медиана в статистиката

3.2. Показана е хистограма на разпределението на банките по норма на печалба (съгласно таблица 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X

Ориз. 3.2. Разпределение на търговските банки по норма на печалба:

x - размер на печалбата, милиони рубли,

f е броят на банките.

За да определим режима, свързваме десния връх на модалния правоъгълник с горния десен ъгъл на предишния правоъгълник, а левия връх на модалния правоъгълник с горния ляв ъгъл на следващия правоъгълник. Абсцисата на пресечната точка на тези линии ще бъде режимът на разпределение.

Медиана (статистика)

Медиана (статистика), в математическата статистика, число, характеризиращо извадка (например набор от числа). Ако всички елементи на извадката са различни, тогава медианата е номерът на извадката, така че точно половината от елементите на извадката са по-големи от нея, а другата половина са по-малки от нея. По-общо, медианата може да бъде намерена чрез подреждане на елементите на извадка във възходящ или низходящ ред и вземане на средния елемент. Например извадката (11, 9, 3, 5, 5) след подреждане се превръща в (3, 5, 5, 9, 11) и нейната медиана е числото 5. Ако извадката има четен брой елементи, медианата може да не е уникално определена: за числови данни най-често се използва полусумата от две съседни стойности (т.е. медианата на набора (1, 3, 5, 7) се приема равна на 4).

С други думи, медианата в статистиката е стойност, която разделя серия наполовина по такъв начин, че от двете й страни (надолу или нагоре) има еднакъв брой единици в дадена популация.

Задача No1. Изчисляване на средно аритметично, модални и медианни стойности

Поради това свойство този показател има няколко други имена: 50-ти персентил или 0,5 квантил.

  • Средна стойност
  • Медиана
  • Мода

Медиана (статистика)

Медиана (статистика), в математическата статистика, число, характеризиращо извадка (например набор от числа). Ако всички елементи на извадката са различни, тогава медианата е номерът на извадката, така че точно половината от елементите на извадката са по-големи от нея, а другата половина са по-малки от нея. По-общо, медианата може да бъде намерена чрез подреждане на елементите на извадка във възходящ или низходящ ред и вземане на средния елемент. Например извадката (11, 9, 3, 5, 5) след подреждане се превръща в (3, 5, 5, 9, 11) и нейната медиана е числото 5.

5.5 Мода и медиана. Изчисляването им в дискретни и интервални вариационни редове

Ако има четен брой елементи в извадката, медианата може да не е уникално определена: за числени данни най-често се използва полусумата от две съседни стойности (т.е. медианата на набора (1, 3, 5, 7) се приема равно на 4).

С други думи, медианата в статистиката е стойност, която разделя серия наполовина по такъв начин, че от двете й страни (надолу или нагоре) има еднакъв брой единици в дадена популация. Поради това свойство този показател има няколко други имена: 50-ти персентил или 0,5 квантил.

Медианата се използва вместо средноаритметично, когато екстремните опции на класираната серия (най-малката и най-голямата) в сравнение с останалите се окажат прекалено големи или прекалено малки.

Функцията MEDIAN измерва централната тенденция, която е центърът на набор от числа в статистическо разпределение. Има три най-често срещани начина за определяне на централната тенденция:

  • Средна стойност- средно аритметично, което се изчислява чрез събиране на набор от числа и след това получената сума се разделя на техния брой.
    Например средната стойност на числата 2, 3, 3, 5, 7 и 10 е 5, което е резултат от разделянето на сбора им от 30 на сбора им от 6.
  • Медиана- число, което е средата на набор от числа: половината числа имат стойности, по-големи от медианата, а половината числа имат стойности по-малки.
    Например медианата за числата 2, 3, 3, 5, 7 и 10 би била 4.
  • Мода- числото, което най-често се среща в даден набор от числа.
    Например режимът за числата 2, 3, 3, 5, 7 и 10 ще бъде 3.

Урок по алгебра в 7 клас.

Тема: “Медианата като статистическа характеристика.”

Учител Егорова Н.И.

Целта на урока: да се формира у учениците представа за медианата на набор от числа и способността да се изчислява за прости числови набори, да се консолидира концепцията за средното аритметично число на набор от числа.

Тип урок: обяснение на нов материал.

По време на часовете

1. Организационен момент.

Информирайте темата на урока и формулирайте неговите цели.

2. Актуализиране на предишни знания.

Въпроси към учениците:

Какво е средноаритметичното на набор от числа?

Къде се намира средната аритметична стойност в набор от числа?

Какво характеризира средноаритметичната стойност на набор от числа?

Къде е често използваната средна аритметична стойност на набор от числа?

Устни задачи:

Намерете средната аритметична стойност на набор от числа:

Проверка на домашните.

Учебник: № 169, № 172.

3. Изучаване на нов материал.

В предишния урок се запознахме с такава статистическа характеристика като средноаритметичното на набор от числа. Днес ще посветим урок на друга статистическа характеристика - медианата.

Не само средното аритметично показва къде на числовата ос се намират числата от всяко множество и къде е техният център. Друг показател е медианата.

Медианата на набор от числа е числото, което разделя набора на две равни части. Вместо „медиана“, можете да кажете „среда“.

Първо, нека да разгледаме примери как да намерим медианата и след това да дадем строго определение.

Разгледайте следния устен пример с помощта на проектор

В края на учебната година 11 ученици от 7 клас преминаха норматив на 100 метра. Бяха записани следните резултати:

След като момчетата пробягаха разстоянието, Петя се приближи до учителя и попита какъв е резултатът му.

„Най-среден резултат: 16,9 секунди“, отговори учителят.

"Защо?" – изненада се Петя. – Все пак средноаритметичното от всички резултати е приблизително 18,3 секунди, а аз бягах с повече от секунда по-добре. И като цяло резултатът на Катя (18,4) е много по-близо до средния от моя.

„Вашият резултат е среден, тъй като петима души тичаха по-добре от вас, а петима - по-лошо. Тоест вие сте точно по средата”, каза учителят.

Запишете алгоритъм за намиране на медианата на набор от числа:

Подредете набор от числа (направете класирана серия).

Едновременно задраскайте „най-големите“ и „най-малките“ числа от даден набор от числа, докато останат едно или две числа.

Ако остане едно число, това е медианата.

Ако останат две числа, тогава медианата ще бъде средната аритметична на двете останали числа.

Поканете учениците самостоятелно да формулират дефиницията на медианата на набор от числа, след това да прочетат дефиницията на медианата в учебника (стр. 40), след което да решат № 186 (а, б), № 187 (а) от учебника (стр. 41).

коментар:

Обърнете вниманието на учениците към важен факт: медианата е практически нечувствителна към значителни отклонения на отделни екстремни стойности на набори от числа. В статистиката това свойство се нарича стабилност. Стабилността на статистическия показател е много важно свойство, което ни предпазва от случайни грешки и отделни ненадеждни данни.

4. Затвърдяване на изучения материал.

Разрешаване на проблем.

Нека обозначим x-средно аритметично, Me-медиана.

Набор от числа: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Набор от числа: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

а) Набор от числа: 3,4,11,17,21

б) Набор от числа: 17,18,19,25,28

в) набор от числа: 25, 25, 27, 28, 29, 40, 50

Заключение: медианата на набор от числа, състояща се от нечетен брой членове, е равна на числото в средата.

а) Набор от числа: 2, 4, 8, 9.

Аз = (4+8):2=12:2=6

б) набор от числа: 1,3,5,7,8,9.

Аз = (5+7):2=12:2=6

Медианата на набор от числа, съдържащ четен брой членове, е равна на половината от сбора на двете числа в средата.

През тримесечието ученикът получи следните оценки по алгебра:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Намерете средната стойност и медианата на това множество.

Нека намерим средния резултат, тоест средноаритметичното:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Нека намерим медианата на този набор от числа:

Нека подредим набора от числа: 2,4,4,4,5,5,5,5,5,5

Има само 10 числа, за да намерите медианата, трябва да вземете двете средни числа и да намерите тяхната полусума.

Аз = (5+5):2 = 5

Въпрос към учениците: Ако бяхте учител, каква оценка бихте поставили на този ученик за тримесечието? Обосновете отговора си.

Президентът на компанията получава заплата от 300 000 рубли. трима от неговите заместници получават по 150 000 рубли, четиридесет служители - по 50 000 рубли. и заплатата на чистачката е 10 000 рубли. Намерете средноаритметичната и медианата на заплатите във фирмата. Коя от тези характеристики е по-изгодна за президента да използва за рекламни цели?

x = (300000+3·150000+40·50000+10000):(1+3+40+1) = 2760000:45=61333,33 (руб.)

No 6. Устно.

А) Колко числа има в набор, ако неговият девет член е неговата медиана?

Б) Колко числа има в набор, ако неговата медиана е средноаритметичното на 7-ия и 8-ия член?

В) В набор от седем числа най-голямото число се увеличава с 14. Това ще промени ли средното аритметично и медианата?

Г) Всяко от числата в набора се увеличава с 3. Какво се случва със средното аритметично и медианата?

Сладките в магазина се продават на тегло. За да разбере колко бонбони се съдържат в един килограм, Маша реши да намери теглото на един бонбон. Тя претегли няколко бонбона и получи следните резултати:

12, 13, 14, 12, 15, 16, 14, 13, 11.

И двете характеристики са подходящи за оценка на теглото на един бонбон, т.к те не се различават много един от друг.

Така че, за да се характеризира статистическата информация, се използват средната аритметична стойност и медианата. В много случаи една от характеристиките може да няма никакво смислено значение (например, имайки информация за времето на пътните произшествия, едва ли има смисъл да говорим за средно аритметично на тези данни).

Домашна работа: параграф 10, № 186 (c, d), № 190.

5. Обобщение на урока. Отражение.

  1. "Статистически изследвания: събиране и групиране на статистически данни"

    Урок

    Теми, предложен за седми клас. ТЕМАТИЧНО ПЛАНИРАНЕ. § 1. Статистическихарактеристики. P 1. Средно аритметично, диапазон и мода 1h. П 2. МедианакакстатистическиХарактеристика

  2. Работна програма на учебната програма по алгебра в 7 клас (основно ниво) обяснителна записка

    Работна програма

    ... клауза 10 МедианакакстатистическиХарактеристика 23 стр.9 Средно аритметично, диапазон и мода 24 Изпит No 2 на тема

  3. Работна програма. Математика. 5 клас Стр. Канаши. 2011 г

    Работна програма

    ... уравнения. Средно аритметично, диапазон и мода. МедианакакстатистическиХарактеристика. Целта е да се систематизира и обобщи информацията за ... и умения, придобити при УроциСпоред теми(добре алгебра 10 клас). 11 Клас(4 часа седмично...

  4. Заповед № 51 от “30” август 2012 г. Работна програма по алгебра 7. клас

    Работна програма

    ... учебни материали МедианакакстатистическиХарактеристикаПознайте определението за средно аритметично, диапазон, режим и медианикакстатистическихарактеристикиФронтален и индивидуален...

  5. Работна програма по математика 7 клас ii ниво основно ниво (1)

    Работна програма

    Как да намерим медианата на серия

    един и същ, какна 6 клас. Изучаване Темизавършва със запознаване на учениците с най-простите статистическихарактеристики: средно... М.: Издателство "Генжер", 2009. 3. Жохов, В.И. Уроциалгебрана 7 клас: Книга за учителя / В. И. Жохов ...

Други подобни документи...

През 1906 г. великият учен и известен евгеник Франсис Галтън посещава годишната изложба за постижения в животновъдството и птицевъдството в Западна Англия, където съвсем случайно провежда интересен експеримент.

Както отбелязва Джеймс Суровиецки, автор на „Мъдростта на тълпите“, на панаира Галтън се интересуваше от едно състезание, в което хората трябваше да познаят теглото на заклан вол. Този, който посочи числото, най-близко до истинското, беше обявен за победител.

Галтън беше известен с презрението си към интелектуалните способности на обикновените хора. Той вярваше, че само истински експерти биха могли да направят точни твърдения за теглото на един вол. А 787 участници в състезанието не са били експерти.

Ученият щеше да докаже некомпетентността на тълпата, като изчисли средната стойност на отговорите на участниците. Представете си изненадата му, когато се оказа, че резултатът, който получи, почти напълно отговаря на реалното тегло на бика!

Средно - Късно изобретение

Разбира се, точността на отговора учуди изследователя. Но още по-забележителен е фактът, че Галтън дори се сети да използва средната стойност.

В днешния свят средните стойности и така наречените медиани се срещат на всяка крачка: средната температура в Ню Йорк през април е 52 градуса по Фаренхайт; Стивън Къри има средно 30 точки на мач; Средният семеен доход в САЩ е $51 939/година.

Идеята обаче, че много различни резултати могат да бъдат представени с едно число, е доста нова. До 17-ти век средните стойности изобщо не са били използвани.

Как се появи и разви концепцията за средни стойности и медиани? И как успя да се превърне в основна измервателна техника в наше време?

Доминирането на средните стойности над медианите има далечни последици за нашето разбиране на информацията. И често подвеждаше хората.

Средни и медианни стойности

Представете си, че разказвате история за четирима души, които са вечеряли с вас в ресторант снощи. Бихте дали на един от тях 20 години, на друг 30, на трети 40 и на четвърти 50. Какво ще кажете за възрастта им във вашата история?

Най-вероятно бихте ги нарекли средна възраст.

Средната стойност често се използва за предаване на информация за нещо, както и за описание на набор от измервания. Технически средната стойност е това, което математиците наричат ​​„средно аритметично“ – сумата от всички измервания, разделена на броя на измерванията.

Въпреки че думата средно често се използва като синоним на медиана, последната по-често се отнася до средата на нещо. Тази дума идва от латинското "medianus", което означава "среден".

Средна стойност в Древна Гърция

Историята на средната стойност започва с учението на древногръцкия математик Питагор. За Питагор и неговата школа медианата имаше ясна дефиниция и беше много различна от начина, по който разбираме средната стойност днес. Използва се само в математиката, не и в анализа на данни.

В питагорейската школа средната стойност е средното число в тричленна последователност от числа, в „равно“ отношение към съседните й членове. Една „равна“ връзка може да означава еднакво разстояние. Например числото 4 от поредицата 2,4,6. Въпреки това, той може също да изрази геометрична прогресия, като например 10 в редицата 1,10,100.

Статистикът Чърчил Айзенхарт обяснява, че в древна Гърция средната стойност не е била използвана за представяне или заместване на набор от числа. Той просто обозначаваше средата и често се използваше в математически доказателства.

Айзенхарт прекарва десет години в изучаване на средната стойност и медианата. Първоначално той се опитва да намери представителната функция на медианата в ранните научни конструкции. Вместо това обаче той открива, че повечето ранни физици и астрономи разчитат на единични, умни измервания и им липсва методология за избор на най-добрия резултат измежду множество наблюдения.

Съвременните изследователи базират заключенията си на събиране на големи количества данни, като например биолози, изучаващи човешкия геном. Древните учени можеха да направят няколко измервания, но те избраха само най-добрите, за да изградят своите теории.

Както пише историкът на астрономията Ото Нойгебауер, „Това е в съответствие със съзнателното желание на древните хора да сведат до минимум количеството емпирични данни в науката, тъй като те не са вярвали в точността на преките наблюдения.“

Например гръцкият математик и астроном Птолемей изчислява ъгловия диаметър на Луната, използвайки методи за наблюдение и теорията за движението на Земята. Резултатът му беше 31'20. Днес знаем, че диаметърът на Луната варира от 29'20 до 34'6 в зависимост от разстоянието й от Земята. Птолемей използва малко данни в изчисленията си, но имаше всички основания да вярва, че са точни.

Айзенхарт пише: „Трябва да се има предвид, че връзката между наблюдението и теорията е била различна в древността, отколкото днес. Резултатите от наблюденията се разбират не като факти, към които теорията трябва да се коригира, а като конкретни случаи, които могат да бъдат полезни само като илюстративни примери за истинността на теорията.

Учените в крайна сметка ще се обърнат към представителни измервания на данни, но първоначално нито средства, нито медиани са били използвани в тази роля. От древността до наши дни като такова представително средство се използва друга математическа концепция: полусумата на екстремните стойности.

Половин сбор от екстремни стойности

Новите научни инструменти почти винаги възникват от необходимостта да се реши конкретен проблем в дадена дисциплина. Необходимостта да се намери най-добрата стойност сред множество измервания възникна от необходимостта да се определи точно географското местоположение.

Интелектуалният гигант от 11-ти век Ал-Бируни е известен като един от първите хора, използвали методологията на представителните значения. Ал-Бируни пише, че когато е имал много измервания на свое разположение и е искал да намери най-доброто сред тях, той е използвал следното „правило“: трябва да намерите числото, съответстващо на средата между две крайни стойности. При изчисляване на полусумата на екстремните стойности не се вземат предвид всички числа между максималната и минималната стойност, но се намира средната стойност само на тези две числа.

Ал-Бируни използва този метод в различни области, включително изчисляване на географската дължина на град Газни, който се намира в съвременен Афганистан, както и в изследванията си на свойствата на металите.

През последните няколко века обаче полусумата на екстремните стойности се използва все по-рядко. Всъщност в съвременната наука това изобщо не е актуално. Полусумата е заменена от средната стойност.

Преминаване към средни стойности

До началото на 19 век използването на медианата/средната стойност се превърна в обичаен метод за намиране на най-точно представителната стойност от група данни. Фридрих фон Гаус, изключителен математик на своето време, пише през 1809 г.: „Смяташе се, че ако определено число е определено чрез няколко преки наблюдения, направени при едни и същи условия, тогава средното аритметично е най-вярната стойност. Ако не е съвсем строг, то поне е близо до реалността и затова винаги можете да разчитате на него.”

Защо се случи тази промяна в методологията?

На този въпрос е доста трудно да се отговори. В своето изследване Чърчил Айзенхарт предполага, че методът за намиране на средната аритметична стойност може да е възникнал в областта на измерването на магнитното отклонение, тоест при намирането на разликата между посоката на стрелката на компаса, сочеща на север, и реалния север. Това измерение е било изключително важно през епохата на Великите географски открития.

Айзенхарт установи, че до края на 16 век повечето учени, които измерват магнитното отклонение, са използвали метода ad hoc (на латински за „към това, за този случай, за тази цел“) при избора на най-точното измерване.

Но през 1580 г. ученият Уилям Боро подходи към проблема по различен начин. Той направи осем различни измервания на отклонението и след като ги сравни, заключи, че най-точната стойност е между 11 ⅓ и 11 ¼ градуса. Вероятно е изчислил средно аритметично, което е в този диапазон. Самият Боро обаче не нарече открито подхода си нов метод.

Преди 1635 г. не е имало ясни случаи на използване на средната стойност като представително число. Тогава обаче английският астроном Хенри Гелибранд направи две различни измервания на магнитното отклонение. Единият е заснет сутрин (11 градуса), а другият следобед (11 градуса и 32 минути). Изчислявайки най-истинската стойност, той написа:

„Ако намерим средната аритметична стойност, можем да кажем с голяма вероятност, че резултатът от точно измерване трябва да бъде около 11 градуса и 16 минути.“

Вероятно това е първият път, когато средната стойност е използвана като най-близка до истинската стойност!

Думата "среден" е била използвана на английски език в началото на 16 век, за да обозначи финансови загуби от щети, претърпени от кораб или неговия товар по време на пътуване. През следващите сто години тя обозначава точно тези загуби, които се изчисляват като средно аритметично. Например, ако кораб е бил повреден по време на пътуване и екипажът е трябвало да изхвърли някои стоки зад борда, за да поддържа теглото на кораба, инвеститорите ще понесат финансови загуби, еквивалентни на сумата на тяхната инвестиция - тези загуби са изчислени по същия начин, както средното аритметично. Така постепенно стойностите на средната и средната аритметична се доближиха.

Средна стойност

В наши дни средната стойност или средноаритметичното се използва като основен метод за избор на представителна стойност за набор от измервания. Как се случи това? Защо тази роля не е дадена на средната стойност?

Франсис Галтън беше шампион на медианата

Терминът "медиана" - средният член в поредица от числа, който разделя поредицата наполовина - се появява приблизително по същото време като средното аритметично. През 1599 г. математикът Едуард Райт, работейки върху проблема за нормалното отклонение на компаса, за първи път предложи използването на средната стойност.

„...Да предположим, че много стрелци стрелят по определена цел. Впоследствие целта се премахва. Как можете да разберете къде е била целта? Трябва да намерите средното място между всички стрелки. По същия начин, сред многото резултати от наблюдения, този в средата ще бъде най-близо до истината.

Медианата се използва широко през деветнадесети век, превръщайки се в необходима част от всеки анализ на данни по това време. Използван е и от Франсис Галтън, изключителен анализатор от деветнадесети век. В историята за претеглянето на вола, разказана в началото на тази статия, Галтън първоначално използва средната стойност като представяне на мнението на тълпата.

Много анализатори, включително Галтън, предпочитаха медианата, защото е по-лесна за изчисляване за малки набори от данни.

Медианата обаче никога не е била по-популярна от средната. Това най-вероятно се дължи на специалните статистически свойства, присъщи на средната стойност, както и на нейната връзка с нормалното разпределение.

Връзка между средното и нормалното разпределение

Когато правим много измервания, резултатите са, както казват статистиците, „нормално разпределени“. Това означава, че ако тези данни се начертаят на графика, точките върху нея ще изобразяват нещо подобно на камбана. Ако ги свържете, ще получите "камбанообразна" крива. Много статистически данни съответстват на нормално разпределение, като ръст на хората, интелигентност и най-висока годишна температура.

Когато данните са нормално разпределени, средната стойност ще бъде много близо до най-високата точка на камбанообразната крива и много голям брой измервания ще бъдат близо до средната стойност. Има дори формула, която предвижда колко измервания ще паднат на известно разстояние от средното.

По този начин изчисляването на средната стойност дава на изследователите много допълнителна информация.

Връзката между средната стойност и стандартното отклонение му дава голямо предимство, тъй като средната стойност няма такава връзка. Тази връзка е важна част от анализа на експерименталните данни и статистическата обработка на информацията. Ето защо средната стойност се превърна в ядрото на статистиката и всички науки, които разчитат на множество данни, за да направят своите заключения.

Предимството на средната стойност се дължи и на факта, че тя лесно се изчислява от компютри. Въпреки че средната стойност за малка група от данни е сравнително лесно да се изчисли самостоятелно, много по-лесно е да се напише компютърна програма, която намира средната стойност. Ако използвате Microsoft Excel, вероятно знаете, че средната функция не е толкова лесна за изчисляване, колкото средната функция.

В резултат на това, поради голямото си научно значение и лекотата на използване, средната стойност се превърна в основна представителна стойност. Тази опция обаче не винаги е най-добрата.

Предимства на медианната стойност

В много случаи, когато искаме да изчислим централната стойност на разпределение, средната стойност е по-добра мярка. Това е така, защото средната стойност до голяма степен се определя от екстремните резултати от измерването.

Много анализатори смятат, че необмисленото използване на средни стойности има отрицателно въздействие върху разбирането ни за количествената информация. Хората гледат средното и смятат, че това е „нормата“. Но всъщност може да се определи от всеки един член, който се откроява силно от хомогенна серия.

Представете си анализатор, който иска да знае представителна стойност за пет къщи. Четири къщи струват 100 000 долара, а петата струва 900 000 долара. Следователно средната стойност ще бъде $200 000, а медианата ще бъде $100 000. В този, както и в много други случаи, средната стойност осигурява по-добро разбиране на това, което може да се нарече „стандарт“.

Признавайки колко екстремни стойности могат да повлияят на средната стойност, медианата се използва за отразяване на промените в доходите на домакинствата в САЩ.

Медианите също са по-малко чувствителни към мръсните данни, с които анализаторите работят днес. Много статистици и анализатори събират информация, като анкетират хората в Интернет. Ако потребителят случайно добави допълнителна нула към отговора, което превръща 100 в 1000, тогава тази грешка ще има много по-силно въздействие върху средната стойност, отколкото върху медианата.

Средно или средно?

Изборът между медианата и средната стойност има далечни последици, от разбирането ни за ефектите на лекарствата върху здравето до познанията ни за това какъв трябва да бъде стандартният домакински бюджет.

Тъй като събирането и анализът на данни все повече оформят начина, по който разбираме света, се променя и стойността на количествата, които използваме. В един идеален свят анализаторите биха използвали както средната, така и медианата, за да изразят данните графично.

Но ние живеем в условия на ограничено време и внимание. Поради тези ограничения често трябва да изберем само едно нещо. И в много случаи средната стойност е за предпочитане.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи