Оценка на математическото очакване на случайна величина. Точкови оценки на математическото очакване

Нека има случайна променлива хс математическо очакване ми дисперсия д, докато и двата параметъра са неизвестни. Над големина хпроизведени ннезависими експерименти, които доведоха до набор от нчислени резултати x 1, x 2, …, x N. Като оценка на математическото очакване е естествено да се предложи средноаритметичното на наблюдаваните стойности

(1)

Тук като x iспецифични стойности (числа), получени в резултат на нексперименти. Ако вземем други (независими от предишните) нексперименти, тогава очевидно ще получим различна стойност. Ако приемете повече нексперименти, ще получим още една нова стойност. Означаваме с X iслучайна променлива в резултат на азексперимента, след това реализациите X iще бъдат числата, получени в резултат на тези експерименти. Очевидно е, че случайната променлива X iще има същата плътност на разпределение на вероятността като оригиналната случайна променлива х. Ние също така приемаме, че случайните променливи X iИ Xjса независими при аз, не е равно й(различни независими един спрямо друг експерименти). Следователно пренаписваме формула (1) в различна (статистическа) форма:

(2)

Нека покажем, че оценката е безпристрастна:

По този начин математическото очакване на средната стойност на извадката е равно на истинското математическо очакване на случайната променлива м. Това е доста предвидим и разбираем факт. Следователно средната стойност на извадката (2) може да се приеме като оценка на математическото очакване на случайна променлива. Сега възниква въпросът: какво се случва с дисперсията на оценката на очакването, когато броят на експериментите се увеличава? Това показват аналитичните изчисления

където е дисперсията на оценката на математическото очакване (2), и д- истинска дисперсия на случайната променлива х.

От горното следва, че с увеличаване н(брой експерименти) дисперсията на оценката намалява, т.е. колкото повече обобщаваме независимите реализации, толкова по-близо до очакваната стойност получаваме оценката.


Математически оценки на дисперсията

На пръв поглед най-естествената оценка изглежда

(3)

където се изчислява по формула (2). Нека проверим дали оценката е безпристрастна. Формула (3) може да бъде записана по следния начин:

Заместваме израз (2) в тази формула:

Нека намерим математическото очакване на оценката на дисперсията:

(4)

Тъй като дисперсията на случайна променлива не зависи от това какво е математическото очакване на случайната променлива, ще приемем математическото очакване равно на 0, т.е. м = 0.

(5)
при .(6)

Нека има случайна променлива X и нейните параметри са математическото очакване Аи дисперсията са неизвестни. Над стойността на X бяха проведени независими експерименти, които дадоха резултати x 1, x 2, x n.

Без да намаляваме общността на разсъжденията, ще считаме тези стойности на случайната променлива за различни. Ще разгледаме стойностите x 1, x 2, x n като независими, еднакво разпределени случайни променливи X 1, X 2, X n.

Най-простият метод за статистическа оценка - методът на заместване и аналогия - се състои в това, че като оценка на една или друга числена характеристика (средна, дисперсия и т.н.) на генералната съвкупност, те вземат съответната характеристика на разпределението на извадката - характеристиката на извадката.

По метода на заместването като оценка на математическото очакване Анеобходимо е да се вземе математическото очакване на разпределението на извадката – извадковата средна. Така получаваме

За да се тества безпристрастността и последователността на средните стойности на извадката като оценки А, разгледайте тази статистика като функция на избрания вектор (X 1, X 2, X n). Като се има предвид, че всяка от величините X 1, X 2, X n има същия закон на разпределение като величината X, заключаваме, че числените характеристики на тези величини и величината X са еднакви: M(X аз) = M(X) = а, D(X аз) = D(X) = , аз = 1, 2, н , където X i са колективно независими случайни променливи.

следователно

Следователно по дефиниция получаваме, че това е безпристрастната оценка А, и тъй като D()®0 като n®¥, тогава по силата на теоремата от предходния параграф е последователна оценка на очакванията Аобщото население.

Ефективността или неефективността на оценката зависи от формата на закона за разпределение на случайната променлива X. Може да се докаже, че ако стойността X е разпределена по нормалния закон, тогава оценката е ефективна. За други закони за разпределение това може да не е така.

Безпристрастна оценка на общата дисперсияе коригираната дисперсия на извадката

,

защото , където е общата дисперсия. Наистина ли,

Оценката s -- 2 за общата дисперсия също е последователна, но не е ефективна. Въпреки това, в случай на нормално разпределение, то е „асимптотично ефективно“, т.е., когато n нараства, съотношението на неговата дисперсия към минимално възможното се приближава неограничено.

И така, дадена извадка от разпределението F( х) случайна променлива X с неизвестно математическо очакване Аи дисперсия , тогава за изчисляване на стойностите на тези параметри имаме право да използваме следните приблизителни формули:

а ,

.

Тук х-и- - опции за вземане на проби, n- i - - опции за честота x i, - - размер на извадката.
За изчисляване на коригираната дисперсия на извадката формулата е по-удобна


.

За да опростите изчислението, препоръчително е да преминете към условни опции (изгодно е да се вземе началният вариант, разположен в средата на интервалната вариационна серия като c). Тогава

, .

интервална оценка

По-горе разгледахме въпроса за оценката на неизвестен параметър Аедно число. Нарекохме такива оценки точкови оценки. Те имат недостатъка, че при малък размер на извадката могат да се различават значително от оценените параметри. Следователно, за да се добие представа за близостта между даден параметър и неговата оценка, в математическата статистика се въвеждат така наречените интервални оценки.

Нека точкова оценка q * бъде намерена в извадката за параметъра q. Обикновено на изследователите е дадена предварително някаква достатъчно голяма вероятност g (например 0,95; 0,99 или 0,999), така че събитие с вероятност g да може да се счита за практически сигурно, и те повдигат въпроса за намирането на такава стойност e > 0 за който

.

Променяйки това равенство, получаваме:

и в този случай ще кажем, че интервалът ]q * - e; q * + e[ покрива оценения параметър q с вероятност g.

Интервал ]q * -e; q * +e [ се извиква доверителен интервал .

Вероятността g се нарича надеждност (доверителна вероятност) оценка на интервала.

Краищата на доверителния интервал, т.е. се наричат ​​точки q * -e и q * +e граници на доверие .

Числото e се нарича точност на оценката .

Като пример за проблема за определяне на границите на доверие, разгледайте въпроса за оценка на математическото очакване на случайна променлива X, която има нормален закон на разпределение с параметри Аи s, т.е. X = N( а, с). Математическото очакване в този случай е равно на А. Според наблюденията X 1 , X 2 , X n изчислете средната стойност и оценка дисперсия s 2 .

Оказва се, че според примерните данни е възможно да се конструира случайна променлива

което има разпределение на Стюдънт (или t-разпределение) с n = n -1 степени на свобода.

Нека използваме таблица A.1.3 и намерим за дадената вероятност g и числото n числото t g, така че вероятността

P(|t(n)|< t g) = g,

.

След като направихме очевидни трансформации, получаваме

Процедурата за прилагане на F-критерия е следната:

1. Прави се предположение за нормалното разпределение на популациите. При дадено ниво на значимост a се формулира нулевата хипотеза H 0: s x 2 = s y 2 относно равенството на общите дисперсии на нормалните съвкупности при конкурентната хипотеза H 1: s x 2 > s y 2 .

2. Получават се две независими проби от популациите X и Y съответно на n x и n y.

3. Изчислете стойностите на коригираните дисперсии на извадката s x 2 и s y 2 (методите за изчисление са разгледани в §13.4). По-голямата от дисперсиите (s x 2 или s y 2) се обозначава с 1 2, по-малката - s 2 2.

4. Стойността на F-критерия се изчислява по формулата F obs = s 1 2 / s 2 2 .

5. Съгласно таблицата на критичните точки на разпределението на Fisher - Snedecor, за дадено ниво на значимост a и броя на степените на свобода n 1 \u003d n 1 - 1, n 2 \u003d n 2 - 1 (n 1 е броят на степените на свобода на по-голяма коригирана дисперсия), се намира критичната точка F cr (a, n 1, n 2).

Имайте предвид, че таблица A.1.7 показва критичните стойности на едностранния F-критерий. Следователно, ако се приложи двустранен критерий (H 1: s x 2 ¹ s y 2), тогава дясната критична точка F cr (a / 2, n 1, n 2) се търси по нивото на значимост a / 2 (половината от посочената) и броя на степените на свобода n 1 и n 2 (n 1 - броят на степените на свобода на по-голяма дисперсия). Лявата критична точка може да не бъде намерена.

6. Заключението е, че ако изчислената стойност на F-критерия е по-голяма или равна на критичната (F obs ³ F cr), тогава дисперсиите се различават значително при дадено ниво на значимост. В противен случай (F obs< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Задача 15.1. Разходът на суровини за единица продукция по старата технология беше:

Нова технология:

Ако приемем, че съответните генерални съвкупности X и Y имат нормални разпределения, проверете дали потреблението на суровини за нови и стари технологии не се различава по променливост, ако вземем нивото на значимост a = 0,1.

Решение. Действаме по посочения по-горе ред.

1. Ще преценим променливостта на потреблението на суровини за нови и стари технологии по отношение на стойностите на дисперсията. Така нулевата хипотеза има формата H 0: s x 2 = s y 2 . Като конкурентна хипотеза приемаме хипотезата H 1: s x 2 ¹ s y 2, тъй като не сме сигурни предварително, че някоя от общите вариации е по-голяма от другата.

2-3. Намерете примерните отклонения. За да опростим изчисленията, нека да преминем към условни опции:

u i = x i - 307, v i = y i - 304.

Ще организираме всички изчисления под формата на следните таблици:

u i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Контрол: å m i u i 2 + 2å m i u i + m i = Контрол: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Намерете коригираните дисперсии на извадката:

4. Сравнете дисперсиите. Намерете отношението на по-голямата коригирана дисперсия към по-малката:

.

5. По условие конкурентната хипотеза има формата s x 2 ¹ s y 2 , следователно критичната област е двустранна и при намиране на критичната точка трябва да се вземат нива на значимост, които са половината от дадената.

Съгласно таблица A.1.7, чрез нивото на значимост a/2 = 0,1/2 = 0,05 и броя на степените на свобода n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, намираме критична точка F cr (0,05; 12; 8) = 3,28.

6. Тъй като F обл.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

По-горе, когато се тестват хипотези, се приема, че разпределението на изследваните случайни променливи е нормално. Специални проучвания обаче показват, че предложените алгоритми са много стабилни (особено при големи размери на извадката) по отношение на отклонението от нормалното разпределение.

Параметри и статистика на разпределението

Всички параметри на разпределението на случайна променлива, като например математическото очакване или дисперсията, например, са теоретични стойности, които не са директно измерими, въпреки че могат да бъдат оценени. Те са количествени население и могат да бъдат определени сами по себе си само в хода на теоретичното моделиране като хипотетични стойности, тъй като те описват характеристиките на разпределението на случайна променлива в самата генерална съвкупност. За да ги определи на практика, изследователят, провеждащ експеримента, извършва тяхната селективна оценка. Такава оценка включва статистическо изчисление.

Статистика представлява количествена характеристика на изследваните параметри, характеризиращи разпределението на случайна величина, получена на базата на изследване на извадкови стойности. Статистиката се използва или за описание на самата извадка, или, което е от първостепенно значение при фундаменталните експериментални изследвания, за оценка на параметрите на разпределение на случайна променлива в общата изследвана популация.

Разделяне на понятията "параметър" И "статистика" е много важно, тъй като позволява да се избегнат редица грешки, свързани с неправилна интерпретация на данните, получени в експеримента. Факт е, че когато оценяваме параметрите на разпределението, използвайки статистически данни, получаваме стойности, които са само до известна степен близки до оценените параметри. Почти винаги има някаква разлика между параметрите и статистиката и обикновено не можем да кажем колко голяма е тази разлика. Теоретично, колкото по-голяма е извадката, толкова по-близки са оценените параметри до техните характеристики на извадката. Това обаче не означава, че чрез увеличаване на размера на извадката неизбежно ще се доближим до оценения параметър, ще намалим разликата между него и изчислената статистика. На практика нещата могат да се окажат много по-сложни.

Ако на теория очакваната стойност на статистиката съвпада с оценения параметър, тогава такава оценка се нарича безпристрастен. Нарича се оценка, при която очакваната стойност на оценявания параметър се различава от самия параметър с някаква сума разместен.

Също така е необходимо да се прави разлика между точкови и интервални оценки на параметрите на разпределението. пунктиран наречена оценка, използваща някакво число. Например, ако заявим, че стойността на пространствения праг на тактилна чувствителност за даден субект при определени условия и върху даден участък от кожата е 21,8 mm, тогава такава оценка ще бъде точкова оценка. По подобен начин се получава точкова оценка, когато метеорологичният доклад ни каже, че навън е 25°C. Интервална оценка включва използването на набор или диапазон от числа при оценката. Оценявайки пространствения праг на тактилна чувствителност, можем да кажем, че той се оказа в диапазона от 20 до 25 mm. По същия начин синоптиците могат да съобщят, че според техните прогнози през следващите 24 часа температурата на въздуха ще достигне 22-24°C. Интервалната оценка на случайна променлива ни позволява не само да определим желаната стойност на тази променлива, но и да зададем възможната точност на такава оценка.

Математическо очакване и неговата оценка

Да се ​​върнем към нашия опит с хвърляне на монети.

Нека се опитаме да отговорим на въпроса: колко пъти трябва да падне "орелът", ако хвърлим монета десет пъти? Отговорът изглежда очевиден. Ако вероятностите за всеки от двата резултата са равни, тогава самите резултати трябва да бъдат равномерно разпределени. С други думи, когато една обикновена монета бъде хвърлена десет пъти, ние имаме право да очакваме, че една от нейните страни, например "глави", ще падне точно пет пъти. По същия начин, когато монета бъде хвърлена 100 пъти, главите трябва да изпаднат точно 50 пъти, а ако монета бъде хвърлена 4236 пъти, тогава страната, която ни интересува, трябва да се появи 2118 пъти, нито повече, нито по-малко.

Така че обикновено се нарича теоретичната стойност на случайно събитие математическо очакване. Математическото очакване може да се намери чрез умножаване на теоретичната вероятност за случайна променлива по броя на опитите. По-формално обаче той се определя като централен момент от първи ред. По този начин математическото очакване е стойността на случайна променлива, към която тя теоретично клони по време на повтарящи се тестове, спрямо които варира.

Ясно е, че теоретичната стойност на математическото очакване като параметър на разпределението не винаги е равна на емпиричната стойност на интересуващата ни случайна променлива, изразена в статистиката. Ако направим експеримента с хвърляне на монета, е много вероятно от десет изхода глави да се появят само четири или три пъти, или може би, напротив, да се появят осем пъти, или може би никога . Ясно е, че някои от тези резултати са по-вероятни, други по-малко вероятни. Ако използваме закона за нормалното разпределение, можем да заключим, че колкото повече резултатът се отклонява от теоретично очакваното, дадено от стойността на математическото очакване, толкова по-малко вероятно е това на практика.

Да предположим освен това, че сме извършили тази процедура няколко пъти и никога не сме наблюдавали теоретично очакваната стойност. Тогава може да имаме съмнения относно автентичността на монетата. Можем да предположим, че нашата монета всъщност няма 50% шанс да излезе на глави. В този случай може да се наложи да се оцени вероятността от това събитие и съответно стойността на математическото очакване. Такава необходимост възниква винаги, когато в експеримент изследваме разпределението на непрекъсната случайна променлива, като например време за реакция, без да имаме някакъв теоретичен модел предварително. По правило това е първата задължителна стъпка в хода на количествената обработка на резултатите от експеримента.

Математическото очакване може да бъде оценено по три начина, които на практика може да дадат малко по-различни резултати, но на теория със сигурност трябва да ни доведат до стойността на математическото очакване.

Логиката на такава оценка е илюстрирана на фиг. 1.2. Математическото очакване може да се разглежда като централна тенденция в разпределението на случайна променлива Х, като най-вероятната и следователно най-честата му стойност и като точка, разделяща разпределението на две равни части.

Ориз. 1.2.

Нека продължим нашите въображаеми експерименти с монета и проведем три експеримента с десет пъти хвърляне на монета. Да приемем, че в първия опит "орелът" е изпаднал четири пъти, същото се е случило и във втория опит, в третия опит "орелът" е изпадал повече от един път и половина по-често - седем пъти. Логично е да предположим, че математическото очакване на интересуващото ни събитие всъщност се намира някъде между тези стойности.

Първо, протозойни метод на оценка математическото очакване ще се състои в намирането средноаритметично. Тогава оценката на очакваната стойност въз основа на горните три измервания ще бъде (4 + 4 + 7) / 3 = 5. По същия начин, при експерименти с време за реакция, очакваната стойност може да бъде оценена чрез изчисляване на средната аритметична стойност на всички получени стойности Х. Така че, ако сме похарчили П измерване на времето за реакция Х, тогава можем да използваме следната формула, която ни показва това, за да изчислим средноаритметичното х е необходимо да се сумират всички емпирично получени стойности и да се разделят на броя на наблюденията:

Във формула (1.2) мярката на математическото очакване обикновено се означава като ̅ х (чете се като "x с линия"), въпреки че понякога може да се обозначи като М (от английски. означава - средно аритметично).

Средната аритметична стойност е най-често използваната оценка на математическото очакване. В такива случаи се приема, че измерването на случайна променлива се извършва в показател мащаб. Ясно е, че полученият резултат може или не може да съвпадне с истинската стойност на математическото очакване, което никога не знаем. Важно е обаче, че този метод е безпристрастен оценка на математическото очакване. Това означава, че очакваната стойност на прогнозната стойност е равна на нейното математическо очакване: .

Вторият метод на оценка Математическото очакване е да се приеме най-често срещаната стойност на променливата, която ни интересува, като нейна стойност. Тази стойност се нарича мода на разпространение. Например, в току-що разгледания случай с хвърлянето на монета, "четири" може да се приеме като стойност на математическото очакване, тъй като в трите проведени опита тази стойност се появява два пъти; ето защо режимът на разпределение в този случай се оказа равен на четири. Оценката на режима се използва главно когато експериментаторът работи с променливи, които приемат дискретни стойности, дадени в неметрични мащаб.

Например, като се опише разпределението на оценките на студентите на изпит, може да се конструира честотното разпределение на оценките на студентите. Това честотно разпределение се нарича хистограма. В този случай най-често срещаната оценка може да се приеме като стойност на централната тенденция (математическо очакване). При изследването на променливи, характеризиращи се с непрекъснати стойности, тази мярка практически не се използва или се използва рядко. Ако въпреки това е конструирано честотното разпределение на получените резултати, то по правило не се отнася до стойностите на изследваната черта, получена в експеримента, а до някои интервали от нейното проявление. Например, когато изследвате височината на хората, можете да видите колко хора попадат в интервала до 150 см височина, колко попадат в интервала от 150 до 155 см и т.н. В този случай режимът ще бъде свързан с интервалните стойности на изследваната черта, в този случай растеж.

Ясно е, че модата, както и средноаритметичното, може да съвпада или да не съвпада с действителната стойност на математическото очакване. Но също като средната аритметична стойност, модата е безпристрастна оценка на математическото очакване.

Добавяме, че ако две стойности в извадката се срещат еднакво често, тогава се извиква такова разпределение бимодален. Ако три или повече стойности в пробата се срещат еднакво често, тогава се казва, че такава проба няма режим. Такива случаи с достатъчно голям брой наблюдения, като правило, показват, че данните са извлечени от общата съвкупност, естеството на разпределението в което се различава от нормалното.

накрая трети метод за оценка Математическото очакване е да разделим извадката от субекти според интересуващия ни параметър точно наполовина. Стойността, характеризираща тази граница, се нарича Медиана разпространение.

Да предположим, че присъстваме на състезание по ски и след приключването им искаме да оценим кой от спортистите е показал резултат над средния и кой - по-долу. Ако съставът на участниците е повече или по-малко равен, тогава при оценката на средния резултат е логично да се изчисли средноаритметичното. Да предположим обаче, че сред професионалните участници има и няколко аматьори. Те не са много, но показват резултати, които значително отстъпват на останалите. В този случай може да се окаже, че от 100 участници в състезанието, например, 87 са показали резултат над средния.Ясно е, че такава оценка на средната тенденция не винаги може да ни устройва. В този случай е логично да се предположи, че средният резултат е показан от участници, които са заели някъде на 50-то или 51-во място. Това ще бъде медианата на разпределението. 49 участници финишираха преди 50-ия финалист, а 49 след 51-ия. Разбира се, може да се окаже, че са завършили с еднакво време. Тогава няма проблем. Няма проблем дори когато броят на наблюденията е нечетен. В други случаи обаче можете да използвате осредняването на резултатите на двамата участници.

Медианата е специален случай на квантила на разпределението. квантил е част от разпределението. Формално може да се определи като интегрална стойност на разпределението между две стойности на променливата х. По този начин стойността х ще бъде медианата на разпределението, ако интегралната стойност на разпределението (плътността на вероятността) е от -∞ до х е равно на интегралната стойност на разпределението от х до +∞. По същия начин разпределението може да бъде разделено на четири, десет или 100 части. Такива квантили се наричат ​​съответно квартили, децили И процентили. Има и други видове квантили.

Точно както предишните два метода за оценка на математическото очакване, медианата е безпристрастна оценка на математическото очакване.

Теоретично се приема, че ако наистина имаме работа с нормално разпределение на случайна променлива, тогава и трите оценки на математическото очакване трябва да дадат един и същ резултат, тъй като всички те представляват вариант безпристрастен оценки на същия параметър на разпределение на оценената случайна променлива (виж Фиг. 1.2). На практика обаче това рядко е така. Това може да се дължи по-специално на факта, че анализираното разпределение се различава от нормалното. Но основната причина за такива несъответствия, като правило, е, че чрез оценка на стойността на математическото очакване може да се получи стойност, която е много различна от истинската му стойност. Въпреки това, както беше отбелязано по-горе, в математическата статистика е доказано, че колкото по-независими тестове на разглежданата променлива се извършват, толкова по-близо трябва да бъде изчислената стойност до истинската стойност.

Така на практика изборът на метод за оценка на математическото очакване се определя не от желанието да се получи по-точна и надеждна оценка на този параметър, а само от съображения за удобство. Също така определена роля при избора на метод за оценка на математическото очакване играе измервателната скала, която отразява наблюденията на оценената случайна променлива.

Нека случайна променлива с неизвестно математическо очакване и дисперсия бъде подложена на независими експерименти, които дават резултати - . Нека изчислим последователни и безпристрастни оценки за параметрите и .

Като оценка за математическото очакване вземаме средноаритметичната стойност на експерименталните стойности

. (2.9.1)

Според закона за големите числа тази оценка е богат , с величина във вероятност. Същата оценка е безпристрастен , тъй като

. (2.9.2)

Дисперсията на тази оценка е

. (2.9.3)

Може да се покаже, че за нормално разпределение тази оценка е ефикасен . За други закони това може да не е така.

Нека сега оценим дисперсията. Нека първо изберем формула за оценка статистическа дисперсия

. (2.9.4)

Нека проверим последователността на оценката на дисперсията. Нека отворим скобите във формулата (2.9.4)

.

За , първият член се сближава по вероятност с количеството , във втория - до . Така нашата оценка се сближава по вероятност с дисперсията

,

следователно тя е богат .

Да проверим безпристрастност прогнози за количеството. За да направим това, заместваме израза (2.9.1) във формула (2.9.4) и вземаме предвид, че случайните променливи независима

,

. (2.9.5)

Нека във формула (2.9.5) преминем към флуктуациите на случайни променливи

Разширявайки скобите, получаваме

,

. (2.9.6)

Нека изчислим математическото очакване на стойността (2.9.6), като вземем предвид това

. (2.9.7)

Съотношението (2.9.7) показва, че стойността, изчислена по формула (2.9.4) не е безпристрастен оценител за дисперсия. Неговото математическо очакване не е равно, а малко по-малко. Такава оценка води до низходяща систематична грешка. За да се елиминира такова отклонение, е необходимо да се въведе корекция, като се умножи не стойността. Тогава такава коригирана статистическа дисперсия може да служи като безпристрастна оценка за дисперсията

. (2.9.8)

Тази оценка е също толкова последователна, колкото оценката, тъй като за.

На практика, вместо оценка (2.9.8), понякога е по-удобно да се използва еквивалентна оценка, свързана с втория начален статистически момент

. (2.9.9)

Оценките (2.9.8), (2.9.9) не са ефективни. Може да се покаже, че в случай на нормално разпределение те ще бъдат асимптотично ефективна (когато ще клони към минималната възможна стойност).

Така е възможно да се формулират следните правила за обработка на ограничен статистически материал. Ако при независими експерименти случайната променлива приема стойностите с неизвестно математическо очакване и дисперсия, тогава за определяне на тези параметри трябва да се използват приблизителни оценки

(2.9.10)

Край на работата -

Тази тема принадлежи на:

Бележки от лекции по математика, теория на вероятностите, математическа статистика

Катедра Висша математика и информатика.. записки от лекции.. по математика..

Ако имате нужда от допълнителен материал по тази тема или не сте намерили това, което търсите, препоръчваме да използвате търсенето в нашата база данни с произведения:

Какво ще правим с получения материал:

Ако този материал се оказа полезен за вас, можете да го запазите на страницата си в социалните мрежи:

Всички теми в този раздел:

Теория на вероятностите
Теорията на вероятностите е клон на математиката, който изучава моделите на случайни масови явления. Случайността е явление, което

Статистическа дефиниция на вероятността
Събитието е случайно явление, което в резултат на опит може да се появи или да не се появи (двузначно явление). Обозначавайте събитията с главни латински букви

Пространство на елементарни събития
Нека набор от събития е свързан с някакъв опит и: 1) като резултат от опита, едно и само едно

Действия върху събития
Сумата от две събития и

Пермутации
Означен е броят на различните пермутации на елементи

Настаняване
Поставяне на елементи от

Комбинации
Комбинация от елементи

Формулата за добавяне на вероятности за несъвместими събития
Теорема. Вероятността за сумата от две несъвместими събития е равна на сумата от вероятностите за тези събития. (1

Формула за добавяне на вероятности за произволни събития
Теорема. Вероятността за сумата от две събития е равна на сумата от вероятностите за тези събития без вероятността за техния продукт.

Формула за умножение на вероятностите
Нека са дадени две събития. Помислете за събитие

Формула за пълна вероятност
Нека е пълна група от несъвместими събития, те се наричат ​​хипотези. Помислете за някакво събитие

Формула на вероятностите на хипотези (Байес)
Помислете отново - пълната група от несъвместими хипотези и събитието

Асимптотична формула на Поасон
В случаите, когато броят на опитите е голям и вероятността за настъпване на събитие

Случайни дискретни променливи
Случайна стойност е величина, която при повторение на експеримента може да приеме неравни числени стойности. Случайната променлива се нарича дискретна,

Случайни непрекъснати променливи
Ако в резултат на експеримент случайна променлива може да приеме произволна стойност от определен сегмент или цялата реална ос, тогава тя се нарича непрекъсната. закон

Функция на плътността на вероятността на случайна непрекъсната променлива
Нека бъде. Помислете за точка и я увеличете

Числени характеристики на случайни величини
Случайните дискретни или непрекъснати променливи се считат за напълно определени, ако законите им за разпределение са известни. Наистина, знаейки законите на разпределението, човек винаги може да изчисли вероятността за попадение

Квантили на случайни променливи
Квантил от порядъка на случайна непрекъсната променлива

Математическо очакване на случайни променливи
Математическото очакване на случайна величина характеризира нейната средна стойност. Всички стойности на случайната променлива са групирани около тази стойност. Помислете първо за случайна дискретна променлива

Стандартно отклонение и дисперсия на случайни променливи
Помислете първо за случайна дискретна променлива. Числени характеристики на мода, медиана, квантили и математическо очакване

Моменти на случайни променливи
В допълнение към математическото очакване и дисперсията теорията на вероятностите използва числени характеристики от по-високи порядъци, които се наричат ​​моменти на случайни променливи.

Теореми за числови характеристики на случайни величини
Теорема 1. Математическото очакване на неслучайна променлива е равно на самата тази стойност. Доказателство: Нека

Биномен закон на разпределение

Закон за разпределение на Поасон
Нека произволна дискретна променлива приема стойностите

Закон за равномерно разпределение
Равномерният закон за разпределение на случайна непрекъсната променлива е законът на функцията за плътност на вероятността, който

Закон за нормалното разпределение
Нормалният закон за разпределение на случайна непрекъсната променлива е законът на функцията на плътността

Експоненциален закон за разпределение
Експоненциалното или експоненциалното разпределение на случайна променлива се използва в такива приложения на теорията на вероятностите като теория на опашката, теория на надеждността

Системи от случайни величини
На практика в приложенията на теорията на вероятностите често се налага да се справяме със задачи, при които резултатите от даден експеримент се описват не от една случайна променлива, а от няколко случайни променливи наведнъж.

Система от две случайни дискретни променливи
Нека две случайни дискретни променливи образуват система. Случайна стойност

Система от две случайни непрекъснати променливи
Сега нека системата се образува от две случайни непрекъснати променливи. Законът за разпределение на тази система се нарича вероятно

Условни закони на разпределение
Нека и зависими случайни непрекъснати променливи

Числени характеристики на система от две случайни величини
Началният момент на реда на системата от случайни величини

Система от няколко случайни променливи
Резултатите, получени за система от две случайни променливи, могат да бъдат обобщени за случая на системи, състоящи се от произволен брой случайни променливи. Нека системата се образува от множеството

Нормално разпределение на система от две случайни променливи
Да разгледаме система от две случайни непрекъснати променливи. Законът за разпределение на тази система е нормалният закон за разпределение

Пределни теореми на теорията на вероятностите
Основната цел на дисциплината теория на вероятностите е да изучава моделите на случайни масови явления. Практиката показва, че наблюдението на маса от еднородни случайни явления разкрива

Неравенството на Чебишев
Помислете за случайна променлива с математическо очакване

Теорема на Чебишев
Ако случайните променливи са по двойки независими и имат крайни дисперсии, ограничени в популацията

Теорема на Бернули
С неограничено увеличаване на броя на експериментите, честотата на възникване на събитие се сближава по вероятност с вероятността на събитие

Централна гранична теорема
При добавяне на случайни променливи с каквито и да е закони на разпределение, но с отклонения, ограничени в съвкупността, законът на разпределение

Основни задачи на математическата статистика
Законите на теорията на вероятностите, обсъдени по-горе, са математически израз на реални модели, които действително съществуват в различни случайни масови явления. изучаване

Проста статистика. Статистическа функция на разпределение
Помислете за някаква случайна променлива, чийто закон на разпределение е неизвестен. Изисква се въз основа на опит

Статистическа линия. стълбовидна диаграма
При голям брой наблюдения (от порядъка на стотици) генералната съвкупност става неудобна и тромава за записване на статистически материали. За прегледност и компактност, статистически материал

Числени характеристики на статистическото разпределение
В теорията на вероятностите бяха разгледани различни числени характеристики на случайни променливи: математическо очакване, дисперсия, начални и централни моменти от различен порядък. Подобни числа

Избор на теоретично разпределение по метода на моментите
Във всяко статистическо разпределение неизбежно има елементи на случайност, свързани с ограничения брой наблюдения. С голям брой наблюдения тези елементи на случайност се изглаждат,

Проверка на правдоподобността на хипотезата за формата на закона за разпределение
Нека даденото статистическо разпределение се апроксимира с някаква теоретична крива или

Критерии за съгласие
Помислете за един от най-често използваните тестове за добро съответствие, така нареченият тест на Pearson. Предположете

Точкови оценки за неизвестни параметри на разпределение
В п.п. 2.1. - 2.7 разгледахме подробно начините за решаване на първата и втората основни задачи на математическата статистика. Това са задачите за определяне на законите на разпределение на случайни величини според експериментални данни

Доверителен интервал. Вероятност за доверие
На практика, с малък брой експерименти върху случайна променлива, приблизителна замяна на неизвестен параметър

Нека произволната извадка се генерира от наблюдаваната случайна променлива ξ, математическото очакване и дисперсията които са неизвестни. Като оценки за тези характеристики беше предложено да се използва средната стойност на извадката

и дисперсия на извадката

. (3.14)

Нека разгледаме някои свойства на оценките на математическото очакване и дисперсията.

1. Изчислете математическото очакване на средната стойност на извадката:

Следователно средната стойност на извадката е безпристрастен оценител за .

2. Припомнете си, че резултатите наблюденията са независими случайни променливи, всяка от които има същия закон на разпределение като стойността, което означава, че , , . Ще приемем, че дисперсията е крайна. Тогава, съгласно теоремата на Чебишев за закона за големите числа, за всяко ε > 0 имаме равенството ,

което може да се напише така: . (3.16) Сравнявайки (3.16) с дефиницията на свойството за последователност (3.11), виждаме, че оценката е последователна оценка на очакването.

3. Намерете дисперсията на средната стойност на извадката:

. (3.17)

По този начин дисперсията на очакваната оценка намалява обратно пропорционално на размера на извадката.

Може да се докаже, че ако случайната променлива ξ е нормално разпределена, тогава средната стойност на извадката е ефективна оценка на очакваната стойност, т.е. дисперсията приема най-малката стойност в сравнение с всяка друга оценка на очакваната стойност. За други закони за разпределение на ξ това може да не е така.

Дисперсията на извадката е пристрастна оценка на дисперсията, тъй като . (3.18)

Наистина, използвайки свойствата на математическото очакване и формулата (3.17), намираме

.

За да се получи безпристрастна оценка на дисперсията, оценката (3.14) трябва да бъде коригирана, тоест умножена по . Тогава получаваме дисперсията на безпристрастната извадка

. (3.19)

Имайте предвид, че формулите (3.14) и (3.19) се различават само в знаменателя, а за големи стойности извадката и безпристрастните дисперсии се различават малко. За малък размер на извадката обаче трябва да се използва съотношението (3.19).

За оценка на стандартното отклонение на случайна променлива се използва така нареченото „коригирано“ стандартно отклонение, което е равно на корен квадратен от безпристрастната дисперсия: .

Интервални оценки

В статистиката има два подхода за оценка на неизвестни параметри на разпределенията: точков и интервален. В съответствие с точковата оценка, която беше обсъдена в предишния раздел, се посочва само точката, близо до която се намира оцененият параметър. Въпреки това е желателно да се знае колко далеч този параметър може действително да стои от възможното прилагане на оценки в различни серии от наблюдения.

Отговорът на този въпрос - също приблизителен - дава друг начин за оценка на параметрите - интервал. В съответствие с този метод на оценка се открива интервал, който с вероятност, близка до единица, покрива неизвестна числена стойност на параметъра.

Концепцията за интервална оценка

Точкова оценка е случайна променлива и за възможни реализации на извадката приема стойности само приблизително равни на истинската стойност на параметъра. Колкото по-малка е разликата, толкова по-точна е оценката. По този начин, положително число, за което , характеризира точността на оценката и се нарича грешка в оценката (или пределна грешка).

Вероятност за увереност(или надеждност)се нарича вероятност β , с което неравенството , т.е.

. (3.20)

Замяна на неравенството неговото еквивалентно двойно неравенство , или , получаваме

Интервал покриване с вероятност β , , неизвестен параметър , се извиква доверителен интервал (или интервална оценка),съответстващи на нивото на доверие β .

Случайната променлива е не само оценка, но и грешка: нейната стойност зависи от вероятността β и като правило от пробата. Следователно доверителният интервал е случаен и изразът (3.21) трябва да се чете, както следва: „Интервалът ще покрие параметъра с вероятността β “, а не така: „Параметърът ще попадне в интервала с вероятност β ”.

Значението на доверителния интервал е, че при многократно повторение на обема на пробата в относителната част на случаите, равна на β , доверителен интервал, съответстващ на нивото на достоверност β , покрива истинската стойност на оценения параметър. Така че нивото на увереност β характеризира надеждностоценка на доверието: колкото повече β , толкова по-вероятно е изпълнението на доверителния интервал да съдържа неизвестен параметър.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 "kingad.ru" - ултразвуково изследване на човешки органи