Оцінювання математичного очікування випадкової величини. Точкові оцінки математичного очікування

Нехай є випадкова величина Хз математичним очікуванням mта дисперсією D, при цьому обидва ці параметри невідомі. Над величиною Хзроблено Nнезалежних експериментів, в результаті яких було отримано сукупність Nчисельних результатів x 1 , x 2 , …, x N. В якості оцінки математичного очікування природно запропонувати середнє арифметичне значень, що спостерігаються.

(1)

Тут як x iрозглядаються конкретні значення (числа), отримані в результаті Nекспериментів. Якщо взяти інші (незалежні від попередніх) Nекспериментів, то, очевидно, ми отримаємо інше значення. Якщо взяти ще Nекспериментів, ми отримаємо ще одне нове значення . Позначимо через X iвипадкову величину, що є результатом i-го експерименту, тоді реалізаціями X iбудуть числа, одержані в результаті цих експериментів. Очевидно, що випадкова величина X iматиме таку ж щільність розподілу ймовірності, як і вихідна випадкова величина Х. Також вважаємо, що випадкові величини X iі X jє незалежними при i, не рівному j(Різні незалежні один щодо одного експерименти). Тому формулу (1) перепишемо в іншому (статистичному) вигляді:

(2)

Покажемо, що оцінка є незміщеною:

Таким чином, математичне очікування вибіркового середнього дорівнює справжньому математичному очікуванню випадкової величини m. Це досить передбачуваний та зрозумілий факт. Отже, за оцінку математичного очікування випадкової величини можна прийняти середнє вибіркове (2). Тепер виникає питання: що відбувається з дисперсією оцінки математичного очікування зі збільшенням кількості експериментів? Аналітичні обчислення показують, що

де - дисперсія оцінки математичного очікування (2), а D- Справжня дисперсія випадкової величини X.

Зі сказаного вище, що зі зростанням N(кількості експериментів) дисперсія оцінки зменшується, тобто. що більше ми підсумовуємо незалежні реалізації, то ближче до математичного очікування ми отримаємо оцінку.


Оцінки математичної дисперсії

На перший погляд найбільш природною оцінкою є

(3)

де обчислюється за такою формулою (2). Перевіримо, чи є оцінка незміщеною. Формула (3) може бути записана наступним чином:

Підставимо у цю формулу вираз (2):

Знайдемо математичне очікування оцінки дисперсії:

(4)

Оскільки дисперсія випадкової величини залежить від цього, яке математичне очікування у випадкової величини, приймемо математичне очікування рівним 0, тобто. m = 0.

(5)
при .(6)

Нехай є випадкова величина X, та її параметри математичне очікування ата дисперсія невідомі. Над величиною X вироблено незалежних дослідів, що дали результати x 1, x 2, x n .

Не зменшуючи спільності міркувань, вважатимемо ці значення випадкової величини різними. Розглянемо значення x 1, x 2, x n як незалежні, однаково розподілені випадкові величини X 1, X 2, X n .

Найпростіший метод статистичного оцінювання - метод підстановки та аналогії - у тому, що як оцінки тієї чи іншої числової характеристики (середнього, дисперсії та інших.) генеральної сукупності беруть відповідну характеристику розподілу вибірки - вибіркову характеристику.

За методом підстановки як оцінка математичного очікування атреба взяти математичне очікування розподілу вибірки – вибіркове середнє. Таким чином, отримуємо

Щоб перевірити незміщеність та спроможність вибіркового середнього як оцінки аРозглянемо цю статистику як функцію вибраного вектора (X 1, X 2, X n). Взявши до уваги, що кожна з величин X 1, X 2, X n має той же закон розподілу, що і величина X, укладаємо, що числові характеристики цих величин і величини X однакові: M(X i) = M(X) = a, D(X i) = D(X) = , i = 1, 2, n , причому X i - незалежні разом випадкові величини.

Отже,

Звідси за визначенням отримуємо, що – незміщена оцінка а, і оскільки D()®0 при n®¥, то через теорему попереднього параграфа є заможною оцінкою математичного очікування агенеральної сукупності.

Ефективність або неефективність оцінки залежить від виду закону розподілу випадкової величини X. Можна довести, що якщо величина X розподілена за нормальним законом, то оцінка є ефективною. Для інших законів розподілу це може бути негаразд.

Незміщеною оцінкою генеральної дисперсіїслужить виправлена ​​вибіркова дисперсія

,

Оскільки , де – генеральна дисперсія. Справді,

Оцінка s - 2 для генеральної дисперсії є також і заможною, але не є ефективною. Однак у разі нормального розподілу вона є «асимптотично ефективною», тобто зі збільшенням n відношення її дисперсії до мінімально можливої ​​необмежено наближається до одиниці.

Отже, якщо дана вибірка із розподілу F( x) випадкової величини X з невідомим математичним очікуванням аі дисперсією , то обчислення значень цих параметрів маємо право користуватися наступними наближеними формулами:

a ,

.

Тут x-i - - варіанти вибірки, n- i - - частота варіанти x i , - - Обсяг вибірки.
Для обчислення виправленої вибіркової дисперсії зручніша формула


.

Для спрощення розрахунку доцільно перейти до умовних варіантів (В якості вигідно брати початкову варіанту, розташовану в середині інтервального варіаційного ряду). Тоді

, .

Інтервальне оцінювання

Вище ми розглянули питання оцінки невідомого параметра аодним числом. Такі оцінки ми назвали точковими. Вони мають той недолік, що при малому обсязі вибірки можуть значно відрізнятися від параметрів, що оцінюються. Тому, щоб отримати уявлення про близькість між параметром та його оцінкою, в математичній статистиці вводяться так звані інтервальні оцінки.

Нехай у вибірці для параметра q виявлено точкову оцінку q * . Зазвичай дослідники заздалегідь задаються деякою досить великою ймовірністю g (наприклад, 0,95; 0,99 або 0,999) такою, що подію з ймовірністю g можна вважати практично достовірною, і порушують питання про відшукання такого значення e > 0, для якого

.

Видозмінивши цю рівність, отримаємо:

і будемо у разі говорити, що інтервал ]q * - e; q * + e[ покриває оцінюваний параметр q з ймовірністю g.

Інтервал] q * -e; q * +e [ називається довірчим інтервалом .

Імовірність g називається надійністю (довірчою ймовірністю) інтервальної оцінки.

Кінці довірчого інтервалу, тобто. точки q*-e та q*+e називаються довірчими кордонами .

Число e називається точністю оцінки .

Як приклад завдання визначення довірчих кордонів, розглянемо питання оцінці математичного очікування випадкової величини Х, має нормальний закон розподілу з параметрами ата s, тобто. Х = N ( a, s). Математичне очікування в цьому випадку одно а. За спостереженнями Х 1 Х 2 Х n обчислимо середнє та оцінку дисперсії s 2 .

Виявляється, що за даними вибірки можна побудувати випадкову величину

яка має розподіл Стьюдента (або t-розподіл) з n = n -1 ступенями свободи.

Скористаємося таблицею П.1.3 і знайдемо для заданих ймовірності g та числа n число t g таке, при якому ймовірність

P(|t(n)|< t g) = g,

.

Зробивши очевидні перетворення отримаємо,

Порядок застосування F-критерію наступний:

1. Приймається припущення щодо нормальності розподілу генеральних сукупностей. При заданому рівні значущості a формулюється нульова гіпотеза Н 0: s х 2 = s y 2 про рівність генеральних дисперсій нормальних сукупностей за конкуруючої гіпотези Н 1: s х 2 > s y 2 .

2. Отримують дві незалежні вибірки із сукупностей Х та Y обсягом n x і n y відповідно.

3. Розраховують значення виправлених вибіркових дисперсій s х 2 і s y 2 (методи розрахунку розглянуті у §13.4). Велику дисперсій (s х 2 або s y 2) позначають s 1 2 , меншу - s 2 2 .

4. Обчислюється значення F-критерію за формулою F набл = s12/s22.

5. За таблицею критичних точок розподілу Фішера - Снедекору, за заданим рівнем значимості a і числом ступенів свободи n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 - число ступенів свободи більшої виправленої дисперсії), знаходиться критична точка F кр (a, n 1, n 2).

Зазначимо, що у таблиці П.1.7 наведено критичні значення одностороннього F-критерію. Тому, якщо застосовується двосторонній критерій (Н 1: s х 2 ? свободи n 1 і n 2 (n 1 – число ступенів свободи більшої дисперсії). Лівосторонню критичну точку можна і шукати.

6. Робиться висновок: якщо обчислене значення F-критерію більше або дорівнює критичному (F набл ³ F кр), то дисперсії різняться значуще на заданому рівні значущості. В іншому випадку (F набл< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Завдання 15.1. Витрата сировини на одиницю продукції за старою технологією склав:

За новою технологією:

Припустивши, що відповідні генеральні сукупності X і Y мають нормальні розподіли, перевірити, що з варіативності витрати сировини за новими і старими технологіями не відрізняються, якщо прийняти рівень значимості a = 0,1.

Рішення. Діємо у порядку, зазначеному вище.

1. Судитимемо про варіативність витрати сировини за новою та старою технологіями за величинами дисперсій. Таким чином, нульова гіпотеза має вигляд Н0: sх2=sy2. Як конкуруючу приймемо гіпотезу Н 1 : s х 2 ¹ s y 2 , оскільки заздалегідь не впевнені в тому, що якась із генеральних дисперсій більша за іншу.

2-3. Знайдемо вибіркові дисперсії. Для спрощення обчислень перейдемо до умовних варіантів:

u i = x i - 307, v i = y i - 304.

Усі обчислення оформимо у вигляді наступних таблиць:

u i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (vi +1) 2
-3 -3 -1 -2
å -
å -

Контроль: m i u i 2 + 2 m i u i + m i = Контроль: n i v i 2 + 2 n i v i + ni = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Знайдемо виправлені вибіркові дисперсії:

4. Порівняємо дисперсії. Знайдемо відношення більшої виправленої дисперсії до меншої:

.

5. За умовою конкуруюча гіпотеза має вигляд s х 2 ¹ s y 2 , тому критична область двостороння і за знайденні критичної точки слід брати рівні значимості, удвічі менше заданого.

За таблицею П.1.7 за рівнем значущості a/2 = 0,1/2 = 0,05 та числам ступенів свободи n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 знаходимо критичну точку F кр ( 0,05; 12; 8) = 3,28.

6. Оскільки F набл.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Вище під час перевірки гіпотез передбачалося нормальність розподілу досліджуваних випадкових величин. Однак спеціальні дослідження показали, що запропоновані алгоритми дуже стійкі (особливо при великих обсягах вибірок) стосовно відхилення від нормального розподілу.

Параметри розподілу та статистика

Будь-які параметри розподілу випадкової змінної, наприклад, такі як математичне очікування або дисперсія, є теоретичними величинами, недоступними безпосередньому виміру, хоча їх можна оцінити. Вони є кількісною характеристикою генеральної сукупності і може бути власними силами визначено лише під час теоретичного моделювання як гіпотетичні величини, оскільки вони описують особливості розподілу випадкової величини у самої генеральної сукупності. Для того щоб визначити їх на практиці, дослідник, який проводить експеримент, здійснює їхню вибіркову оцінку. Така оцінка передбачає статистичний підрахунок.

Статистика є кількісною характеристикою досліджуваних параметрів, що характеризують розподіл випадкової величини, отриману на основі дослідження вибіркових значень. Статистика використовується або для опису самої вибірки, або, що має першорядне значення в фундаментальних експериментальних дослідженнях, для оцінки параметрів розподілу випадкової величини досліджуваної генеральної сукупності.

Поділ понять "параметр" і "статистика" є дуже важливим, тому що воно дозволяє уникнути ряд помилок, пов'язаних з неправильним тлумаченням даних, які отримуються в експерименті. Справа в тому, що, коли ми оцінюємо параметри розподілу за допомогою статистичних даних, ми отримуємо величини, лише певною мірою близькі до параметрів, що оцінюються. Між параметрами та статистикою практично завжди існує якась відмінність, причому, наскільки велика ця відмінність, ми, як правило, сказати не можемо. Теоретично чим більше вибірка, тим ближче оцінювані параметри виявляються їх вибірковим характеристикам. Однак це не означає, що, збільшивши обсяг вибірки, ми неминуче ближче підійдемо до параметра, що оцінюється, зменшимо різницю між ним і обчисленою статистикою. На практиці все може виявитися значно складнішим.

Якщо в теорії очікуване значення статистики збігається з параметром, що оцінюється, то таку оцінку називають незміщеною. Оцінку, при якій очікуване значення параметра, що оцінюється, відрізняється від самого параметра на деяку величину, називають зміщеною.

Також слід розрізняти точкову та інтервальну оцінку параметрів розподілу. Точковий називають оцінку за допомогою якогось числа. Наприклад, якщо ми стверджуємо, що величина просторового порога тактильної чутливості для даного випробуваного в цих умовах і на даній ділянці шкіри становить 21,8 мм, така оцінка буде точковою. Так само точкова оцінка має місце, коли у зведенні погоди нам повідомляють, що за вікном 25°С. Інтервальна оцінка передбачає використання в оцінці набору чи діапазону чисел. Оцінюючи просторовий поріг тактильної чутливості, ми можемо сказати, що він опинився в діапазоні від 20 до 25 мм. Аналогічно синоптики можуть повідомити, що за їх прогнозами температура повітря в найближчу добу досягне значення 22–24°С. Інтервальна оцінка випадкової величини дозволяє нам не тільки визначити потрібне значення цієї величини, але й задати можливу точність для такої оцінки.

Математичне очікування та його оцінка

Повернімося до нашого досвіду із підкиданням монети.

Спробуємо відповісти на запитання: скільки разів має випасти орел, якщо ми підкинемо монету десять разів? Відповідь, мабуть, очевидна. Якщо ймовірності кожного з двох результатів рівні, то й самі результати повинні розподілятися і. Іншими словами, при десятикратному підкиданні звичайної монети ми маємо право очікувати, що одна з її сторін, наприклад "орел", випаде рівно п'ять разів. Аналогічно при 100-кратному киданні монети "орел" повинен випасти рівно 50 разів, а якщо монету кинути 4236 разів, то сторона, що цікавить нас, повинна з'явитися 2118 разів, не більше і не менше.

Отже, теоретичне значення випадкової події прийнято називати математичним очікуванням. Математичне очікування може бути знайдено шляхом множення теоретичної ймовірності випадкової величини число випробувань. Більше формально, однак, воно визначається як центральний момент першого порядку. Таким чином, математичне очікування - це значення випадкової величини, до якого воно теоретично прагне при повторних випробуваннях, щодо якого воно варіює.

Ясно, що теоретичне значення математичного очікування як параметра розподілу не завжди виявляється рівним емпіричному значенню випадкової величини, що цікавить нас, вираженої в статистиці. Якщо ми зробимо досвід із підкиданням монети, то цілком імовірно, що з десяти результатів "орел" випаде лише чотири чи три рази, а може, навпаки, він випаде вісім разів, а може, й ніколи не випаде. Зрозуміло, що з цих результатів виявляється більш, якийсь менш ймовірним. Якщо скористатися законом нормального розподілу, можна дійти невтішного висновку, що більше результат відхиляється від теоретично очікуваного, заданого величиною математичного очікування, тим менш ймовірний практично.

Припустимо, що ми проробили подібну процедуру кілька разів і жодного разу не спостерігали теоретично очікуваного значення. Тоді у нас може виникнути сумнів щодо справжності монети. Ми можемо припустити, що для нашої монети ймовірність випадання "орла" насправді не дорівнює 50%. У такому разі може знадобитися оцінити величину ймовірності цієї події та відповідно величину математичного очікування. Така необхідність виникає щоразу, як у експерименті ми досліджуємо розподіл безперервної випадкової величини, як-от час реакції, які мають заздалегідь якоїсь теоретичної моделі. Як правило, це перший обов'язковий крок під час кількісної обробки результатів експерименту.

Математичне очікування можна оцінити трьома способами, які практично можуть дати кілька різні результати, але теоретично вони повинні неодмінно призвести до величині математичного очікування.

Логіку такої оцінки ілюструє рис. 1.2. Математичне очікування може бути розглянуте як центральна тенденція у розподілі випадкової величини х, як найімовірніше і тому найчастіше її значення і як точка, що ділить розподіл на дві рівні частини.

Мал. 1.2.

Продовжимо наші уявні досліди з монетою та проведемо три експерименти з десятикратним її підкиданням. Припустимо, що в першому експерименті "орел" випав чотири рази, те саме сталося і в другому досвіді, у третьому досвіді "орел" випадав більш ніж у півтора рази частіше – сім разів. Логічно припустити, що математичне очікування цікавої для нас події насправді лежить десь між цими величинами.

Перший, найпростіший спосіб оцінки математичного очікування перебуватиме у знаходженні середнього арифметичного. Тоді оцінка математичного очікування на основі наведених вище трьох вимірів дорівнюватиме (4 + 4 + 7)/3 = 5. Аналогічним чином в експериментах з часом реакції математичне очікування може бути оцінено шляхом обчислення середнього арифметичного всіх отриманих значень х. Так, якщо ми провели п вимірів часу реакції х, то можемо скористатися наступною формулою, яка показує нам, що для обчислення середнього арифметичного значення X необхідно скласти всі отримані емпірично величини і розділити їх на число спостережень:

У формулі (1.2) міру математичного очікування прийнято позначати як х (читається як "ікс з рисою"), хоча іноді вона може позначатися як М (Від англ. mean - Середнє).

Середнє арифметичне є найчастіше використовуваною оцінкою математичного очікування. У таких випадках передбачається, що вимірювання випадкової величини здійснюється в метричної шкалою. Очевидно, що отриманий результат може збігатися, а може й не збігатися з справжнім значенням математичного очікування, яке нам ніколи не відоме. Важливо, однак, що такий спосіб є незміщеною оцінкою математичного очікування Це означає, що очікуване значення оцінюваної величини дорівнює її математичному очікуванню: .

Другий спосіб оцінки математичного очікування полягає в тому, щоб за його величину прийняти найбільш часто зустрічається значення змінної, що цікавить нас. Це значення називається модою розподілу. Наприклад, у розглянутому щойно випадку з підкиданням монети за величину математичного очікування можна прийняти "чотири", так як у трьох проведених випробуваннях ця величина з'являлася двічі; саме тому мода розподілу в цьому випадку дорівнювала чотирьом. Оцінка моди застосовується головним чином у тому випадку, коли експериментатор має справу зі змінними, що приймають дискретні значення, задані в неметричної шкалою.

Наприклад, описуючи розподіл оцінок студентів на іспиті, можна побудувати частотний розподіл одержаних студентами оцінок. Такий частотний розподіл називається гістограмою. За величину центральної тенденції (математичного очікування) у разі можна прийняти найбільш поширену оцінку. При дослідженні змінних, що характеризуються безперервними значеннями, цей захід практично не застосовується або застосовується рідко. Якщо ж частотне розподіл отриманих результатів все-таки будується, воно, зазвичай, стосується самих отриманих експериментально значень досліджуваного ознаки, а деяких інтервалів його прояви. Скажімо, досліджуючи зростання людей, можна подивитися, скільки людей потрапляє в інтервал до 150 см на зріст, скільки в інтервал від 150 до 155 см і т.д. У цьому випадку мода матимуть відношення до інтервальних значень досліджуваної ознаки, в даному випадку – зростання.

Зрозуміло, що мода, як і середнє арифметичне, може збігатися, а може й не збігатися із дійсним значенням математичного очікування. Але так само, як і середнє арифметичне, мода є незміщеною оцінкою математичного очікування.

Додамо, що якщо два значення у вибірці зустрічаються однаково часто, то такий розподіл називають бімодальним. Якщо три та більше значень у вибірці зустрічаються однаково часто, то кажуть, що така вибірка не має моди. Такі випадки при досить великій кількості спостережень, як правило, свідчать про те, що дані вилучені з генеральної сукупності, характер розподілу якої відрізняється від нормального.

Зрештою, третій спосіб оцінки математичного очікування полягає в тому, щоб поділити вибірку піддослідних за цікавим для нас параметром рівно навпіл. Величина, що характеризує цей кордон, називається медіаною розподілу.

Припустимо, ми присутні на лижних змаганнях і після закінчення бажаємо оцінити, хто зі спортсменів показав результат вище середнього, а хто – нижче. Якщо склад учасників більш менш рівний, то при оцінці середнього результату логічно обчислити середнє арифметичне. Припустимо, що серед учасників-професіоналів є кілька любителів. Їх небагато, але вони показують результати, які значно поступаються іншим. У цьому випадку може виявитися, що зі 100 учасників змагань, наприклад, результат вищий за середній показали 87. Зрозуміло, що така оцінка середньої тенденції нас нс завжди може влаштувати. У цьому випадку логічно припускати, що середній результат показали учасники, які посіли десь 50-те чи 51-те місце. Це якраз і буде медіаною розподілу. До 50-го фіналіста фінішували 49 учасників, після 51-го – теж 49. Незрозуміло, щоправда, чий же результат із них прийняти за середній. Звичайно, може виявитись, що вони фінішували з однаковим часом. Тоді проблеми не виникає. Не виникає проблеми і тоді, коли кількість спостережень виявляється непарною. В інших випадках, однак, можна скористатися усередненням двох учасників.

Медіана є окремим випадком квантилю розподілу. Квантіль - Це частина розподілу. Формально його можна визначити як інтегральне значення розподілу між двома величинами змінної X. Таким чином, величина X буде медіаною розподілу, якщо інтегральне значення розподілу (щільність ймовірності) від -∞ до X дорівнює інтегральному значенню розподілу від X до +∞. Аналогічно розподіл можна ділити на чотири, десять або 100 частин. Такі кванти відповідно називаються квартилями, децилями і перцентилями. Існують інші види квантилей.

Так само, як і два попередні способи оцінки математичного очікування, медіана є незміщеною оцінкою математичного очікування.

Теоретично передбачається, що якщо ми маємо справу дійсно з нормальним розподілом випадкової величини, то всі три оцінки математичного очікування повинні давати один і той же результат, оскільки всі вони є варіантом незміщеною оцінки того самого параметра розподілу оцінюваної випадкової величини (див. рис. 1.2). Насправді, проте, таке зустрічається рідко. Це може бути пов'язано, зокрема, і з тим, що аналізований розподіл відрізняється від нормального. Але основна причина таких розбіжностей, як правило, полягає в тому, що, оцінюючи величину математичного очікування, можна отримати значення, що дуже відрізняється від його істинної величини. Втім, як уже було зазначено вище, в математичній статистиці доведено, що чим більше незалежних випробувань аналізованої змінної проведено, тим ближче значення, що оцінюється, має виявитися до істинного.

Таким чином, на практиці вибір способу оцінки математичного очікування визначається не прагненням отримати більш точну та надійну оцінку цього параметра, а лише міркуваннями зручності. Також певну роль виборі способу оцінки математичного очікування грає вимірювальна шкала, у якій відбиваються самі спостереження оцінюваної випадкової величини.

Нехай над випадковою величиною з невідомими математичним очікуванням та дисперсією зроблено незалежних дослідів, які дали результати – . Обчислимо заможні та незміщені оцінки для параметрів та .

В якості оцінки для математичного очікування візьмемо середнє арифметичне досвідчених значень

. (2.9.1)

Відповідно до закону великих чисел ця оцінка є заможною , при величині за ймовірністю. Ця ж оцінка є і незміщеною , оскільки

. (2.9.2)

Дисперсія цієї оцінки дорівнює

. (2.9.3)

Можна показати, що для нормального закону розподілу ця оцінка є ефективною . Для інших законів це може бути не так.

Оцінимо тепер дисперсію. Виберемо спочатку для оцінки формулу для статистичної дисперсії

. (2.9.4)

Перевіримо спроможність оцінки дисперсії. Розкриємо дужки у формулі (2.9.4)

.

При першому доданку сходиться ймовірно до величини , друге – до . Таким чином, наша оцінка сходиться по ймовірності до дисперсії.

,

отже, вона є заможною .

Перевіримо незміщеність оцінки для величини. Для цього підставимо у формулу (2.9.4) вираз (2.9.1) та врахуємо, що випадкові величини незалежні

,

. (2.9.5)

Перейдемо у формулі (2.9.5) до флуктуацій випадкових величин

Розкриваючи дужки, отримаємо

,

. (2.9.6)

Обчислимо математичне очікування величини (2.9.6) з огляду на те, що

. (2.9.7)

Співвідношення (2.9.7) показує, що величина обчислена за формулою (2.9.4) не є незміщеною оцінкою для дисперсії. Її математичне очікування не дорівнює, а дещо менше. Така оцінка призводить до систематичної помилки у бік зменшення. Для ліквідації такого усунення потрібно запровадити поправку, помноживши не величину. Тоді така виправлена ​​статистична дисперсія може бути незміщеною оцінкою дисперсії

. (2.9.8)

Ця оцінка є заможною також як і оцінка, оскільки за величина.

На практиці замість оцінки (2.9.8) іноді зручніше застосовувати еквівалентну оцінку, пов'язану з другим початковим статистичним моментом

. (2.9.9)

Оцінки (2.9.8), (2.9.9) є ефективними. Можна показати, що у разі нормального закону розподілу вони будуть асимптотично ефективними (Прі будуть прагнути до мінімально можливого значення).

Таким чином, можна сформулювати такі правила обробки обмеженого обсягу статистичного матеріалу. Якщо у незалежних дослідах випадкова величина набуває значення з невідомими математичним очікуванням та дисперсією, то для визначення цих параметрів слід користуватися наближеними оцінками

(2.9.10)

Кінець роботи -

Ця тема належить розділу:

Конспект лекцій з математики теорія ймовірностей математична статистика

Кафедра вищої математики та інформатики.. конспект лекцій з математики.

Якщо Вам потрібний додатковий матеріал на цю тему, або Ви не знайшли те, що шукали, рекомендуємо скористатися пошуком по нашій базі робіт:

Що робитимемо з отриманим матеріалом:

Якщо цей матеріал виявився корисним для Вас, Ви можете зберегти його на свою сторінку в соціальних мережах:

Всі теми цього розділу:

Теорія ймовірностей
Теорія ймовірностей – розділ математики, у якому вивчаються закономірності випадкових масових явищ. Випадковим називається явище, яке

Статистичне визначення ймовірності
Подія називається випадкове явище, яке в результаті досвіду може з'явитися або не з'явиться (двозначне явище). Позначають події великими латинськими літерами

Простір елементарних подій
Нехай з деяким досвідом пов'язано безліч подій, причому: 1) в результаті досвіду з'являється одна і одна

Дії на подіями
Сумою двох подій та

Перестановки
Число різних перестановок з елементів позначається

Розміщення
Розміщенням з елементів по

Поєднання
Поєднанням з елементів за

Формула складання ймовірностей для несумісних подій
Теорема. Імовірність суми двох несумісних подій дорівнює сумі ймовірностей цих подій. (1

Формула складання ймовірностей для довільних подій
Теорема. Імовірність суми двох подій дорівнює сумі ймовірностей цих подій без ймовірності їхнього твору.

Формула множення ймовірностей
Нехай дані дві події в. Розглянемо подію

Формула повної ймовірності
Нехай повна група несумісних подій, їх називають гіпотезами. Розглянемо деяку подію

Формула ймовірностей гіпотез (Байєса)
Розглянемо знову – повну групу несумісних гіпотез та подію

Асимптотична формула Пуассона
У тих випадках, коли кількість випробувань велика, а ймовірність появи події

Випадкові дискретні величини
Випадковою називається величина, яка при повторенні досвіду може набувати неоднакові числові значення. Випадкова величина називається дискретною,

Випадкові безперервні величини
Якщо в результаті досвіду випадкова величина може набувати будь-якого значення з деякого відрізка або всієї дійсної осі, то вона називається безперервною. Законо

Функція густини ймовірності випадкової безперервної величини
Нехай. Розглянемо крапку і дамо їй прирощення

Числові характеристики випадкових величин
Випадкова дискретна чи безперервна величини вважаються повністю заданими, якщо відомі їхні закони розподілу. Насправді, знаючи закони розподілу, можна завжди обчислити ймовірність попадання

Квантилі випадкових величин
Квантилем порядку випадкової безперервної величини

Математичне очікування випадкових величин
Математичне очікування випадкової величини характеризує її середнє. Усі значення випадкової величини групуються навколо цього значення. Розглянемо спочатку випадкову дискретну величину

Середньоквадратичне відхилення та дисперсія випадкових величин
Розглянемо спочатку випадкову дискретну величину. Числові характеристики мода, медіана, кванти та математичне очікування

Моменти випадкових величин
Крім математичного очікування та дисперсії в теорії ймовірностей використовуються числові характеристики вищих порядків, які називаються моментами випадкових величин.

Теореми про числові характеристики випадкових величин
Теорема 1. Математичне очікування невипадкової величини дорівнює самій цій величині. Доказ: Нехай

Біноміальний закон розподілу

Закон розподілу Пуассона
Нехай випадкова дискретна величина, яка приймає значення

Рівномірний закон розподілу
Рівномірним законом розподілу випадкової безперервної величини називається закон функція щільності ймовірності, якого

Нормальний закон розподілу
Нормальним законом розподілу випадкової безперервної величини називається закон функція щільності

Експоненційний закон розподілу
Експонентний або показовий розподіл випадкової величини застосовується в таких додатках теорії ймовірностей, як теорія масового обслуговування, теорія надійності

Системи випадкових величин
На практиці в додатках теорії ймовірностей часто доводиться стикатися із завданнями, в яких результати експерименту описуються не однією випадковою величиною, а відразу кількома випадковими

Система двох випадкових дискретних величин
Нехай дві випадкові дискретні величини утворюють систему. Випадкова величина

Система двох випадкових безперервних величин
Нехай тепер систему утворюють дві випадкові безперервні величини. Законом розподілу цієї системи називається ймовірно

Умовні закони розподілу
Нехай і залежні випадкові безперервні велич

Числові характеристики системи двох випадкових величин
Початковим моментом порядку системи випадкових величин

Система кількох випадкових величин
Отримані результати для системи їх двох випадкових велич можуть бути узагальнені на випадок систем, що складаються з довільного числа випадкових величин. Нехай система утворена сукупністю

Нормальний закон розподілу системи двох випадкових величин
Розглянемо систему двох випадкових безперервних величин. Законом розподілу цієї системи є нормальний закон розповсюдження

Граничні теореми теорії ймовірностей
Основною метою дисципліни теорія ймовірностей вивчення закономірностей випадкових масових явищ. Практика показує, що спостереження маси однорідних випадкових явищ виявивши

Нерівність Чебишева
Розглянемо випадкову величину з математичним очікуванням

Теорема Чебишева
Якщо випадкові величини попарно незалежні і мають кінцеві обмежені в сукупності дисперсії

Теорема Бернуллі
При необмеженому збільшенні числа дослідів частота появи події сходиться з ймовірністю до ймовірності події

Центральна гранична теорема
При складанні випадкових величин з будь-якими законами розподілу, але з обмеженими в сукупності дисперсіями, закон расп

Основні завдання математичної статистики
Розглянуті вище закони теорії ймовірностей є математичним виразом реальних закономірностей, фактично існуючих у різних випадкових масових явищах. Вивчаючи

Проста статистична сукупність. Статистична функція розподілу
Розглянемо деяку випадкову величину, закон розподілу якої невідомий. Потрібен на підставі досвідчених даних про

Статистичний ряд. Гістограма
При велику кількість спостережень (порядку сотень) генеральна сукупність стає незручною і громіздкою для запису статистичного матеріалу. Для наочності та компактності статистичний матеріал

Числові характеристики статистичного розподілу
Теоретично ймовірностей розглядалися різні числові характеристики випадкових величин: математичне очікування, дисперсію, початкові та центральні моменти різних порядків. Аналогічні числа

Вибір теоретичного розподілу методом моментів
У кожному статистичному розподілі неминуче присутні елементи випадковості, пов'язані з обмеженістю числа спостережень. При великій кількості спостережень ці елементи випадковості згладжуються,

Перевірка правдоподібності гіпотези про вид закону розподілу
Нехай заданий статистичний розподіл апроксимований деякою теоретичною кривою або

Критерії згоди
Розглянемо один із найчастіше застосовуваних критеріїв згоди – так званий критерій Пірсона. Припусти

Точкові оцінки для невідомих параметрів розподілу
У п.п. 2.1. – 2.7 ми докладно розглянули способи вирішення першої та другої основних завдань математичної статистики. Це завдання визначення законів розподілу випадкових величин за дослідними даними

Довірчий інтервал. Довірча ймовірність
На практиці при малій кількості дослідів над випадковою величиною наближена заміна невідомого параметра

Нехай випадкова вибірка породжена випадковою величиною ξ, що спостерігається, математичне очікування і дисперсія якої невідомі. Як оцінки цих характеристик було запропоновано використовувати вибіркове середнє

та вибіркову дисперсію

. (3.14)

Розглянемо деякі властивості оцінок математичного очікування та дисперсії.

1. Обчислимо математичне очікування вибіркового середнього:

Отже, вибіркове середнє є незміщеною оцінкою для .

2. Нагадаємо, що результати спостережень – незалежні випадкові величини, кожна з яких має той самий закон розподілу, як і величина , отже, , , . Припускатимемо, що дисперсія кінцева. Тоді, згідно з теоремою Чебишева про закон великих чисел, для будь-якого ε > 0 має місце рівність ,

яке можна записати так: . (3.16) Порівнюючи (3.16) з визначенням якості спроможності (3.11), бачимо, що оцінка є заможною оцінкою математичного очікування.

3. Знайдемо дисперсію вибіркового середнього:

. (3.17)

Таким чином, дисперсія оцінки математичного очікування зменшується обернено пропорційно обсягу вибірки.

Можна довести, що й випадкова величина ξ розподілена нормально, то вибіркове середнє є ефективної оцінкою математичного очікування , тобто дисперсія приймає найменше значення проти будь-який інший оцінкою математичного очікування. Для інших законів розподілу ξ це може бути не так.

Вибіркова дисперсія є зміщеною оцінкою дисперсії, оскільки . (3.18)

Справді, використовуючи властивості математичного очікування та формулу (3.17), знайдемо

.

Щоб отримати незміщену оцінку дисперсії, оцінку (3.14) потрібно виправити, тобто домножити на . Тоді отримаємо незміщену вибіркову дисперсію

. (3.19)

Зазначимо, що формули (3.14) та (3.19) відрізняються лише знаменником, і при великих значеннях вибіркова та незміщена дисперсії відрізняються мало. Однак за малого обсягу вибірки слід користуватися співвідношенням (3.19).

Для оцінки середнього квадратичного відхилення випадкової величини використовують так зване "виправлене" середнє квадратичне відхилення, яке дорівнює квадратному кореню з незміщеної дисперсії: .

Інтервальні оцінки

У статистиці є два підходи до оцінювання невідомих параметрів розподілу: точковий та інтервальний. Відповідно до точкового оцінювання, яке розглянуто в попередньому розділі, вказується лише точка, біля якої знаходиться параметр, що оцінюється. Бажано, однак, знати, наскільки далеко може відстояти насправді цей параметр від можливих реалізацій оцінок у різних серіях спостережень.

Відповідь це питання – теж наближений – дає інший спосіб оцінювання параметрів – інтервальний. Відповідно до цього способу оцінювання знаходять інтервал, який з ймовірністю, близькою до одиниці, накриває невідоме числове значення параметра.

Поняття інтервальної оцінки

Точкова оцінка є випадковою величиною й у можливих реалізацій вибірки приймає значення лише приблизно рівні справжньому значенню параметра . Чим менша різниця, тим точніше оцінка. Таким чином, позитивне число , для якого , характеризує точність оцінки та називається помилкою оцінки (або граничною помилкою).

Довірчою ймовірністю(або надійністю)називається ймовірність β , з якою здійснюється нерівність , тобто.

. (3.20)

Замінивши нерівність рівносильною йому подвійною нерівністю , або , отримаємо

Інтервал , що накриває з ймовірністю β , , невідомий параметр , називається довірчим інтервалом (або інтервальною оцінкою),відповідним довірчою ймовірністю β .

Випадковою величиною є не лише оцінка, а й помилка: її значення залежить від ймовірності β і, зазвичай, від вибірки. Тому довірчий інтервал випадковий та вираз (3.21) слід читати так: “Інтервал накриє параметр із ймовірністю β ”, а не так: “Параметр потрапить в інтервал із ймовірністю β ”.

Сенс довірчого інтервалу полягає в тому, що при багаторазовому повторенні вибірки обсягу відносної частки випадків, що дорівнює β , довірчий інтервал, що відповідає довірчій ймовірності β , накриває справжнє значення параметра, що оцінюється. Таким чином, довірча ймовірність β характеризує надійністьдовірчого оцінювання: що більше β , тим швидше, що реалізація довірчого інтервалу містить невідомий параметр.



КАТЕГОРІЇ

ПОПУЛЯРНІ СТАТТІ

2024 «kingad.ru» - УЗД дослідження органів людини