Нехай зроблена вибірка з генеральної сукупності, підпорядкованої закону нормальногорозподілу XN( m; ). Це основне припущення математичної статистики ґрунтується на центральній граничній теоремі. Нехай відоме генеральне середнє квадратичне відхилення , але невідомо математичне очікування теоретичного розподілу m(середнє значення ).

У такому разі середнє вибіркове , отримане в ході експерименту (п.3.4.2), також буде випадковою величиною m;
). Тоді «нормалізоване» відхилення
N(0;1) – є стандартною нормальною випадковою величиною.

Завдання полягає у пошуку інтервальної оцінки для m. Побудуємо двосторонній довірчий інтервал для m так, щоб справжнє математичне очікування належало йому із заданою ймовірністю (надійністю) .

Встановити такий інтервал для величини
- Це означає знайти максимальне значення цієї величини
та мінімальне
, які є межами критичної області:
.

Т.к. така ймовірність дорівнює
, то корінь цього рівняння
можна знайти за допомогою таблиць функції Лапласа (Таблиця 3, додаток 1).

Тоді з ймовірністю можна стверджувати, що випадкова величина
, тобто шукане генеральне середнє належить інтервалу
. (3.13)

Величину
(3.14)

називають точністюоцінки.

Число
квантильнормального розподілу – можна як аргумент функції Лапласа (Таблиця 3, додаток 1), враховуючи співвідношення 2Ф( u)=, тобто. Ф( u)=
.

Назад, за заданим значенням відхилення можна знайти, з якою ймовірністю, невідоме генеральне середнє належить інтервалу
. Для цього потрібно обчислити

. (3.15)

Нехай із генеральної сукупності вилучено випадкову вибірку методом повторного відбору. З рівняння
можна знайти мінімальнийобсяг повторної вибірки n, необхідний для того, щоб довірчий інтервал із заданою надійністю не перевищував наперед заданого значення . Оцінку необхідного обсягу вибірки роблять за такою формулою:

. (3.16)

Досліджуємо точність оцінки
:

1) У разі зростання обсягу вибірки nвеличина зменшується, і значить, точність оцінки збільшується.

2) З збільшеннямнадійності оцінки збільшується значення аргументу u(Т.к. Ф(u) монотонно зростає) і значить збільшується . У такому разі збільшення надійності зменшуєточність її оцінки .

Оцінку
(3.17)

називають класичною(де t- певний параметр, що залежить від і n), т.к. вона характеризує найпоширеніші закони розподілу.

3.5.3 Довірчі інтервали для оцінки математичного очікування нормального розподілу за невідомого середнього квадратичного відхилення 

Нехай відомо, що генеральна сукупність підпорядкована закону нормального розподілу XN( m;), де величина середнього квадратичноговідхилення невідома.

Для побудови довірчого інтервалу оцінки генерального середнього у разі використовується статистика
, що має розподіл Ст'юдента з k= n-1 ступенями свободи. Це випливає з того, що N(0;1) (див. п.3.5.2), а
(див. п.3.5.3) та з визначення розподілу Ст'юдента (ч.1.п.2.11.2).

Знайдемо точність класичної оцінки розподілу Стьюдента: тобто. знайдемо tіз формули (3.17). Нехай ймовірність виконання нерівності
задана надійністю :

. (3.18)

Оскільки TSt( n-1), очевидно, що tзалежить від і nтому зазвичай пишуть
.

(3.19)

де
- функція розподілу Ст'юдента з n-1 ступенями свободи.

Вирішуючи це рівняння щодо m, отримаємо інтервал
який з надійністю  покриває невідомий параметр m.

Величина t , n-1 , що служить для визначення довірчого інтервалу випадкової величини T(n-1), розподіленою за Ст'юдентом з n-1 ступенями свободи, називається коефіцієнтом Ст'юдента. Його слід знаходити за заданими значеннями nта  з таблиць «Критичні точки розподілу Стьюдента». (Таблиця 6, додаток 1), які є рішення рівняння (3.19).

У результаті отримуємо такий вираз точності довірчого інтервалу для оцінки математичного очікування (генерального середнього), якщо невідома дисперсія:

(3.20)

Т.ч. існує загальна формула побудови довірчих інтервалів для математичного очікування генеральної сукупності:

де точність довірчого інтервалу залежно від відомої чи невідомої дисперсії знаходиться за формулами відповідно 3.16. та 3.20.

Завдання 10.Проведено деякі випробування, результати яких занесені до таблиці:

Побудова довірчого інтервалу для математичного очікування генеральної сукупності. Довірчі інтервали для математичного очікування, дисперсії, ймовірності

Нехай випадкова величина (можна говорити про генеральну сукупність) розподілена за нормальним законом, для якого відома дисперсія D = 2 (> 0). З генеральної сукупності (на багатьох об'єктів якої визначено випадкова величина) робиться вибірка обсягу n. Вибірка x 1 , x 2 ,..., x n сприймається як сукупність n незалежних випадкових величин, розподілених як і (підхід, якому дано пояснення вище з тексту).

Раніше також обговорювалися та доведені такі рівності:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Досить просто довести (ми доказ опускаємо), що випадкова величина у разі також розподілена за нормальним законом.

Позначимо невідому величину M через a і підберемо за заданою надійністю число d > 0 так, щоб виконувалася умова:

P(- a< d) = (1)

Так як випадкова величина розподілена за нормальним законом з математичним очікуванням M = M = a і дисперсією D = D /n = 2 /n, отримуємо:

P(- a< d) =P(a - d < < a + d) =

Залишилося підібрати d таким, щоб виконувалася рівність

Для будь-якого можна по таблиці знайти таке число t, що (t) = / 2. Це число t іноді називають квантилем.

Тепер із рівності

визначимо значення d:

Остаточний результат отримаємо, подавши формулу (1) у вигляді:

Сенс останньої формули полягає в наступному: з надійністю довірчий інтервал

покриває невідомий параметр a = M генеральної сукупності. Можна сказати інакше: точкова оцінка визначає значення параметра M з точністю d = t / та надійністю.

Завдання. Нехай є генеральна сукупність з деякою характеристикою, розподіленою за нормальним законом із дисперсією, що дорівнює 6,25. Зроблено вибірку обсягу n = 27 та отримано середньовибіркове значення характеристики = 12. Знайти довірчий інтервал, що покриває невідоме математичне очікування досліджуваної характеристики генеральної сукупності з надійністю =0,99.

Рішення. Спочатку таблиці для функції Лапласа знайдемо значення t з рівності (t) = / 2 = 0,495. За отриманим значенням t = 2,58 визначимо точність оцінки (або половину довжини довірчого інтервалу) d: d = 2,52,58/1,24. Звідси одержуємо шуканий довірчий інтервал: (10,76; 13,24).

статистична гіпотеза генеральний варіаційний

Довірчий інтервал для математичного очікування нормального розподілу при невідомій дисперсії

Нехай - випадкова величина, розподілена за нормальним законом із невідомим математичним очікуванням M, яке позначимо буквою a . Зробимо вибірку обсягу n. Визначимо середню вибіркову та виправлену вибіркову дисперсію s 2 за відомими формулами.

Випадкова величина

розподілена згідно із законом Стьюдента з n - 1 ступенями свободи.

Завдання полягає в тому, щоб за заданою надійністю і за числом ступенів свободи n - 1 знайти таке число t щоб виконувалася рівність

або еквівалентна рівність

Тут у дужках написана умова того, що значення невідомого параметра належить деякому проміжку, який і є довірчим інтервалом. Його межі залежать від надійності, а також параметрів вибірки і s.

Щоб визначити значення t за величиною, рівність (2) перетворюємо на вигляд:

Тепер по таблиці для випадкової величини t, розподіленої згідно із законом Стьюдента, за ймовірністю 1 - і числом ступенів свободи n - 1 знаходимо t. Формула (3) відповідає поставленої задачі.

Завдання. На контрольних випробуваннях 20 електроламп середня тривалість їх роботи дорівнювала 2000 годин при середньому квадратичному відхиленні (розрахованому як корінь квадратний з виправленої вибіркової дисперсії), що дорівнює 11 годин. Відомо, що тривалість роботи лампи є нормально розподіленою випадковою величиною. Визначити з надійністю 0,95 довірчий інтервал для математичного очікування цієї випадкової величини.

Рішення. Розмір 1 - у разі дорівнює 0,05. По таблиці розподілу Стьюдента, за числі ступенів свободи, що дорівнює 19, знаходимо: t = 2,093. Обчислимо тепер точність оцінки: 2,093121/=56,6. Звідси одержуємо шуканий довірчий інтервал: (1943,4; 2056,6).

та інших. Усі є оцінками своїх теоретичних аналогів, які можна було б отримати, якби у розпорядженні була вибірка, а генеральна сукупність. Але на жаль, генеральна сукупність - це дуже дорого і часто недоступне.

Поняття про інтервальне оцінювання

Будь-яка вибіркова оцінка має деякий розкид, т.к. є випадковою величиною, що залежить від значень у конкретній вибірці. Отже, для надійніших статистичних висновків слід знати не лише точкову оцінку, а й інтервал, який з високою ймовірністю γ (гама) накриває оцінюваний показник θ (Тета).

Формально це два таких значення (статистики) T 1 (X)і T 2 (X), що T 1< T 2 для яких при заданому рівні ймовірності γ виконується умова:

Коротше, з ймовірністю γ або більше істинний показник знаходиться між точками T 1 (X)і T 2 (X), які називаються нижнім та верхнім кордоном довірчого інтервалу.

Однією з умов побудови довірчих інтервалів його максимальна вузькість, тобто. він має бути наскільки це можливо коротким. Бажання цілком природно, т.к. дослідник намагається точніше локалізувати знаходження шуканого параметра.

Звідси випливає, що інтервал довіри повинен накривати максимальні ймовірності розподілу. а сама оцінка бути у центрі.

Тобто ймовірність відхилення (справжнього показника від оцінки) у більшу сторону дорівнює ймовірності відхилення у менший бік. Слід зазначити, що з несиметричних розподілів інтервал справа не дорівнює інтервалу зліва.

На малюнку вище чітко видно, що чим більша довірча ймовірність, тим ширший інтервал – пряма залежність.

Це була невелика вступна частина в теорію інтервального оцінювання невідомих параметрів. Перейдемо до знаходження довірчих кордонів для математичного очікування.

Довірчий інтервал для математичного очікування

Якщо вихідні дані розподілені по , то середнє буде нормальною величиною. Це випливає з того правила, що лінійна комбінація нормальних величин також має нормальний розподіл. Отже, для розрахунку можливостей ми могли б використовувати математичний апарат нормального закону розподілу.

Однак для цього потрібно знати два параметри – матожидання та дисперсію, які зазвичай не відомі. Можна, звичайно, замість параметрів використовувати оцінки (середню арифметичну і ), але тоді розподіл середньої буде не зовсім нормальним, він буде трохи приплюснутий донизу. Цей факт спритно помітив громадянин Вільям Госсет з Ірландії, опублікувавши своє відкриття у березневому випуску журналу Biometrica за 1908 рік. З метою конспірації Держсет підписався Стьюдентом. Так виник t-розподіл Стьюдента.

Однак нормальний розподіл даних, що використовувався К. Гауссом при аналізі помилок астрономічних спостережень, у земному житті зустрічається вкрай рідко і встановити досить складно (для високої точності необхідно близько 2 тисяч спостережень). Тому припущення про нормальність найкраще відкинути та використовувати методи, які не залежать від розподілу вихідних даних.

Виникає питання: який же розподіл середньої арифметичної, якщо він розрахований за даними невідомого розподілу? Відповідь дає відома у теорії ймовірностей Центральна гранична теорема(ЦПТ). У математиці існує кілька її варіантів (протягом довгих років формулювання уточнювалися), але всі вони, грубо кажучи, зводяться до твердження, що сума великої кількості випадкових незалежних величин підпорядковується нормальному закону розподілу.

При розрахунку середньої арифметичної використовується сума випадкових величин. Звідси виходить, що середнє арифметичне має нормальний розподіл, у якого матожидання – це маточування вихідних даних, а дисперсія – .

Розумні люди вміють доводити ЦПТ, але ми переконаємося в цьому за допомогою експерименту, проведеного в Excel. Змоделюємо вибірку з 50-ти рівномірно розподілених випадкових величин (за допомогою функції Excel ПРОМІНЬ). Потім зробимо 1000 таких вибірок і кожної розрахуємо середню арифметичну. Подивимося з їхньої розподіл.

Видно, що розподіл середньої близько до нормального закону. Якщо обсяг вибірок та їх кількість зробити ще більше, то подібність буде ще кращою.

Тепер, коли ми переконалися в справедливості ЦПТ, можна, використовуючи , розрахувати довірчі інтервали для середньої арифметичної, які із заданою ймовірністю накривають справжнє середнє чи математичне очікування.

Для встановлення верхньої та нижньої межі потрібно знати параметри нормального розподілу. Як правило, їх немає, тому використовують оцінки: середню арифметичнуі вибіркову дисперсію. Повторюся, такий спосіб дає гарне наближення лише за великих вибірках. Коли вибірки малі, часто рекомендують використовувати розподіл Стьюдента. Не вірте! Розподіл Стьюдента для середньої буває лише тоді, коли вихідні дані мають нормальний розподіл, тобто майже ніколи. Тому краще відразу поставити мінімальну планку за кількістю необхідних даних та використовувати асимптотично коректні методи. Говорять, достатньо 30 спостережень. Беріть 50 – не помилитеся.

T 1,2– нижня та верхня межа довірчого інтервалу

– вибіркове середнє арифметичне

s 0- Середнє квадратичне відхилення за вибіркою (незміщене)

n - Розмір вибірки

γ - Довірча ймовірність (зазвичай дорівнює 0,9, 0,95 або 0,99)

c γ =Φ -1 ((1+γ)/2)- Зворотне значення функції стандартного нормального розподілу. Простіше кажучи, це кількість стандартних помилок від середньої арифметичної до нижньої або верхньої межі (вказаним трьома ймовірностями відповідають значення 1,64, 1,96 і 2,58).

Суть формули в тому, що береться середнє арифметичне і далі від неї відкладається кілька ( з γ) стандартних помилок ( s 0 /√n). Все відомо, бери і рахуй.

До масового використання ПЕОМ для отримання значень функції нормального розподілу та зворотної їй використовували. Їх і зараз використовують, але ефективніше звернутися до готових формул Excel. Всі елементи формули вище ( , і ) можна легко розрахувати в Excel. Але є і готова формула для розрахунку довірчого інтервалу ДОВІР.НОРМ. Її синтаксис наступний.

ДОВІР.НОРМ(альфа;стандартне_вимк.;розмір)

альфа– рівень значущості чи довірчий рівень, що у прийнятих вище позначеннях дорівнює 1- γ, тобто. ймовірність того, що математичнеочікування опиниться поза довірчого інтервалу. За довірчої ймовірності 0,95, альфа дорівнює 0,05 і т.д.

стандартне_відкл- Середнє квадратичне відхилення вибіркових даних. Стандартну помилку не треба розраховувати, Excel сам розділить на корінь з n.

розмір- Розмір вибірки (n).

Результат функції ДОВЕРИТ.НОРМ – це другий доданок з формули розрахунку довірчого інтервалу, тобто. напівінтервал. Відповідно, нижня та верхня точка – це середнє ± отримане значення.

Отже, можна побудувати універсальний алгоритм розрахунку довірчих інтервалів для середньої арифметичної, який залежить від розподілу вихідних даних. Платою за універсальність є його асимптотичність, тобто. необхідність використання щодо великих вибірок. Однак у століття сучасних технологій зібрати потрібну кількість даних зазвичай не становить труднощів.

Перевірка статистичних гіпотез за допомогою довірчого інтервалу

(Module 111)

Однією з основних завдань, вирішуваних у статистиці, є . Її суть коротко така. Висувається припущення, наприклад, що матожидання генеральної сукупності дорівнює якомусь значенню. Потім будується розподіл вибіркових середніх, які можуть спостерігатися при даному матожиданні. Далі дивляться, де цього умовного розподілу перебуває справжня середня. Якщо вона виходить за допустимі межі, то поява такого середнього дуже малоймовірна, а при одноразовому повторенні експерименту майже неможливо, що суперечить висунутій гіпотезі, яка успішно відхиляється. Якщо ж середнє не виходить за критичний рівень, то гіпотеза не відхиляється (але й доводиться!).

Так ось за допомогою довірчих інтервалів, у нашому випадку для матожидання, також можна перевіряти деякі гіпотези. Це дуже просто зробити. Припустимо, середня арифметична за деякою вибіркою дорівнює 100. Перевіряється гіпотеза про те, що матожидання одно, припустимо, 90. Тобто, якщо поставити питання примітивно, то він звучить так: чи може таке бути, щоб при істинному значенні середньої рівної 90, спостерігається середня виявилася дорівнює 100?

Для відповіді на це питання додатково знадобиться інформація про середнє квадратичне відхилення та розмір вибірки. Допустимо середньоквадратичне відхилення дорівнює 30, а кількість спостережень 64 (щоб легко витягти корінь). Тоді стандартна помилка середньої дорівнює 30/8 чи 3,75. Для розрахунку 95% довірчого інтервалу потрібно відкласти в обидві сторони від середньої по дві стандартні помилки (точніше, 1,96). Довірчий інтервал вийде приблизно 100±7,5 або 92,5 до 107,5.

Далі міркування такі. Якщо перевірене значення потрапляє у довірчий інтервал, воно не суперечить гіпотезі, т.к. укладається у межі випадкових коливань (з ймовірністю 95%). Якщо точка, що перевіряється, виходить за межі довірчого інтервалу, то ймовірність такої події дуже маленька, принаймні нижче допустимого рівня. Отже, гіпотезу відхиляють, як таку, що суперечить спостережуваним даним. У нашому випадку гіпотеза про маточування знаходиться за межами довірчого інтервалу (перевірене значення 90 не входить до інтервалу 100±7,5), тому її слід відхилити. Відповідаючи на примітивне питання вище, слід сказати: ні не може, принаймні таке трапляється вкрай рідко. Часто при цьому вказують конкретну ймовірність помилкового відхилення гіпотези (p-level), а не заданий рівень, яким будувався довірчий інтервал, але про це в інший раз.

Як бачимо, побудувати довірчий інтервал для середнього (або математичного очікування) нескладно. Головне, вловити суть, а далі йтиметься. На практиці в більшості випадків використовуються 95% довірчий інтервал, який має завширшки приблизно дві стандартні помилки по обидва боки від середньої.

На цьому поки що все. Всіх благ!

Нехай випадкова величина Х генеральної сукупності розподілена нормально, враховуючи, що дисперсія та середнє відхилення квадрати s цього розподілу відомі. Потрібно оцінити невідоме математичне очікування щодо вибіркової середньої. В даному випадку завдання зводиться до знаходження довірчого інтервалу для математичного очікування з надійністю b. Якщо визначити значення довірчої ймовірності (надійності) b, то можна знайти ймовірність попадання в інтервал для невідомого математичного очікування, використовуючи формулу (6.9а):

де Ф(t) – функція Лапласа (5.17а).

В результаті можна сформулювати алгоритм відшукання меж довірчого інтервалу для математичного очікування, якщо відома дисперсія D = s 2:

  1. Задати значення надійності - b.
  2. З (6.14) виразити Ф(t) = 0,5×b. Вибрати значення t із таблиці для функції Лапласа за значенням Ф(t) (див. Додаток 1).
  3. Обчислити відхилення e за формулою (6.10).
  4. Записати довірчий інтервал за такою формулою (6.12), що з ймовірністю b виконується нерівність:

.

Приклад 5.

Випадкова величина Х має нормальний розподіл. Знайти довірчі інтервали з оцінкою з надійністю b = 0,96 невідомого математичного очікування а, якщо дані:

1) генеральне середнє квадратичне відхилення s = 5;

2) вибіркова середня;

3) обсяг вибірки n = 49.

У формулі (6.15) інтервальної оцінки математичного очікування а з надійністю b усі величини, крім t, відомі. Значення t можна знайти за допомогою (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

За таблицею Додатка 1 функції Лапласа Ф(t) = 0,48 знаходять відповідне значення t = 2,06. Отже, . Підставивши у формулу (6.12) обчислене значення e можна отримати довірчий інтервал: 30-1,47< a < 30+1,47.

Шуканий довірчий інтервал оцінки з надійністю b = 0,96 невідомого математичного очікування дорівнює: 28,53< a < 31,47.

x i

Відомо, що вони підпорядковуються закону нормального розподілу з
. Знайти оцінку m* для математичного очікування m, побудувати йому 90% довірчий інтервал.

Рішення:

Отже, m(2.53;5.47).

Завдання 11.Глибина моря вимірюється приладом, систематична помилка якого дорівнює 0, а випадкові помилки розподіляються за нормальним законом, із середнім квадратичним відхиленням = 15м. Скільки треба зробити незалежних вимірів, щоб визначити глибину з помилками не більше 5м за довірчої ймовірності 90%?

Рішення:

За умовою завдання маємо XN( m; ), де = 15м, = 5м, =0.9. Знайдемо обсяг n.

1) Із заданою надійністю = 0.9 знайдемо за таблицями 3 (Додаток 1) аргумент функції Лапласа u = 1.65.

2) Знаючи задану точність оцінки =u=5, знайдемо
. Маємо

. Тому кількість випробувань n25.

Завдання 12.Вибір температури tза перші 6 днів січня представлена ​​у таблиці:

Знайти довірчий інтервал для математичного очікування mгенеральної сукупності з довірчою ймовірністю
та оцінити генеральне стандартне відхилення s.

Рішення:


і
.

2) Незміщену оцінку знайдемо за формулою
:

=-175

=234.84

;
;

=-192

=116


.

3) Оскільки генеральна дисперсія невідома, але відома її оцінка, то оцінки математичного очікування mвикористовуємо розподіл Ст'юдента (Таблиця 6, додаток 1) та формулу (3.20).

Т.к. n 1 =n 2 = 6, то ,
, s 1 =6.85 маємо:
, звідси -29.2-4.1<m 1 < -29.2+4.1.

Тому -33.3<m 1 <-25.1.

Аналогічно маємо,
, s 2 = 4.8, тому

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33.3;-25.1) та m 2 (-34.9;-29.1).

У прикладних науках, наприклад, у будівельних дисциплінах, для оцінки точності об'єктів використовуються таблиці довірчих інтервалів, які наведені у довідковій літературі.

У статистиці існує два види оцінок: точкові та інтервальні. Точкова оцінкає окремою вибірковою статистикою, яка використовується для оцінки параметра генеральної сукупності. Наприклад, вибіркове середнє - це точкова оцінка математичного очікування генеральної сукупності, а вибіркова дисперсія S 2- точкова оцінка дисперсії генеральної сукупності σ 2. було показано, що середнє вибіркове є незміщеною оцінкою математичного очікування генеральної сукупності. Вибіркове середнє називається незміщеним, оскільки середнє значення всіх вибіркових середніх (при тому самому обсязі вибірки n) дорівнює математичному очікуванню генеральної сукупності.

Для того щоб вибіркова дисперсія S 2стала незміщеною оцінкою дисперсії генеральної сукупності σ 2, знаменник вибіркової дисперсії слід покласти рівним n – 1 , а не n. Інакше висловлюючись, дисперсія генеральної сукупності є середнім значенням різноманітних вибіркових дисперсій.

Оцінюючи параметрів генеральної сукупності слід пам'ятати, що вибіркові статистики, такі як , залежить від конкретних вибірок. Щоб врахувати цей факт, для отримання інтервальної оцінкиматематичного очікування генеральної сукупності аналізують розподіл вибіркових середніх (докладніше див.). Побудований інтервал характеризується певним довірчим рівнем, який є ймовірністю того, що справжній параметр генеральної сукупності оцінений правильно. Аналогічні довірчі інтервали можна застосовувати для оцінки частки ознаки рта основної розподіленої маси генеральної сукупності.

Завантажити нотатку у форматі або , приклади у форматі

Побудова довірчого інтервалу для математичного очікування генеральної сукупності за відомого стандартного відхилення

Побудова довірчого інтервалу для частки ознаки у генеральній сукупності

У цьому розділі поняття довірчого інтервалу поширюється на дані категорій. Це дозволяє оцінити частку ознаки у генеральній сукупності рза допомогою вибіркової частки рS= Х/n. Як вказувалося, якщо величини nрі n(1 – р)перевищують число 5, біноміальний розподіл можна апроксимувати нормальним. Отже, для оцінки частки ознаки у генеральній сукупності рможна побудувати інтервал, довірчий рівень якого дорівнює (1 – α)х100%.


де pS- вибіркова частка ознаки, рівна Х/n, тобто. кількості успіхів, поділеному на обсяг вибірки, р- частка ознаки у генеральній сукупності, Z- критичне значення стандартизованого нормального розподілу, n- Обсяг вибірки.

приклад 3.Припустимо, що з інформаційної системи вилучено вибірку, що складається зі 100 накладних, заповнених протягом останнього місяця. Припустимо, що 10 із цих накладних складено з помилками. Таким чином, р= 10/100 = 0,1. Довірчого рівня 95% відповідає критичне значення Z = 1,96.

Таким чином, ймовірність того, що від 4,12% до 15,88% накладних містять помилки, дорівнює 95%.

Для заданого обсягу вибірки довірчий інтервал, що містить частку ознаки в генеральній сукупності, здається ширшим, ніж безперервної випадкової величини. Це тим, що вимірювання безперервної випадкової величини містять більше інформації, ніж вимірювання категорійних даних. Інакше висловлюючись, категорійні дані, які набувають лише два значення, містять недостатньо інформації з метою оцінки параметрів їх розподілу.

Уобчислення оцінок, вилучених із кінцевої генеральної сукупності

Оцінка математичного очікування.Поправочний коефіцієнт кінцевої генеральної сукупності ( fpc) використовувався зменшення стандартної помилки в раз. При обчисленні довірчих інтервалів для оцінок параметрів генеральної сукупності поправний коефіцієнт застосовується у ситуаціях, коли вибірки отримують без повернення. Таким чином, довірчий інтервал для математичного очікування, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

приклад 4.Щоб проілюструвати застосування поправочного коефіцієнта для кінцевої генеральної сукупності, повернемося до завдання про обчислення довірчого інтервалу для середньої суми накладних, розглянутої вище в прикладі 3. Припустимо, що за місяць у компанії виписуються 5000 накладних, причому = 110,27 дол., S= 28,95 дол., N = 5000, n = 100, α = 0,05, t 99 = 1,9842. За формулою (6) отримуємо:

Оцінка частки ознаки.При виборі без повернення довірчий інтервал для частки ознаки, що має довірчий рівень, рівний (1 – α)х100%, обчислюється за такою формулою:

Довірчі інтервали та етичні проблеми

При вибірковому дослідженні генеральної сукупності та формулюванні статистичних висновків часто виникають етичні проблеми. Основна з них – як узгоджуються довірчі інтервали та точкові оцінки вибіркових статистик. Публікація точкових оцінок без вказівки відповідних довірчих інтервалів (як правило, що мають 95% довірчий рівень) та обсягу вибірки, на основі яких вони отримані, може породити непорозуміння. Це може створити в користувача враження, що точкова оцінка - саме те, що йому необхідно, щоб передбачити властивості всієї генеральної сукупності. Таким чином, необхідно розуміти, що в будь-яких дослідженнях в основу повинні бути поставлені не точкові, а інтервальні оцінки. З іншого боку, особливу увагу слід приділяти правильному вибору обсягів вибірки.

Найчастіше об'єктами статистичних маніпуляцій стають результати соціологічних опитувань населення з тих чи інших політичних проблем. При цьому результати опитування виносять на перші сторінки газет, а помилку вибіркового дослідження та методологію статистичного аналізу друкують десь у середині. Щоб довести обґрунтованість одержаних точкових оцінок, необхідно вказувати обсяг вибірки, на основі якої вони отримані, межі довірчого інтервалу та його рівень значущості.

Наступна замітка

Використовуються матеріали книги Левін та ін. Статистика менеджерів. - М.: Вільямс, 2004. - с. 448–462

Центральна гранична теоремастверджує, що з досить великому обсязі вибірок вибірковий розподіл середніх можна апроксимувати нормальним розподілом. Це властивість залежить від виду розподілу генеральної сукупності.

КАТЕГОРІЇ

ПОПУЛЯРНІ СТАТТІ

2024 «kingad.ru» - УЗД дослідження органів людини