Побудуємо в MS EXCEL довірчий інтервал з метою оцінки середнього значення розподілу у разі відомого значення дисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупностімає взята вибіркарозміру n. Передбачається, що стандартне відхиленняцього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за досить великого розміру вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуіз параметрами N(μ;σ 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, у який випадкова величина потрапить із заданою ймовірністю. Наприклад, із властивостей нормального розподілувідомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону, потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді на запитання ми маємо вказати форму розподілу та його параметри.

Форму розподілу ми знаємо – це нормальний розподіл(нагадаємо, що йдеться про вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значимості α (альфа) простим виразом рівень довіри =1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, у загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикою пристрою. Інженер хоче побудувати довірчий інтервал для середнього відгуку при рівні довіри 95%. З попереднього досвіду інженер знає, що стандартне відхилення часу відгуку складає 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку електронного пристрою, але він розуміє, що час відгуку є не фіксованою, а випадковою величиною, яка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більше того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичному очікуванню вибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

Довірчий інтервал для математичного очікування - це такий обчислений за даними інтервал, який з певною ймовірністю містить математичне очікування генеральної сукупності. Природною оцінкою для математичного очікування є середнє арифметичне її спостережених значень. Тому далі протягом уроку ми користуватимемося термінами "середнє", "середнє значення". У завданнях розрахунку довірчого інтервалу найчастіше потрібна відповідь типу "Довірчий інтервал середнього числа [величина у конкретній задачі] знаходиться від [менше значення] до [більше значення]". З допомогою довірчого інтервалу можна оцінювати як середні значення, а й питому вагу тієї чи іншої ознаки генеральної сукупності. Середні значення, дисперсія, стандартне відхилення та похибка, через які ми будемо приходити до нових визначень та формул, розібрані на уроці Характеристики вибірки та генеральної сукупності .

Точкова та інтервальна оцінки середнього значення

Якщо середнє значення генеральної сукупності оцінюється числом (точкою), то оцінку невідомої середньої величини генеральної сукупності приймається конкретне середнє, яке розраховано за вибіркою спостережень. У разі значення середнього вибірки - випадкової величини - не збігається із середнім значенням генеральної сукупності. Тому, вказуючи середнє значення вибірки, одночасно потрібно вказувати помилку вибірки. В якості міри помилки вибірки використовується стандартна помилка, яка виражена в тих самих одиницях вимірювання, що і середнє. Тому найчастіше використовується наступний запис: .

Якщо оцінку середнього потрібно пов'язати з певною ймовірністю, то параметр генеральної сукупності, що цікавить, потрібно оцінювати не одним числом, а інтервалом. Довірчим інтервалом називають інтервал, у якому з певною ймовірністю Pперебуває значення оцінюваного показника генеральної сукупності. Довірчий інтервал, у якому з ймовірністю P = 1 - α знаходиться випадкова величина , розраховується так:

,

α = 1 - P, який можна знайти у додатку до практично будь-якої книги зі статистики.

Насправді середнє значення генеральної сукупності і дисперсія невідомі, тому дисперсія генеральної сукупності замінюється дисперсією вибірки , а середнє генеральної сукупності - середнім значенням вибірки . Таким чином, довірчий інтервал у більшості випадків розраховується так:

.

Формулу довірчого інтервалу можна використовувати для оцінки середньої генеральної сукупності, якщо

  • відоме стандартне відхилення генеральної сукупності;
  • або стандартне відхилення генеральної сукупності невідоме, але обсяг вибірки – більше 30.

Середнє значення вибірки є незміщеною оцінкою середньої генеральної сукупності. У свою чергу, дисперсія вибірки не є незміщеною оцінкою дисперсії генеральної сукупності. Для отримання незміщеної оцінки дисперсії генеральної сукупності у формулі дисперсії вибірки обсяг вибірки nслід замінити на n-1.

приклад 1.Зібрано інформацію зі 100 випадково обраних кафе в деякому місті про те, що середня кількість працівників у них становить 10,5 зі стандартним відхиленням 4,6. Визначити довірчий інтервал 95% від числа працівників кафе.

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,05 .

Таким чином, довірчий інтервал 95% середньої кількості працівників кафе становив від 9,6 до 11,4.

приклад 2.Для випадкової вибірки з генеральної сукупності з 64 спостережень обчислено такі сумарні величини:

сума значень у спостереженнях,

сума квадратів відхилення значень від середнього .

Обчислити довірчий інтервал 95% для математичного очікування.

обчислимо стандартне відхилення:

,

обчислимо середнє значення:

.

Підставляємо значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,05 .

Отримуємо:

Таким чином, довірчий інтервал 95% для математичного очікування цієї вибірки становив від 7,484 до 11,266.

приклад 3.Для випадкової вибірки з генеральної сукупності зі 100 спостережень обчислено середнє значення 15,2 та стандартне відхилення 3,2. Обчислити довірчий інтервал 95% для математичного очікування, потім довірчий інтервал 99%. Якщо потужність вибірки та її варіація залишаються незмінними, а збільшується довірчий коефіцієнт, то довірчий інтервал звузиться чи розшириться?

Підставляємо дані значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,05 .

Отримуємо:

.

Таким чином, довірчий інтервал 95% для середньої даної вибірки становив від 14,57 до 15,82.

Знову підставляємо дані значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу рівня значимості α = 0,01 .

Отримуємо:

.

Таким чином, довірчий інтервал 99% для середньої даної вибірки становив від 14,37 до 16,02.

Як бачимо, при збільшенні довірчого коефіцієнта збільшується також критичне значення стандартного нормального розподілу, а отже початкова і кінцева точки інтервалу розташовані далі від середнього, і таким чином довірчий інтервал для математичного очікування збільшується.

Точкова та інтервальна оцінки частки

Питому вагу деякої ознаки вибірки можна інтерпретувати як точкову оцінку частки pцієї ж ознаки в генеральній сукупності. Якщо ж цю величину потрібно пов'язати з ймовірністю, слід розрахувати довірчий інтервал частки pознаки у генеральній сукупності з ймовірністю P = 1 - α :

.

приклад 4.У деякому місті два кандидати Aі Bпретендують на посаду мера Випадково було опитано 200 жителів міста, з яких 46% відповіли, що голосуватимуть за кандидата A, 26% - за кандидата Bта 28% не знають, за кого голосуватимуть. Визначити довірчий інтервал 95% для частки жителів міста, які підтримують кандидата A.

Довірчий інтервал– граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде у цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається у файлі Word (див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладена величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції посаді Московської Північної митниці було взято як випадкової повторної вибірки 20 проб продукту «А». В результаті перевірки встановлено середню вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте з ймовірністю 0,683 межі середньої вологості продукту в усій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, дорівнювала 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0 ,99 інтервальну оцінку для математичного очікування цієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування абсолютної величини не більше, ніж на 2.

Класифікація довірчих інтервалів

По виду оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому відборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.

Математика та інформатика. Навчальний посібник з усього курсу

Нехай випадкова величина Х генеральної сукупності розподілена нормально, враховуючи, що дисперсія та середнє відхилення квадрати s цього розподілу відомі. Потрібно оцінити невідоме математичне очікування щодо вибіркової середньої. В даному випадку завдання зводиться до знаходження довірчого інтервалу для математичного очікування з надійністю b. Якщо визначити значення довірчої ймовірності (надійності) b, то можна знайти ймовірність попадання в інтервал для невідомого математичного очікування, використовуючи формулу (6.9а):

де Ф(t) – функція Лапласа (5.17а).

В результаті можна сформулювати алгоритм відшукання меж довірчого інтервалу для математичного очікування, якщо відома дисперсія D = s 2:

  1. Задати значення надійності - b.
  2. З (6.14) виразити Ф(t) = 0,5×b. Вибрати значення t із таблиці для функції Лапласа за значенням Ф(t) (див. Додаток 1).
  3. Обчислити відхилення e за формулою (6.10).
  4. Записати довірчий інтервал за такою формулою (6.12), що з ймовірністю b виконується нерівність:

.

Приклад 5.

Випадкова величина Х має нормальний розподіл. Знайти довірчі інтервали з оцінкою з надійністю b = 0,96 невідомого математичного очікування а, якщо дані:

1) генеральне середнє квадратичне відхилення s = 5;

2) вибіркова середня;

3) обсяг вибірки n = 49.

У формулі (6.15) інтервальної оцінки математичного очікування а з надійністю b усі величини, крім t, відомі. Значення t можна знайти за допомогою (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

За таблицею Додатка 1 функції Лапласа Ф(t) = 0,48 знаходять відповідне значення t = 2,06. Отже, . Підставивши у формулу (6.12) обчислене значення e можна отримати довірчий інтервал: 30-1,47< a < 30+1,47.

Шуканий довірчий інтервал оцінки з надійністю b = 0,96 невідомого математичного очікування дорівнює: 28,53< a < 31,47.

Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

Нехай CB X утворюють генеральну сукупність і — невідомий параметр CB X. Якщо статистична оцінка в * є заможною, то чим більше обсяг вибірки, тим точніше отримуємо значення в. Однак на практиці ми маємо вибірки невеликого обсягу, тому не можемо гарантувати більшої точності.

Нехай * - статистична оцінка для ст. Розмір |в* - в| називається точністю оцінки. Зрозуміло, що точність є CB, тому що в * - випадкова величина. Задамо мале позитивне число 8 і вимагатимемо, щоб точність оцінки |в* - в| була менше 8, тобто | в* - у |< 8.

Надійністю g або довірчою ймовірністю оцінки по * називається ймовірність g, з якою здійснюється нерівність | в * - в |< 8, т. е.

Зазвичай надійність g задають наперед, причому за g беруть число, близьке до 1 (0,9; 0,95; 0,99; ...).

Оскільки нерівність |в * - в|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Інтервал (* - 8, * 5) називається довірчим інтервалом, тобто довірчий інтервал покриває невідомий параметр з ймовірністю у. Зауважимо, що кінці довірчого інтервалу є випадковими і змінюються від вибірки до вибірки, тому точніше говорити, що інтервал (в * - 8, в * + 8) покриває невідомий параметр, а не належить цьому інтервалу.

Нехай генеральна сукупність задана випадковою величиною X, розподіленою за нормальним законом, причому, середнє квадратичне відхилення відомо. Невідомим є математичне очікування а = М(Х). Потрібно знайти довірчий інтервал для а при заданій надійності.

Вибіркова середня

є статистичною оцінкою для хг = а.

Теорема. Випадкова величина хВ має нормальний розподіл, якщо X має нормальний розподіл і М (ХВ) = а,

А (XВ) = а де а = у/Б (X), а = М (X). л/і

Довірчий інтервал для а має вигляд:

Знаходимо 8.

Користуючись співвідношенням

де Ф(г) - функція Лапласа, маємо:

Р (|XВ - а |<8} = 2Ф

таблиці значень функції Лапласа знаходимо значення t.

Позначивши

T, отримаємо F(t) = g Так як g задана, то

З рівності Знаходимо-точність оцінки.

Значить, довірчий інтервал для має вигляд:

Якщо задана вибірка із генеральної сукупності X

нГ до" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, то довірчий інтервал буде:

Приклад 6.35. Знайти довірчий інтервал для оцінки математичного очікування а нормального розподілу з надійністю 0,95, знаючи середню вибіркову Xb = 10,43, обсяг вибірки n = 100 і середнє квадратичне відхилення s = 5.

Скористаємося формулою

КАТЕГОРІЇ

ПОПУЛЯРНІ СТАТТІ

2024 «kingad.ru» - УЗД дослідження органів людини