Доверителен интервал. Доверителен интервал за математическото очакване на нормално разпределение с известна дисперсия

Доверителен интервал– граничните стойности на статистическа величина, която с дадена доверителна вероятност γ ще бъде в този интервал при вземане на проби от по-голям обем. Означава се като P(θ - ε. На практика вероятността за доверие γ се избира от стойности, доста близки до единица: γ = 0.9, γ = 0.95, γ = 0.99.

Цел на услугата. Използвайки тази услуга, можете да определите:

  • доверителен интервал за общата средна стойност, доверителен интервал за дисперсията;
  • доверителен интервал за стандартното отклонение, доверителен интервал за общия дял;
Полученото решение се записва във файл на Word (вижте примера). По-долу има видео инструкция за попълване на първоначалните данни.

Пример №1. В колективна ферма от общо стадо от 1000 овце 100 овце са подложени на селективно контролно стригане. В резултат на това е установен среден настриг на вълна от 4,2 кг на овца. Определете с вероятност от 0,99 средната квадратна грешка на извадката при определяне на средното настригане на вълна на овца и границите, в които се съдържа стойността на настригане, ако дисперсията е 2,5. Пробата не се повтаря.
Пример №2. От партида внесени продукти на поста на Московската северна митница бяха взети 20 проби от продукт „А“ чрез произволно повторно вземане на проби. В резултат на теста е установено средното съдържание на влага на продукт „А” в пробата, което се оказва равно на 6% със стандартно отклонение от 1%.
Определете с вероятност 0,683 границите на средното съдържание на влага в продукта в цялата партида внесени продукти.
Пример №3. Проучване на 36 студенти показа, че средният брой учебници, прочетени от тях през учебната година, е равен на 6. Ако приемем, че броят учебници, прочетени от студент за семестър, има нормален закон на разпределение със стандартно отклонение, равно на 6, намерете : A) с надеждност от 0,99 интервална оценка за математическото очакване на тази случайна променлива; Б) с каква вероятност можем да кажем, че средният брой учебници, прочетени от студент за семестър, изчислен от тази извадка, ще се отклони от математическото очакване по абсолютна стойност с не повече от 2.

Класификация на доверителните интервали

По вид параметър, който се оценява:

По тип проба:

  1. Доверителен интервал за безкрайна извадка;
  2. Доверителен интервал за крайната проба;
Пробата се нарича повторна проба, ако избраният обект се върне към популацията, преди да изберете следващия. Пробата се нарича неповтаряща се, ако избраният обект не бъде върнат в популацията. На практика обикновено имаме работа с проби, които не се повтарят.

Изчисляване на средната извадкова грешка за случайна извадка

Несъответствието между стойностите на показателите, получени от извадката, и съответните параметри на генералната съвкупност се нарича грешка в представителността.
Обозначения на основните параметри на генералната и извадкова съвкупности.
Формули за средна извадкова грешка
повторна селекцияповторете избора
за средноза споделянеза средноза споделяне
Връзката между границата на извадкова грешка (Δ), гарантирана с известна вероятност Р(t),и средната грешка на извадката има формата: или Δ = t·μ, където T– коефициент на доверителност, определен в зависимост от нивото на вероятност P(t) съгласно таблицата на интегралната функция на Лаплас.

Формули за изчисляване на размера на извадката, като се използва метод на чисто случайна извадка

Нека една случайна променлива (може да говорим за генерална съвкупност) е разпределена по нормален закон, за който е известна дисперсията D = 2 (> 0). От генералната съвкупност (на набор от обекти, от които се определя случайна променлива) се прави извадка с размер n. Извадката x 1 , x 2 ,..., x n се разглежда като набор от n независими случайни променливи, разпределени по същия начин като (подхода, обяснен по-горе в текста).

Следните равенства също бяха обсъдени и доказани по-рано:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Достатъчно е просто да докажем (пропускаме доказателството), че случайната променлива в този случай също е разпределена по нормалния закон.

Нека означим неизвестното количество M с a и изберем, въз основа на дадената надеждност, числото d > 0, така че да е изпълнено условието:

P(- a< d) = (1)

Тъй като случайната променлива е разпределена по нормалния закон с математическо очакване M = M = a и дисперсия D = D /n = 2 /n, получаваме:

P(- a< d) =P(a - d < < a + d) =

Остава да изберем d така, че да е в сила равенството

За всяко едно можете да използвате таблицата, за да намерите число t, така че (t)= / 2. Това число t понякога се нарича квантил.

Сега от равенството

нека определим стойността на d:

Получаваме крайния резултат, като представяме формула (1) във формата:

Значението на последната формула е следното: с надеждност, доверителният интервал

обхваща неизвестния параметър a = M от популацията. Можем да го кажем по различен начин: точковата оценка определя стойността на параметъра M с точност d= t / и надеждност.

Задача. Нека има генерална съвкупност с определена характеристика, разпределена по нормален закон с дисперсия, равна на 6,25. Взет е размер на извадката от n = 27 и е получена средната извадкова стойност на характеристиката = 12. Намерете доверителен интервал, покриващ неизвестното математическо очакване на изследваната характеристика на генералната съвкупност с надеждност = 0,99.

Решение. Първо, използвайки таблицата за функцията на Лаплас, намираме стойността на t от равенството (t) = / 2 = 0,495. Въз основа на получената стойност t = 2,58 определяме точността на оценката (или половината от дължината на доверителния интервал) d: d = 2,52,58 / 1,24. От тук получаваме необходимия доверителен интервал: (10.76; 13.24).

статистическа хипотеза обща вариационна

Доверителен интервал за математическото очакване на нормално разпределение с неизвестна дисперсия

Нека е случайна променлива, разпределена по нормален закон с неизвестно математическо очакване M, което означаваме с буквата a. Нека направим извадка от обем n. Нека определим средната извадка и коригираната дисперсия на извадката s 2, като използваме известни формули.

Случайна стойност

разпределени по закона на Стюдънт с n - 1 степени на свобода.

Задачата е да се намери число t за дадена надеждност и броя на степените на свобода n - 1, така че равенството

или еквивалентно равенство

Тук в скоби е изписано условието стойността на неизвестния параметър a да принадлежи към определен интервал, който е доверителният интервал. Неговите граници зависят от надеждността, както и от параметрите на вземане на проби и s.

За да определим стойността на t по големина, преобразуваме равенството (2) във формата:

Сега, използвайки таблицата за случайна променлива t, разпределена според закона на Стюдънт, използвайки вероятност 1 - и броя на степените на свобода n - 1, намираме t. Формула (3) дава отговор на поставения проблем.

Задача. При контролни тестове на 20 електрически лампи средната продължителност на тяхната работа е равна на 2000 часа със стандартно отклонение (изчислено като корен квадратен от коригираната дисперсия на извадката) равно на 11 часа. Известно е, че времето на работа на лампата е нормално разпределена случайна променлива. Определете с надеждност 0,95 доверителен интервал за математическото очакване на тази случайна променлива.

Решение. Стойност 1 - в този случай е равна на 0,05. Според таблицата за разпределение на Стюдънт, при брой степени на свобода, равен на 19, намираме: t = 2,093. Нека сега изчислим точността на оценката: 2,093121/ = 56,6. От тук получаваме необходимия доверителен интервал: (1943.4; 2056.6).

Доверителен интервал за математическо очакване - това е интервал, изчислен от данни, които с известна вероятност съдържат математическото очакване на генералната съвкупност. Естествена оценка за математическото очакване е средноаритметичното на неговите наблюдавани стойности. Затова през целия урок ще използваме термините „средна стойност“ и „средна стойност“. При проблеми с изчисляване на доверителен интервал най-често изискваният отговор е нещо като „Доверителният интервал на средното число [стойност в определен проблем] е от [по-малка стойност] до [по-голяма стойност].“ Използвайки доверителен интервал, можете да оцените не само средните стойности, но и съотношението на определена характеристика на общата съвкупност. В урока се разглеждат средни стойности, дисперсия, стандартно отклонение и грешка, чрез които ще стигнем до нови определения и формули Характеристики на извадката и съвкупността .

Точкови и интервални оценки на средната стойност

Ако средната стойност на съвкупността се оценява с число (точка), тогава специфична средна стойност, която се изчислява от извадка от наблюдения, се приема като оценка на неизвестната средна стойност на съвкупността. В този случай стойността на извадковата средна - случайна променлива - не съвпада със средната стойност на генералната съвкупност. Следователно, когато посочвате средната стойност на извадката, трябва едновременно да посочите грешката на извадката. Мярката за извадкова грешка е стандартната грешка, която се изразява в същите единици като средната стойност. Поради това често се използва следното обозначение: .

Ако оценката на средната стойност трябва да бъде свързана с определена вероятност, тогава параметърът от интерес в съвкупността трябва да бъде оценен не с едно число, а с интервал. Доверителният интервал е интервал, в който с определена вероятност Пнамира се стойността на прогнозния индикатор за населението. Доверителен интервал, в който е вероятно П = 1 - α се намира случайната променлива, изчислена както следва:

,

α = 1 - П, който може да се намери в приложението към почти всяка книга по статистика.

На практика средната стойност на съвкупността и дисперсията не са известни, така че дисперсията на популацията се заменя с дисперсията на извадката, а средната популация с извадковата средна стойност. По този начин доверителният интервал в повечето случаи се изчислява, както следва:

.

Формулата на доверителния интервал може да се използва за оценка на средната популация if

  • стандартното отклонение на съвкупността е известно;
  • или стандартното отклонение на популацията е неизвестно, но размерът на извадката е по-голям от 30.

Средната стойност на извадката е безпристрастна оценка на средната стойност на популацията. На свой ред дисперсията на извадката не е безпристрастна оценка на дисперсията на популацията. За да получите безпристрастна оценка на дисперсията на популацията във формулата за дисперсия на извадката, размер на извадката нтрябва да се замени с н-1.

Пример 1.От 100 произволно избрани кафенета в даден град е събрана информация, че средният брой служители в тях е 10,5 при стандартно отклонение от 4,6. Определете 95% доверителен интервал за броя на служителите в кафенето.

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

По този начин 95% доверителен интервал за средния брой служители в кафенето варира от 9,6 до 11,4.

Пример 2.За произволна извадка от популация от 64 наблюдения бяха изчислени следните общи стойности:

сбор от стойности в наблюденията,

сума на квадратните отклонения на стойностите от средната стойност .

Изчислете 95% доверителен интервал за математическото очакване.

Нека изчислим стандартното отклонение:

,

Нека изчислим средната стойност:

.

Заменяме стойностите в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

Така 95% доверителният интервал за математическото очакване на тази извадка варира от 7,484 до 11,266.

Пример 3.За произволна популационна извадка от 100 наблюдения изчислената средна стойност е 15,2, а стандартното отклонение е 3,2. Изчислете 95% доверителен интервал за очакваната стойност, след това 99% доверителен интервал. Ако мощността на извадката и нейната вариация останат непроменени и коефициентът на доверие се увеличи, ще се стесни или разшири доверителният интервал?

Заменяме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

.

По този начин 95% доверителен интервал за средната стойност на тази проба варира от 14,57 до 15,82.

Отново заместваме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,01 .

Получаваме:

.

Така 99% доверителният интервал за средната стойност на тази проба варира от 14,37 до 16,02.

Както виждаме, с увеличаването на коефициента на доверие критичната стойност на стандартното нормално разпределение също се увеличава и следователно началната и крайната точка на интервала са разположени по-далеч от средната стойност и по този начин интервалът на доверие за математическото очакване се увеличава .

Точкови и интервални оценки на специфичното тегло

Делът на някакъв примерен атрибут може да се интерпретира като точкова оценка на дела стрсъс същата характеристика в общата популация. Ако тази стойност трябва да бъде свързана с вероятност, тогава трябва да се изчисли доверителният интервал на специфичното тегло стрхарактеристика в популацията с вероятност П = 1 - α :

.

Пример 4.В някой град има двама кандидати АИ бсе кандидатират за кмет. На случаен принцип са анкетирани 200 жители на града, от които 46% са отговорили, че биха гласували за кандидата А, 26% - за кандидата ба 28% не знаят за кого ще гласуват. Определете 95% доверителен интервал за дела на жителите на града, подкрепящи кандидата А.

Можете да използвате тази форма за търсене, за да намерите задачата, от която се нуждаете. Въведете дума, фраза от задачата или номера й, ако я знаете.


<въведен тип="submit" value="" name="searchbutton" class="button">

Търсете само в този раздел


Доверителни интервали: списък с решения на проблеми

Доверителни интервали: теория и проблеми

Разбиране на доверителните интервали

Нека накратко представим концепцията за доверителен интервал, който
1) оценява някакъв параметър на числена извадка директно от данните на самата извадка,
2) покрива стойността на този параметър с вероятност γ.

Доверителен интервалза параметър х(с вероятност γ) се нарича интервал от формата , така че , а стойностите се изчисляват по някакъв начин от извадката.

Обикновено в приложни задачи вероятността за доверие се приема равна на γ ​​= 0,9; 0,95; 0,99.

Нека разгледаме някаква извадка с размер n, направена от генералната съвкупност, разпределена вероятно според нормалния закон за разпределение. Нека покажем какви формули се използват за намиране доверителни интервали за параметрите на разпределението- математическо очакване и дисперсия (стандартно отклонение).

Доверителен интервал за математическо очакване

Случай 1.Дисперсията на разпределението е известна и равна на . След това доверителният интервал за параметъра аима формата:
Tопределена от таблицата за разпределение на Лаплас според отношението

Случай 2.Дисперсията на разпределението е неизвестна; точкова оценка на дисперсията се изчислява от извадката. След това доверителният интервал за параметъра аима формата:
, където е средната извадка, изчислена от извадката, параметър Tопределен от таблицата за разпределение на студентите

Пример.Въз основа на 7 измервания на определена величина се установи, че средната стойност на резултатите от измерването е 30, а дисперсията на извадката е 36. Намерете границите, в които се съдържа истинската стойност на измерената величина с надеждност 0,99.

Решение.Ще намерим . Тогава доверителните граници за интервала, съдържащ истинската стойност на измерената стойност, могат да бъдат намерени по формулата:
, където е средната стойност на извадката, е дисперсията на извадката. Заменяме всички стойности и получаваме:

Доверителен интервал за дисперсия

Вярваме, че най-общо казано, математическото очакване е неизвестно и е известна само точковата безпристрастна оценка на дисперсията. Тогава доверителният интервал има формата:
, Където - квантили на разпределение, определени от таблици.

Пример.Въз основа на данните от 7 теста е установена оценъчната стойност за стандартното отклонение s=12. Намерете с вероятност 0,9 ширината на доверителния интервал, конструиран за оценка на дисперсията.

Решение.Доверителният интервал за дисперсията на неизвестната популация може да се намери с помощта на формулата:

Заменяме и получаваме:


Тогава ширината на доверителния интервал е 465.589-71.708=393.881.

Доверителен интервал за вероятност (пропорция)

Случай 1.Нека размерът на извадката и фракцията на извадката (относителна честота) са известни в проблема. Тогава доверителният интервал за общия дял (истинската вероятност) има формата:
, където параметърът Tсе определя от таблицата за разпределение на Лаплас, като се използва връзката.

Случай 2.Ако в задачата е допълнително известен общият размер на популацията, от която е взета извадката, доверителният интервал за общия дял (истинска вероятност) може да се намери с помощта на коригираната формула:
.

Пример.Известно е, че Намерете границите, в които е вероятно да се съдържа общият дял.

Решение.Използваме формулата:

Нека намерим параметъра от условието , получаваме Заместник във формулата:


На страницата ще намерите и други примери за задачи по математическа статистика

Нека CB X образува генералната съвкупност и нека β е неизвестният параметър CB X. Ако статистическата оценка в * е последователна, тогава колкото по-голям е размерът на извадката, толкова по-точно получаваме стойността на β. На практика обаче нямаме много големи проби, така че не можем да гарантираме по-голяма точност.

Нека b* е статистическа оценка за c. Стойност |in* - in| се нарича точност на оценката. Ясно е, че точността е CB, тъй като β* е случайна променлива. Нека посочим малко положително число 8 и изискваме точността на оценката |в* - в| беше по-малко от 8, т.е. | в* - в |< 8.

Надеждност g или доверителна вероятност на оценка в in * е вероятността g, с която неравенството |in * - in|< 8, т. е.

Обикновено надеждността g се определя предварително и g се приема за число, близко до 1 (0,9; 0,95; 0,99; ...).

Тъй като неравенството |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Интервалът (в * - 8, в * + 5) се нарича доверителен интервал, т.е. доверителният интервал покрива неизвестния параметър в с вероятност y. Имайте предвид, че краищата на доверителния интервал са произволни и варират от проба на проба, така че е по-точно да се каже, че интервалът (в * - 8, в * + 8) покрива неизвестния параметър в, а не в принадлежи към това интервал.

Нека съвкупността е дефинирана от случайна променлива X, разпределена по нормален закон, и стандартното отклонение a е известно. Неизвестното е математическото очакване a = M (X). Изисква се да се намери доверителният интервал за a за дадена надеждност y.

Примерна средна стойност

е статистическа оценка за xr = a.

Теорема. Случайна променлива xB има нормално разпределение, ако X има нормално разпределение и M (XB) = a,

A (XB) = a, където a = y/B (X), a = M (X). л/и

Доверителният интервал за a има формата:

Намираме 8.

Използвайки съотношението

където Ф(r) е функцията на Лаплас, имаме:

P ( | XB - a |<8} = 2Ф

таблица със стойности на функцията на Лаплас намираме стойността на t.

Като определи

T, получаваме F(t) = g Тъй като g е дадено, тогава чрез

От равенството намираме, че оценката е точна.

Това означава, че доверителният интервал за a има формата:

Като се има предвид извадка от популацията X

нг Да се" X2 Xm
н. n1 n2 nm

n = U1 + ... + nm, тогава доверителният интервал ще бъде:

Пример 6.35. Намерете доверителния интервал за оценка на математическото очакване a на нормалното разпределение с надеждност 0,95, като знаете средната стойност на извадката Xb = 10,43, размер на извадката n = 100 и стандартно отклонение s = 5.

Нека използваме формулата

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи