Да изградим доверителен интервал в MS EXCEL за оценка на средната стойност на разпределението при известна стойност на дисперсията.

Разбира се изборът ниво на довериенапълно зависи от поставената задача. По този начин степента на доверие на пътника в надеждността на самолета, разбира се, трябва да бъде по-висока от степента на доверие на купувача в надеждността на електрическата крушка.

Формулиране на задача

Да приемем, че от населениекато взе пробаразмер n. Предполага се, че стандартно отклонениетова разпределение е известно. Необходимо въз основа на това пробиоцени неизвестното средно разпределение(μ, ) и конструирайте съответния двустранно доверителен интервал.

Точкова оценка

Както е известно от статистика(да го наречем X вж) е безпристрастна оценка на средната стойносттова населениеи има разпределението N(μ;σ 2 /n).

Забележка: Ами ако трябва да построите доверителен интервалв случай на разпространение, което не е нормално?В този случай идва на помощ, което казва, че с достатъчно голям размер проби n от разпространение не- нормално, извадково разпределение на статистики Х срще приблизителнокореспондирам нормална дистрибуцияс параметри N(μ;σ 2 /n).

Така, точкова оценка средата разпределителни стойностиимаме е извадкова средна стойност, т.е. X вж. Сега да се заемем доверителен интервал.

Изграждане на доверителен интервал

Обикновено, знаейки разпределението и неговите параметри, можем да изчислим вероятността случайна променлива да приеме стойност от даден интервал. Сега нека направим обратното: да намерим интервала, в който попада случайната променлива с дадена вероятност. Например от имоти нормална дистрибуцияизвестно е, че с вероятност от 95%, случайна променлива, разпределена върху нормален закон, ще попадне в интервала приблизително +/- 2 от средна стойност(вижте статията за). Този интервал ще служи като наш прототип за доверителен интервал.

Сега да видим дали знаем разпределението , да изчислим този интервал? За да отговорим на въпроса, трябва да уточним формата на разпространение и неговите параметри.

Знаем каква е формата на разпространение нормална дистрибуция(не забравяйте, че говорим за разпределение на пробите статистика X вж).

Параметърът μ ни е неизвестен (просто трябва да се оцени с помощта на доверителен интервал), но имаме оценката му X cf,изчислено въз основа на проба,които могат да се използват.

Вторият параметър е извадково средно стандартно отклонение ще се знае, то е равно на σ/√n.

защото не знаем μ, тогава ще изградим интервала +/- 2 стандартни отклоненияне от средна стойност, но от известната му оценка X вж. Тези. при изчисляване доверителен интервалние НЯМА да приемем това X вжще попадне в интервала +/- 2 стандартни отклоненияот μ с вероятност от 95%, като ще приемем, че интервалът е +/- 2 стандартни отклоненияот X вжс вероятност от 95% ще покрие μ - средната стойност на общата съвкупност,от кое проба. Тези две твърдения са еквивалентни, но второто твърдение ни позволява да конструираме доверителен интервал.

В допълнение, ние прецизираме интервала: случайна променлива, разпределена върху нормален закон, с 95% вероятност попада в интервала +/- 1.960 стандартни отклонения,не +/- 2 стандартни отклонения. Това може да се изчисли с помощта на формулата \u003d НОРМА.СТ.ОБР ((1 + 0,95) / 2), см. примерен файл Sheet Spacing.

Сега можем да формулираме вероятностно твърдение, което ще ни послужи за формиране доверителен интервал:
„Вероятността, че средно населениеразположен от проба среднав рамките на 1.960" стандартни отклонения на средната стойност на извадката", е равно на 95%.

Стойността на вероятността, спомената в твърдението, има специално име , което е свързано сниво на значимост α (алфа) чрез прост израз ниво на доверие =1 . В нашия случай ниво на значимост α =1-0,95=0,05 .

Сега, въз основа на това вероятностно твърдение, ние пишем израз за изчисляване доверителен интервал:

където Zα/2 стандартен нормална дистрибуция(такава стойност на случайна променлива z, Какво П(z>=Zα/2 )=α/2).

Забележка: Горен α/2-квантилопределя ширината доверителен интервал V стандартни отклонения извадкова средна стойност. Горен α/2-квантил стандартен нормална дистрибуциявинаги е по-голямо от 0, което е много удобно.

В нашия случай при α=0,05, горен α/2-квантил е равно на 1,960. За други нива на значимост α (10%; 1%) горен α/2-квантил Zα/2 може да се изчисли по формулата \u003d NORM.ST.OBR (1-α / 2) или, ако е известно ниво на доверие, =NORM.ST.OBR((1+ниво на достоверност)/2).

Обикновено при изграждане доверителни интервали за оценка на средната стойностизползвай само горна α/2-квантили не използвайте по-ниско α/2-квантил. Това е възможно, защото стандартен нормална дистрибуциясиметричен спрямо оста x ( плътност на разпространението мусиметрично около средно, т.е. 0). Следователно няма нужда да се изчислява долен α/2-квантил(нарича се просто α /2-квантил), защото то е равно горна α/2-квантилсъс знак минус.

Спомнете си, че независимо от формата на разпределението на x, съответната случайна променлива X вжразпределени приблизително Глоба N(μ;σ 2 /n) (вижте статията за). Следователно, като цяло, горният израз за доверителен интервале само приблизително. Ако x е разпределено върху нормален закон N(μ;σ 2 /n), тогава изразът за доверителен интервале точен.

Изчисляване на доверителен интервал в MS EXCEL

Да решим проблема.
Времето за реакция на електронния компонент към входния сигнал е важна характеристика на устройството. Инженер иска да начертае доверителен интервал за средното време за реакция при ниво на достоверност от 95%. От предишен опит инженерът знае, че стандартното отклонение на времето за реакция е 8 ms. Известно е, че инженерът е направил 25 измервания, за да оцени времето за реакция, средната стойност е 78 ms.

Решение: Един инженер иска да знае времето за реакция на електронно устройство, но той разбира, че времето за реакция не е фиксирана, а случайна променлива, която има собствено разпределение. Така че най-доброто, на което може да се надява, е да определи параметрите и формата на това разпределение.

За съжаление от условието на задачата не знаем формата на разпределението на времето за реакция (не е задължително да е нормално). , това разпределение също е неизвестно. Само той е известен стандартно отклонениеσ=8. Следователно, докато не можем да изчислим вероятностите и да конструираме доверителен интервал.

Въпреки това, въпреки че не знаем разпределението време отделен отговор, знаем, че според CPT, разпределение на пробите средно време за реакцияе приблизително нормално(ще приемем, че условията CPTсе извършват, т.к размер пробидостатъчно голям (n=25)) .

Освен това, средно аритметичнотова разпределение е равно на средна стойностразпределения на единичния отговор, т.е. μ. А стандартно отклонениена това разпределение (σ/√n) може да се изчисли по формулата =8/ROOT(25) .

Известно е също, че инженерът е получил точкова оценкапараметър μ равен на 78 ms (X cf). Следователно сега можем да изчислим вероятностите, защото знаем формата за разпространение ( нормално) и неговите параметри (Х ср и σ/√n).

Инженерът иска да знае очаквана стойностμ от разпределението на времето за реакция. Както беше посочено по-горе, това μ е равно на очакване на извадковото разпределение на средното време за отговор. Ако използваме нормална дистрибуция N(X cf; σ/√n), тогава желаното μ ще бъде в диапазона +/-2*σ/√n с вероятност приблизително 95%.

Ниво на значимосте равно на 1-0,95=0,05.

Накрая намерете лявата и дясната граница доверителен интервал.
Лява граница: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / КОРЕН (25) = 74,864
Дясна граница: \u003d 78 + НОРМА. ST. OBR (1-0,05 / 2) * 8 / КОРЕН (25) \u003d 81,136

Лява граница: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Дясна граница: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Отговор: доверителен интервалпри 95% ниво на достоверност и σ=8мсекравно на 78+/-3.136ms

IN примерен файл на лист Sigmaизвестен създаде форма за изчисляване и изграждане двустранно доверителен интервалза произволно пробис даден σ и ниво на значимост.

Функция CONFIDENCE.NORM().

Ако стойностите пробиса в диапазона B20:B79 , А ниво на значимостравно на 0,05; след това MS EXCEL формула:
=СРЕДНО(B20:B79)-УВЕРЕНИЕ(0,05,σ, БРОЯ(B20:B79))
ще върне лявата граница доверителен интервал.

Същата граница може да се изчисли по формулата:
=СРЕДНО(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(БРОЙ(B20:B79))

Забележка: Функцията TRUST.NORM() се появи в MS EXCEL 2010. По-ранните версии на MS EXCEL използваха функцията TRUST().

Доверителен интервал за математическо очакване - това е такъв интервал, изчислен от данните, който с известна вероятност съдържа математическото очакване на генералната съвкупност. Естествената оценка за математическото очакване е средноаритметичната стойност на неговите наблюдавани стойности. Ето защо по-нататък по време на урока ще използваме термините "средно", "средна стойност". При задачи за изчисляване на доверителния интервал отговорът, който най-често се изисква, е „Доверителният интервал на средното число [стойност в конкретен проблем] е от [по-ниска стойност] до [по-висока стойност]”. С помощта на доверителния интервал е възможно да се оценят не само средните стойности, но и делът на една или друга характеристика на генералната съвкупност. В урока се анализират средни стойности, дисперсия, стандартно отклонение и грешка, чрез които ще стигнем до нови определения и формули Характеристики на извадката и популацията .

Точкови и интервални оценки на средната стойност

Ако средната стойност на генералната съвкупност се оценява чрез число (точка), тогава специфична средна стойност, изчислена от извадка от наблюдения, се приема като оценка на неизвестната средна стойност на генералната съвкупност. В този случай стойността на извадковата средна - случайна променлива - не съвпада със средната стойност на генералната съвкупност. Следователно, когато се посочва средната стойност на извадката, е необходимо едновременно да се посочи и грешката на извадката. Стандартната грешка се използва като мярка за грешка на извадката, която се изразява в същите единици като средната стойност. Поради това често се използва следното обозначение: .

Ако се изисква оценката на средната стойност да бъде свързана с определена вероятност, тогава параметърът на общата съвкупност от интереси трябва да бъде оценен не с едно число, а с интервал. Доверителният интервал е интервал, в който с определена вероятност Пнамира се стойността на оценения показател на генералната съвкупност. Доверителен интервал, в който с вероятност П = 1 - α е случайна променлива, се изчислява, както следва:

,

α = 1 - П, който може да се намери в приложението към почти всяка книга по статистика.

На практика средната стойност на съвкупността и дисперсията не са известни, така че дисперсията на популацията се заменя с дисперсията на извадката, а средната популация с извадковата средна стойност. По този начин доверителният интервал в повечето случаи се изчислява, както следва:

.

Формулата на доверителния интервал може да се използва за оценка на средната популация if

  • стандартното отклонение на генералната съвкупност е известно;
  • или стандартното отклонение на популацията не е известно, но размерът на извадката е по-голям от 30.

Средната стойност на извадката е безпристрастна оценка на средната стойност на популацията. На свой ред дисперсията на извадката не е безпристрастна оценка на дисперсията на популацията. За да се получи безпристрастна оценка на вариацията на популацията във формулата за вариация на извадката, размерът на извадката е нтрябва да се замени с н-1.

Пример 1Събира се информация от 100 произволно избрани кафенета в даден град, че средният брой служители в тях е 10,5 при стандартно отклонение от 4,6. Определете доверителния интервал от 95% от броя на служителите в кафенето.

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

По този начин 95% доверителен интервал за средния брой служители в кафенето е между 9,6 и 11,4.

Пример 2За произволна извадка от обща съвкупност от 64 наблюдения бяха изчислени следните общи стойности:

сбор от стойности в наблюденията,

сума на квадратните отклонения на стойностите от средната стойност .

Изчислете 95% доверителен интервал за очакваната стойност.

изчислете стандартното отклонение:

,

изчислете средната стойност:

.

Заменете стойностите в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

Така 95% доверителният интервал за математическото очакване на тази извадка варира от 7,484 до 11,266.

Пример 3За произволна извадка от обща съвкупност от 100 наблюдения бяха изчислени средна стойност от 15,2 и стандартно отклонение от 3,2. Изчислете 95% доверителен интервал за очакваната стойност, след това 99% доверителен интервал. Ако мощността на извадката и нейната вариация останат същите, но факторът на доверие се увеличи, ще се стесни или разшири доверителният интервал?

Заменяме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

.

Така 95% доверителният интервал за средната стойност на тази извадка е от 14,57 до 15,82.

Отново заместваме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,01 .

Получаваме:

.

По този начин 99% доверителен интервал за средната стойност на тази извадка е от 14,37 до 16,02.

Както можете да видите, с нарастването на доверителния фактор критичната стойност на стандартното нормално разпределение също се увеличава и следователно началната и крайната точка на интервала са разположени по-далеч от средната стойност и по този начин доверителният интервал за математическото очакване се увеличава.

Точкови и интервални оценки на специфичното тегло

Делът на някои характеристики на извадката може да се тълкува като точкова оценка на дела стрсъщата черта в общата популация. Ако тази стойност трябва да бъде свързана с вероятност, тогава трябва да се изчисли доверителният интервал на специфичното тегло стрхарактеристика в общата популация с вероятност П = 1 - α :

.

Пример 4В даден град има двама кандидати АИ бсе кандидатира за кмет. На случаен принцип са анкетирани 200 жители на града, от които 46% са отговорили, че ще гласуват за кандидата А, 26% - за кандидата ба 28% не знаят за кого ще гласуват. Определете 95% доверителен интервал за дела на жителите на града, които подкрепят кандидата А.

Доверителен интервалса граничните стойности на статистическата величина, която с дадена доверителна вероятност γ ще бъде в този интервал с по-голям размер на извадката. Означава се като P(θ - ε . На практика вероятността за доверие γ се избира от стойностите γ = 0.9 , γ = 0.95 , γ = 0.99, достатъчно близки до единица.

Сервизно задание. Тази услуга определя:

  • доверителен интервал за общата средна стойност, доверителен интервал за дисперсията;
  • доверителен интервал за стандартното отклонение, доверителен интервал за общата фракция;
Полученото решение се записва във файл на Word (вижте примера). По-долу има видео инструкция за попълване на първоначалните данни.

Пример #1. В колективна ферма от общо стадо от 1000 овце 100 овце са подложени на селективно контролно стригане. В резултат на това е установен среден настриг на вълна от 4,2 кг на овца. Определете с вероятност от 0,99 стандартната грешка на пробата при определяне на средното срязване на вълна на овца и границите, в които се намира стойността на срязване, ако дисперсията е 2,5. Пробата не се повтаря.
Пример #2. От партидата внесени продукти на поста на Московската северна митница са взети 20 проби от продукт "А" по реда на случайно повторно вземане на проби. В резултат на проверката е установено средно съдържание на влага на продукт "А" в пробата, което се оказва 6% със стандартно отклонение от 1%.
Определете с вероятност от 0,683 границите на средното съдържание на влага в продукта в цялата партида внесени продукти.
Пример #3. Проучване на 36 студенти показа, че средният брой учебници, прочетени от тях за учебна година, се оказа 6. Ако приемем, че броят учебници, прочетени от студент за семестър, има нормален закон на разпределение със стандартно отклонение, равно на 6, намерете : A) с надеждност от 0,99 интервална оценка за математическото очакване на тази случайна променлива; Б) с каква вероятност може да се твърди, че средният брой учебници, прочетени от студент за семестър, изчислен за тази извадка, се отклонява от математическото очакване по абсолютна стойност с не повече от 2.

Класификация на доверителните интервали

По вида на параметъра, който се оценява:

По тип проба:

  1. Доверителен интервал за безкрайно вземане на проби;
  2. Доверителен интервал за крайната проба;
Вземането на проби се нарича повторно вземане на проби, ако избраният обект се върне към общата популация, преди да се избере следващият. Пробата се нарича неповтаряща се.ако избраният обект не бъде върнат в общата съвкупност. На практика обикновено се работи с неповтарящи се проби.

Изчисляване на средната извадкова грешка за случаен подбор

Несъответствието между стойностите на показателите, получени от извадката, и съответните параметри на генералната съвкупност се нарича грешка в представителността.
Обозначения на основните параметри на генералната и извадковата съвкупност.

Математика и информатика. Ръководство за обучение през целия курс

Нека случайната променлива X на генералната съвкупност е нормално разпределена, като се има предвид, че дисперсията и стандартното отклонение s на това разпределение са известни. Изисква се да се оцени неизвестното математическо очакване от средната стойност на извадката. В този случай задачата се свежда до намиране на доверителен интервал за математическото очакване с надеждност b. Ако зададем стойността на доверителната вероятност (надеждност) b, тогава можем да намерим вероятността да попаднем в интервала за неизвестното математическо очакване, използвайки формула (6.9a):

където Ф(t) е функцията на Лаплас (5.17а).

В резултат на това можем да формулираме алгоритъм за намиране на границите на доверителния интервал за математическото очакване, ако дисперсията D = s 2 е известна:

  1. Задайте стойността на надеждност на b.
  2. От (6.14) изразете Ф(t) = 0,5 × b. Изберете стойността t от таблицата за функцията на Лаплас по стойността Ф(t) (вижте Приложение 1).
  3. Изчислете отклонението e, като използвате формула (6.10).
  4. Напишете доверителния интервал съгласно формула (6.12), така че с вероятност b да е вярно следното неравенство:

.

Пример 5.

Случайната променлива X има нормално разпределение. Намерете доверителни интервали за оценка с надеждност b = 0,96 от неизвестната средна стойност a, ако е дадено:

1) общо стандартно отклонение s = 5;

2) извадкова средна стойност;

3) размер на извадката n = 49.

Във формула (6.15) на интервалната оценка на математическото очакване А с надеждност b, всички величини с изключение на t са известни. Стойността на t може да се намери с помощта на (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Според таблицата от Приложение 1 за функцията на Лаплас Ф(t) = 0,48, намерете съответната стойност t = 2,06. следователно . Замествайки изчислената стойност на e във формула (6.12), можем да получим доверителен интервал: 30-1,47< a < 30+1,47.

Желаният доверителен интервал за оценка с надеждност b = 0,96 на неизвестното математическо очакване е: 28,53< a < 31,47.

Примерни формули за средна грешка
преизбираненеповтаряща се селекция
за средатаза споделянеза средатаза споделяне
Съотношението между границата на извадкова грешка (Δ), гарантирана с известна вероятност P(t),и средната грешка на извадката има формата: или Δ = t μ, където T– коефициент на доверителност, определен в зависимост от степента на вероятност P(t) съгласно таблицата на интегралната функция на Лаплас.

Формули за изчисляване на размера на извадката с подходящ метод на случаен подбор

Нека CB X образува генералната съвкупност и β е неизвестен параметър CB X. Ако статистическата оценка в * е последователна, тогава колкото по-голям е размерът на извадката, толкова по-точна е стойността на β. На практика обаче нямаме много големи проби, така че не можем да гарантираме по-голяма точност.

Нека s* е статистическа оценка за s. Количество |in* - in| се нарича точност на оценката. Ясно е, че точността е CB, тъй като s* е случайна променлива. Нека зададем малко положително число 8 и изискваме точността на оценката |in* - in| беше по-малко от 8, т.е. | в* - в |< 8.

Надеждността g или доверителната вероятност на оценката in by in * е вероятността g, с която неравенството |in * - in|< 8, т. е.

Обикновено надеждността на g се задава предварително и за g се приема число, близко до 1 (0,9; 0,95; 0,99; ...).

Тъй като неравенството |in * - in|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Интервалът (в * - 8, в * + 5) се нарича доверителен интервал, т.е. доверителният интервал покрива неизвестния параметър в с вероятност y. Имайте предвид, че краищата на доверителния интервал са произволни и варират от проба на проба, така че е по-точно да се каже, че интервалът (при * - 8, при * + 8) покрива неизвестния параметър β, а не β принадлежи към този интервал .

Нека генералната съвкупност е дадена от случайна променлива X, разпределена по нормалния закон, освен това е известно стандартното отклонение a. Математическото очакване a = M (X) е неизвестно. Изисква се да се намери доверителен интервал за a за дадена надеждност y.

Примерна средна стойност

е статистическа оценка за xr = a.

Теорема. Случайна променлива xB има нормално разпределение, ако X има нормално разпределение и M(XB) = a,

A (XB) \u003d a, където a \u003d y / B (X), a \u003d M (X). л/и

Доверителният интервал за a има формата:

Намираме 8.

Използване на релацията

където Ф(г) е функцията на Лаплас, имаме:

P ( | XB - a |<8} = 2Ф

намираме стойността на t в таблицата със стойности на функцията на Лаплас.

Обозначаване

T, получаваме F(t) = g

От равенството Find - точността на оценката.

Така доверителният интервал за a има формата:

Ако се даде извадка от общата популация X

нг Да се" X2 xm
н. n1 n2 nm

n = U1 + ... + nm, тогава доверителният интервал ще бъде:

Пример 6.35. Намерете доверителния интервал за оценка на очакването a на нормално разпределение с надеждност 0,95, като знаете средната стойност на извадката Xb = 10,43, размера на извадката n = 100 и стандартното отклонение s = 5.

Нека използваме формулата

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 "kingad.ru" - ултразвуково изследване на човешки органи