Нека се вземе проба от обща популация, подчинена на закона нормалноразпространение хN( м; ). Това основно допускане на математическата статистика се основава на централната гранична теорема. Нека общото стандартно отклонение е известно , но математическото очакване на теоретичното разпределение е неизвестно м(средна стойност ).

В този случай средната стойност на извадката , получена по време на експеримента (раздел 3.4.2), също ще бъде случайна променлива м;
). След това "нормализираното" отклонение
N(0;1) – е стандартна нормална случайна променлива.

Задачата е да се намери интервална оценка за м. Нека конструираме двустранен доверителен интервал за м така че истинското математическо очакване да му принадлежи с дадена вероятност (надеждност) .

Задайте такъв интервал за стойността
- това означава да се намери максималната стойност на това количество
и минимум
, които са границите на критичната област:
.

защото тази вероятност е равна
, тогава коренът на това уравнение
могат да бъдат намерени с помощта на таблици с функции на Лаплас (Таблица 3, Приложение 1).

Тогава с вероятност може да се твърди, че случайната величина
, тоест желаната обща средна принадлежи на интервала
. (3.13)

Размер
(3.14)

Наречен точностоценки.

Номер
квантилнормално разпределение - може да се намери като аргумент на функцията на Лаплас (Таблица 3, Приложение 1), като се вземе предвид връзката 2Ф( u)=, т.е. F( u)=
.

Обратно, според зададената стойност на отклонение може да се намери с каква вероятност неизвестната обща средна принадлежи на интервала
. За да направите това, трябва да изчислите

. (3.15)

Нека произволна извадка бъде извлечена от общата популация, като се използва методът на повторен подбор. От ур.
може да се намери минимумобем на повторно вземане на проби н, необходими за доверителния интервал с дадена надеждност не надвишава предварително зададената стойност . Необходимият размер на извадката се изчислява по формулата:

. (3.16)

Нека изследваме точност на оценката
:

1) Тъй като размерът на извадката се увеличава нвеличина намаляваи следователно точността на оценката се увеличава.

2) В нарастванадеждност на оценката стойността на аргумента се увеличава u(защото Е(u) нараства монотонно) и следователно се увеличава . В този случай увеличаването на надеждността намаляваточност на оценката му .

Оценка
(3.17)

Наречен класически(Където T- определен параметър в зависимост от И н), защото той характеризира най-често срещаните закони на разпределение.

3.5.3 Доверителни интервали за оценка на математическото очакване на нормално разпределение с неизвестно стандартно отклонение 

Нека се знае, че населението е подчинено на закона за нормалното разпределение хN( м;), където стойността корен квадратенотклонения неизвестен.

За да се конструира доверителен интервал за оценка на общата средна стойност в този случай се използва статистика
, имащ студентско разпространение с к= н–1 степен на свобода. Това следва от факта, че N(0;1) (вижте раздел 3.5.2), и
(вижте раздел 3.5.3) и от дефиницията на разпределението на Student (част 1. раздел 2.11.2).

Нека намерим точността на класическата оценка на разпределението на Стюдънт: т.е. ще намерим Tот формула (3.17). Нека вероятността за изпълнение на неравенството
дадено от надеждност :

. (3.18)

Тъй като TSt( н-1), очевидно е, че Tзависи от И н, така пишат обикновено
.

(3.19)

Където
– Функция за разпределение на учениците с н-1 степен на свобода.

Решаване на това уравнение за м, получаваме интервала
който надеждно  покрива неизвестния параметър м.

величина T , н-1, използва се за определяне на доверителния интервал на случайна променлива T(н-1), разпределени по t-тест с н-1 степен на свобода се нарича Студентски коефициент. Трябва да се намери по дадени стойности ни  от таблиците „Критични точки на разпределението на Студент“. (Таблица 6, Приложение 1), които представляват решения на уравнение (3.19).

В резултат на това получаваме следния израз точност доверителен интервал за оценка на математическото очакване (общо средно), ако дисперсията е неизвестна:

(3.20)

По този начин има обща формула за конструиране на доверителни интервали за математическото очакване на популацията:

където е точността на доверителния интервал в зависимост от известната или неизвестната дисперсия се намира по формули, съответно 3.16. и 3.20.

Проблем 10.Бяха проведени някои тестове, резултатите от които са посочени в таблицата:

Конструиране на доверителен интервал за математическото очакване на генералната съвкупност. Доверителни интервали за математическо очакване, дисперсия, вероятност

Нека една случайна променлива (може да говорим за генерална съвкупност) е разпределена по нормален закон, за който е известна дисперсията D = 2 (> 0). От генералната съвкупност (на набор от обекти, от които се определя случайна променлива) се прави извадка с размер n. Извадката x 1 , x 2 ,..., x n се разглежда като набор от n независими случайни променливи, разпределени по същия начин като (подхода, обяснен по-горе в текста).

Следните равенства също бяха обсъдени и доказани по-рано:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Достатъчно е просто да докажем (пропускаме доказателството), че случайната променлива в този случай също е разпределена по нормалния закон.

Нека означим неизвестното количество M с a и изберем, въз основа на дадената надеждност, числото d > 0, така че да е изпълнено условието:

P(- a< d) = (1)

Тъй като случайната променлива е разпределена по нормалния закон с математическо очакване M = M = a и дисперсия D = D /n = 2 /n, получаваме:

P(- a< d) =P(a - d < < a + d) =

Остава да изберем d така, че да е в сила равенството

За всяко едно можете да използвате таблицата, за да намерите число t, така че (t)= / 2. Това число t понякога се нарича квантил.

Сега от равенството

нека определим стойността на d:

Получаваме крайния резултат, като представяме формула (1) във формата:

Значението на последната формула е следното: с надеждност, доверителният интервал

обхваща неизвестния параметър a = M от популацията. Можем да го кажем по различен начин: точковата оценка определя стойността на параметъра M с точност d= t / и надеждност.

Задача. Нека има генерална съвкупност с определена характеристика, разпределена по нормален закон с дисперсия, равна на 6,25. Взет е размер на извадката от n = 27 и е получена средната извадкова стойност на характеристиката = 12. Намерете доверителен интервал, покриващ неизвестното математическо очакване на изследваната характеристика на генералната съвкупност с надеждност = 0,99.

Решение. Първо, използвайки таблицата за функцията на Лаплас, намираме стойността на t от равенството (t) = / 2 = 0,495. Въз основа на получената стойност t = 2,58 определяме точността на оценката (или половината от дължината на доверителния интервал) d: d = 2,52,58 / 1,24. От тук получаваме желания доверителен интервал: (10.76; 13.24).

статистическа хипотеза обща вариационна

Доверителен интервал за математическото очакване на нормално разпределение с неизвестна дисперсия

Нека е случайна променлива, разпределена по нормален закон с неизвестно математическо очакване M, което означаваме с буквата a. Нека направим извадка от обем n. Нека определим средната извадка и коригираната дисперсия на извадката s 2, като използваме известни формули.

Случайна стойност

разпределени по закона на Стюдънт с n - 1 степени на свобода.

Задачата е да се намери число t за дадена надеждност и броя на степените на свобода n - 1, така че равенството

или еквивалентно равенство

Тук в скоби е изписано условието стойността на неизвестния параметър a да принадлежи към определен интервал, който е доверителният интервал. Неговите граници зависят от надеждността, както и от параметрите на вземане на проби и s.

За да определим стойността на t по големина, трансформираме равенството (2) във формата:

Сега, използвайки таблицата за случайна променлива t, разпределена според закона на Стюдънт, използвайки вероятност 1 - и броя на степените на свобода n - 1, намираме t. Формула (3) дава отговор на поставения проблем.

Задача. При контролни тестове на 20 електрически лампи средната продължителност на тяхната работа е равна на 2000 часа със стандартно отклонение (изчислено като корен квадратен от коригираната дисперсия на извадката) равно на 11 часа. Известно е, че времето на работа на лампата е нормално разпределена случайна променлива. Определете с надеждност 0,95 доверителен интервал за математическото очакване на тази случайна променлива.

Решение. Стойност 1 - в този случай е равна на 0,05. Според таблицата за разпределение на Стюдънт, при брой степени на свобода, равен на 19, намираме: t = 2,093. Нека сега изчислим точността на оценката: 2,093121/ = 56,6. От тук получаваме необходимия доверителен интервал: (1943.4; 2056.6).

И др.. Всички те са оценки на техните теоретични аналози, които биха могли да бъдат получени, ако не беше налична извадка, а генерална съвкупност. Но уви, общото население е много скъпо и често недостъпно.

Концепцията за интервална оценка

Всяка примерна оценка има известно разпространение, защото е случайна променлива в зависимост от стойностите в конкретна проба. Следователно, за по-надеждни статистически заключения, трябва да се знае не само точковата оценка, но и интервалът, който с голяма вероятност γ (гама) обхваща оценявания индикатор θ (тета).

Формално това са две такива стойности (статистика) T 1 (X)И T 2 (X), Какво Т 1< T 2 , за които при дадено ниво на вероятност γ условието е изпълнено:

Накратко, вероятно е γ или повече истинският индикатор е между точките T 1 (X)И T 2 (X), които се наричат ​​долна и горна граница доверителен интервал.

Едно от условията за конструиране на доверителни интервали е неговата максимална стеснимост, т.е. трябва да е възможно най-кратък. Желанието е съвсем естествено, защото... изследователят се опитва да локализира по-точно местоположението на желания параметър.

От това следва, че доверителният интервал трябва да покрива максималните вероятности на разпределението. а самата оценка да е в центъра.

Тоест вероятността за отклонение (на истинския показател от оценката) нагоре е равна на вероятността за отклонение надолу. Трябва също да се отбележи, че за асиметричните разпределения интервалът отдясно не е равен на интервала отляво.

Фигурата по-горе ясно показва, че колкото по-голяма е вероятността за доверие, толкова по-широк е интервалът - пряка връзка.

Това беше кратко въведение в теорията за интервално оценяване на неизвестни параметри. Нека да преминем към намирането на доверителни граници за математическото очакване.

Доверителен интервал за математическо очакване

Ако оригиналните данни са разпределени върху , тогава средната стойност ще бъде нормална стойност. Това следва от правилото, че линейна комбинация от нормални стойности също има нормално разпределение. Следователно, за да изчислим вероятностите, можем да използваме математическия апарат на нормалния закон за разпределение.

Това обаче ще изисква познаване на два параметъра - очакване и дисперсия, които обикновено са неизвестни. Можете, разбира се, да използвате оценки вместо параметри (средно аритметично и), но тогава разпределението на средната стойност няма да бъде съвсем нормално, то ще бъде леко изравнено надолу. Този факт беше умело отбелязан от гражданина Уилям Госет от Ирландия, публикувайки откритието си в изданието от март 1908 г. на списание Biometrica. За целите на секретността Госет се е подписал Студент. Така се появи t-разпределението на Стюдънт.

Но нормалното разпределение на данните, използвано от К. Гаус при анализиране на грешките в астрономическите наблюдения, е изключително рядко в земния живот и е доста трудно да се установи (необходими са около 2 хиляди наблюдения за висока точност). Следователно най-добре е да се отхвърли предположението за нормалност и да се използват методи, които не зависят от разпространението на оригиналните данни.

Възниква въпросът: какво е разпределението на средноаритметичното, ако се изчислява от данните на неизвестно разпределение? Отговорът дава добре познатата в теорията на вероятностите Централна гранична теорема(CPT). В математиката има няколко негови варианта (формулировките са усъвършенствани през годините), но всички те, грубо казано, се свеждат до твърдението, че сумата от голям брой независими случайни променливи се подчинява на нормалния закон за разпределение.

При изчисляване на средноаритметичното се използва сумата от случайни променливи. Оттук се оказва, че средноаритметичното има нормално разпределение, в което очакването е очакването на оригиналните данни, а дисперсията е .

Умните хора знаят как да докажат CLT, но ние ще проверим това с помощта на експеримент, проведен в Excel. Нека симулираме извадка от 50 равномерно разпределени случайни променливи (с помощта на функцията на Excel RANDBETWEEN). След това ще направим 1000 такива проби и ще изчислим средноаритметичната стойност за всяка. Нека разгледаме тяхното разпространение.

Вижда се, че разпределението на средната е близко до нормалния закон. Ако размерът и броят на извадката са още по-големи, сходството ще бъде още по-добро.

Сега, след като видяхме със собствените си очи валидността на CLT, можем, използвайки , да изчислим доверителни интервали за средната аритметична стойност, които покриват истинската средна стойност или математическото очакване с дадена вероятност.

За да установите горната и долната граница, трябва да знаете параметрите на нормалното разпределение. По правило няма такива, така че се използват оценки: средноаритметичноИ дисперсия на извадката. Повтарям, този метод дава добро приближение само при големи проби. Когато извадките са малки, често се препоръчва да се използва разпределението на Student. да не повярвате! Разпределението на Стюдънт за средната стойност възниква само когато оригиналните данни са нормално разпределени, тоест почти никога. Ето защо е по-добре незабавно да зададете минимална лента за количеството необходими данни и да използвате асимптотично правилни методи. Казват, че 30 наблюдения са достатъчни. Вземете 50 - няма да сбъркате.

T 1.2– долна и горна граница на доверителния интервал

– средноаритметично извадково

s 0– стандартно отклонение на извадката (безпристрастно)

н – размер на извадката

γ – вероятност за доверие (обикновено равна на 0,9, 0,95 или 0,99)

c γ =Φ -1 ((1+γ)/2)– обратната стойност на стандартната функция на нормалното разпределение. Просто казано, това е броят на стандартните грешки от средната аритметична стойност до долната или горната граница (тези три вероятности съответстват на стойности от 1,64, 1,96 и 2,58).

Същността на формулата е, че се взема средноаритметичното и след това от него се отделя определена сума ( с γ) стандартни грешки ( s 0 /√n). Всичко е известно, вземете го и го помислете.

Преди широкото използване на персонални компютри те се използваха за получаване на стойностите на функцията на нормалното разпределение и нейната обратна функция. Те се използват и днес, но е по-ефективно да се използват готови формули на Excel. Всички елементи от горната формула ( , и ) могат лесно да бъдат изчислени в Excel. Но има готова формула за изчисляване на доверителния интервал - ДОВЕРИЕ.НОРМА. Синтаксисът му е следният.

CONFIDENCE.NORM(алфа;стандартно_изключено;размер)

алфа– ниво на значимост или ниво на достоверност, което в приетото по-горе означение е равно на 1- γ, т.е. вероятността математическитеочакването ще бъде извън доверителния интервал. При ниво на сигурност от 0,95, алфа е 0,05 и т.н.

standard_off– стандартно отклонение на извадкови данни. Няма нужда да изчислявате стандартната грешка; самият Excel ще раздели на корен от n.

размер– размер на извадката (n).

Резултатът от функцията CONFIDENCE NORM е вторият член от формулата за изчисляване на доверителния интервал, т.е. полуинтервал Съответно долната и горната точка са средната ± получената стойност.

По този начин е възможно да се конструира универсален алгоритъм за изчисляване на доверителните интервали за средноаритметичното, което не зависи от разпределението на оригиналните данни. Цената за универсалността е нейната асимптотична природа, т.е. необходимостта от използване на относително големи проби. В ерата на модерните технологии обаче събирането на необходимото количество данни обикновено не е трудно.

Тестване на статистически хипотези с помощта на доверителни интервали

(модул 111)

Един от основните проблеми, решавани в статистиката, е. Същността му е накратко следната. Прави се например предположение, че очакванията на общата съвкупност са равни на някаква стойност. След това се конструира разпределението на извадкови средни, които могат да бъдат наблюдавани за дадено очакване. След това те гледат къде в това условно разпределение се намира реалната средна стойност. Ако надхвърли допустимите граници, тогава появата на такава средна е много малко вероятна, а ако експериментът се повтори веднъж, това е почти невъзможно, което противоречи на изложената хипотеза, която е успешно отхвърлена. Ако средната стойност не надхвърля критичното ниво, тогава хипотезата не се отхвърля (но също така не се доказва!).

Така че с помощта на доверителни интервали, в нашия случай за очакване, можете също да тествате някои хипотези. Много лесно се прави. Да кажем, че средноаритметичната стойност за определена извадка е равна на 100. Тества се хипотезата, че очакваната стойност е да речем 90. Тоест, ако поставим въпроса примитивно, той звучи така: може ли да е така, че с истинската стойност на средната стойност, равна на 90, наблюдаваната средна стойност се оказва 100?

За да отговорите на този въпрос, ще ви трябва допълнително информация за стандартното отклонение и размера на извадката. Да приемем, че стандартното отклонение е 30 и броят на наблюденията е 64 (за лесно извличане на корена). Тогава стандартната грешка на средната стойност е 30/8 или 3,75. За да изчислите 95% доверителен интервал, ще трябва да добавите две стандартни грешки към всяка страна на средната стойност (по-точно 1,96). Доверителният интервал ще бъде приблизително 100±7,5 или от 92,5 до 107,5.

По-нататъшното разсъждение е следното. Ако тестваната стойност попада в доверителния интервал, това не противоречи на хипотезата, тъй като попада в границите на случайни флуктуации (с вероятност 95%). Ако проверяваната точка попада извън доверителния интервал, тогава вероятността за такова събитие е много малка, във всеки случай под приемливото ниво. Това означава, че хипотезата се отхвърля като противоречаща на наблюдаваните данни. В нашия случай хипотезата за очакваната стойност е извън доверителния интервал (тестваната стойност от 90 не е включена в интервала 100±7,5), така че трябва да бъде отхвърлена. Отговаряйки на примитивния въпрос по-горе, трябва да се каже: не, не може, във всеки случай това се случва изключително рядко. Често те показват конкретната вероятност за погрешно отхвърляне на хипотезата (p-ниво), а не определеното ниво, на което е конструиран доверителният интервал, но повече за това друг път.

Както можете да видите, конструирането на доверителен интервал за средната (или математическото очакване) не е трудно. Основното е да схванете същността и тогава нещата ще тръгнат. На практика в повечето случаи се използва 95% доверителен интервал, който е с ширина приблизително две стандартни грешки от двете страни на средната стойност.

Това е всичко за сега. Всичко най-хубаво!

Нека случайната променлива X на популацията е нормално разпределена, като се има предвид, че дисперсията и стандартното отклонение s на това разпределение са известни. Изисква се да се оцени неизвестното математическо очакване, като се използва средната стойност на извадката. В този случай задачата се свежда до намиране на доверителен интервал за математическото очакване с надеждност b. Ако посочите стойността на доверителната вероятност (надеждност) b, тогава можете да намерите вероятността да попаднете в интервала за неизвестното математическо очакване, като използвате формула (6.9a):

където Ф(t) е функцията на Лаплас (5.17а).

В резултат на това можем да формулираме алгоритъм за намиране на границите на доверителния интервал за математическото очакване, ако дисперсията D = s 2 е известна:

  1. Задайте стойността на надеждност – b.
  2. От (6.14) изразете Ф(t) = 0,5 × b. Изберете стойността на t от таблицата за функцията на Лаплас въз основа на стойността Ф(t) (вижте Приложение 1).
  3. Изчислете отклонението e, като използвате формула (6.10).
  4. Запишете доверителен интервал, като използвате формула (6.12), така че с вероятност b да е валидно неравенството:

.

Пример 5.

Случайната променлива X има нормално разпределение. Намерете доверителни интервали за оценка с надеждност b = 0,96 на неизвестното математическо очакване a, ако е дадено:

1) общо стандартно отклонение s = 5;

2) средна стойност на извадката;

3) размер на извадката n = 49.

Във формула (6.15) на интервалната оценка на математическото очакване А с надеждност b всички величини с изключение на t са известни. Стойността на t може да се намери с помощта на (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Използвайки таблицата в Приложение 1 за функцията на Лаплас Ф(t) = 0,48, намерете съответната стойност t = 2,06. следователно . Като заместите изчислената стойност на e във формула (6.12), можете да получите доверителен интервал: 30-1,47< a < 30+1,47.

Необходимият доверителен интервал за оценка с надеждност b = 0,96 на неизвестното математическо очакване е равен на: 28,53< a < 31,47.

х аз

Известно е, че те се подчиняват на закона за нормалното разпределение с
. Намерете рейтинг м* за математическо очакване м, изградете 90% доверителен интервал за него.

Решение:

Така, м(2.53;5.47).

Проблем 11.Дълбочината на морето се измерва с устройство, чиято системна грешка е 0, а случайните грешки се разпределят по нормалния закон със стандартно отклонение =15м. Колко независими измервания трябва да се направят, за да се определи дълбочината с грешки не повече от 5 m при ниво на сигурност 90%?

Решение:

Според условията на проблема, който имаме хN( м; ), Където =15 м, =5m, =0,9. Нека намерим обема н.

1) При дадена надеждност = 0,9 намираме от Таблици 3 (Приложение 1) аргумента на функцията на Лаплас u = 1.65.

2) Познаване на определената точност на оценката =u=5, да намерим
. Ние имаме

. Следователно броят на тестовете н25.

Проблем 12.Температурно вземане на проби Tза първите 6 дни на януари е представен в таблицата:

Намерете доверителния интервал за математическото очакване мпопулация с надеждна вероятност
и изчислете общото стандартно отклонение с.

Решение:


И
.

2) Безпристрастна оценка намерете го с помощта на формулата
:

=-175

=234.84

;
;

=-192

=116


.

3) Тъй като общата дисперсия е неизвестна, но нейната оценка е известна, тогава да се оцени математическото очакване мизползваме разпределението на Стюдънт (Таблица 6, Приложение 1) и формула (3.20).

защото н 1 =н 2 =6, тогава,
, с 1 =6,85 имаме:
, следователно -29.2-4.1<м 1 < -29.2+4.1.

Следователно -33,3<м 1 <-25.1.

По подобен начин имаме,
, с 2 = 4,8, така че

–34.9< м 2 < -29.1. Тогда доверительные интервалы примут вид: м 1 (-33,3;-25,1) и м 2 (-34.9;-29.1).

В приложните науки, например в строителните дисциплини, за оценка на точността на обектите се използват таблици с доверителни интервали, които са дадени в съответната справочна литература.

В статистиката има два вида оценки: точкови и интервални. Точкова оценкае единична примерна статистика, която се използва за оценка на параметър на популацията. Например средната стойност на извадката е точкова оценка на математическото очакване на популацията и дисперсията на извадката S 2- точкова оценка на дисперсията на популацията σ 2. доказано е, че средната стойност на извадката е безпристрастна оценка на математическите очаквания на населението. Извадковата средна стойност се нарича безпристрастна, защото средната стойност на всички извадкови средни (с еднакъв размер на извадката) н) е равно на математическото очакване на генералната съвкупност.

За да може пробата да варира S 2стана безпристрастна оценка на дисперсията на популацията σ 2, знаменателят на дисперсията на извадката трябва да бъде равен на н – 1 , но не н. С други думи, дисперсията на съвкупността е средната стойност на всички възможни дисперсии на извадката.

Когато се оценяват параметрите на популацията, трябва да се има предвид, че извадкови статистики като напр , зависят от конкретни проби. Да се ​​вземе предвид този факт, да се получи интервална оценкаматематическо очакване на генералната съвкупност, анализирайте разпределението на извадковите средни стойности (за повече подробности вижте). Конструираният интервал се характеризира с определено ниво на достоверност, което представлява вероятността истинският параметър на популацията да бъде оценен правилно. Подобни доверителни интервали могат да се използват за оценка на дела на дадена характеристика Ри основната разпределена маса от населението.

Изтеглете бележката в или формат, примери във формат

Конструиране на доверителен интервал за математическото очакване на популацията с известно стандартно отклонение

Конструиране на доверителен интервал за дела на признак в съвкупността

Този раздел разширява концепцията за доверителен интервал до категорични данни. Това ни позволява да оценим дела на характеристиката в популацията Ризползване на примерен дял РС= X/н. Както е посочено, ако количествата нРИ н(1 – p)надвишава числото 5, биномното разпределение може да се апроксимира като нормално. Следователно, за да се оцени делът на дадена характеристика в популацията Рвъзможно е да се конструира интервал, чието ниво на достоверност е равно на (1 – α)х100%.


Където стрС- примерен дял на характеристиката, равен на Х/н, т.е. брой успехи, разделен на размера на извадката, Р- делът на характеристиката в общата съвкупност, З- критична стойност на стандартизираното нормално разпределение, н- размер на извадката.

Пример 3.Да приемем, че от информационната система е извлечена извадка, състояща се от 100 фактури, попълнени през последния месец. Да приемем, че 10 от тези фактури са съставени с грешки. По този начин, Р= 10/100 = 0,1. Нивото на достоверност от 95% съответства на критичната стойност Z = 1,96.

Така вероятността между 4,12% и 15,88% от фактурите да съдържат грешки е 95%.

За даден размер на извадката доверителният интервал, съдържащ дела на характеристиката в популацията, изглежда по-широк, отколкото за непрекъсната случайна променлива. Това е така, защото измерванията на непрекъсната случайна променлива съдържат повече информация, отколкото измерванията на категорични данни. С други думи, категоричните данни, които приемат само две стойности, не съдържат достатъчно информация за оценка на параметрите на тяхното разпределение.

INизчисляване на оценки, извлечени от крайна популация

Оценка на математическото очакване.Корекционен фактор за крайната популация ( fpc) се използва за намаляване на стандартната грешка с фактор. При изчисляването на доверителните интервали за оценките на параметрите на популацията се прилага корекционен фактор в ситуации, при които се вземат проби, без да бъдат върнати. По този начин доверителният интервал за математическото очакване има ниво на достоверност, равно на (1 – α)х100%, се изчислява по формулата:

Пример 4.За да илюстрираме използването на корекционния коефициент за ограничена популация, нека се върнем към проблема за изчисляване на доверителния интервал за средната сума на фактурите, обсъден по-горе в Пример 3. Да предположим, че една компания издава 5000 фактури на месец и Х=110,27 долара, С= $28,95, н = 5000, н = 100, α = 0,05, t 99 = 1,9842. Използвайки формула (6), получаваме:

Оценка на дела на характеристика.При избор без връщане доверителният интервал за съотношението на атрибута с ниво на достоверност, равно на (1 – α)х100%, се изчислява по формулата:

Интервали на доверие и етични проблеми

При вземане на проби от популация и изготвяне на статистически заключения често възникват етични проблеми. Основният е как се съгласуват доверителните интервали и точковите оценки на извадковата статистика. Публикуването на приблизителни точки без уточняване на свързаните доверителни интервали (обикновено при 95% ниво на доверителност) и размера на извадката, от който те са получени, може да създаде объркване. Това може да създаде у потребителя впечатлението, че точковата оценка е точно това, от което се нуждае, за да предвиди свойствата на цялата популация. Следователно е необходимо да се разбере, че във всяко изследване фокусът трябва да бъде не върху точкови оценки, а върху интервални оценки. Освен това трябва да се обърне специално внимание на правилния избор на размери на пробите.

Най-често обект на статистическа манипулация са резултатите от социологически проучвания на населението по определени политически въпроси. В същото време резултатите от проучването се публикуват на първите страници на вестниците, а грешката на извадката и методологията за статистически анализ се публикуват някъде по средата. За доказване на валидността на получените точкови оценки е необходимо да се посочи размерът на извадката, на базата на която са получени, границите на доверителния интервал и нивото му на значимост.

Следваща бележка

Използвани са материали от книгата Левин и др.Статистика за мениджъри. – М.: Уилямс, 2004. – стр. 448–462

Централна гранична теоремазаявява, че с достатъчно голям размер на извадката, извадковото разпределение на средните стойности може да бъде апроксимирано чрез нормално разпределение. Това свойство не зависи от типа разпределение на населението.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи