95 разлика в доверителния интервал от sd. Доверителен интервал

Често оценителят трябва да анализира пазара на недвижими имоти в сегмента, в който се намира оценяваният имот. Ако пазарът е развит, може да бъде трудно да се анализира целия набор от представени обекти, така че за анализ се използва извадка от обекти. Тази извадка не винаги се оказва хомогенна, понякога е необходимо да я изчистите от екстремни точки - твърде високи или твърде ниски пазарни оферти. За тази цел се използва доверителен интервал. Целта на това изследване е да се извърши сравнителен анализ на два метода за изчисляване на доверителния интервал и да се избере оптималната опция за изчисление при работа с различни проби в системата estimatica.pro.

Доверителният интервал е интервал от стойности на атрибути, изчислени въз основа на извадка, която с известна вероятност съдържа оценения параметър на генералната съвкупност.

Смисълът на изчисляването на доверителния интервал е да се конструира такъв интервал въз основа на извадкови данни, така че да може да се твърди с дадена вероятност, че стойността на оценения параметър е в този интервал. С други думи, доверителният интервал съдържа неизвестната стойност на прогнозната стойност с определена вероятност. Колкото по-широк е интервалът, толкова по-голяма е неточността.

Има различни методи за определяне на доверителния интервал. В тази статия ще разгледаме 2 метода:

  • чрез медианата и стандартното отклонение;
  • чрез критичната стойност на t-статистиката (коефициент на Стюдънт).

Етапи на сравнителен анализ на различни методи за изчисляване на CI:

1. формира извадка от данни;

2. обработваме го чрез статистически методи: изчисляваме средна стойност, медиана, дисперсия и др.;

3. изчисляване на доверителния интервал по два начина;

4. анализирайте почистените проби и получените доверителни интервали.

Етап 1. Извадка от данни

Извадката е формирана чрез системата estimatica.pro. Извадката включва 91 оферти за продажба на 1-стайни апартаменти в 3-та ценова зона с тип "Хрушчов".

Таблица 1. Първоначална проба

Цена 1 кв.м., ед

Фиг. 1. Първоначална проба



Етап 2. Обработка на първоначалната проба

Обработката на извадка с помощта на статистически методи изисква изчисляване на следните стойности:

1. Средно аритметично

2. Медианата е число, характеризиращо извадката: точно половината от елементите на извадката са по-големи от медианата, другата половина са по-малки от медианата

(за извадка с нечетен брой стойности)

3. Диапазон - разликата между максималните и минималните стойности в извадката

4. Дисперсия - използва се за по-точна оценка на вариацията на данните

5. Стандартното отклонение на извадката (наричано по-нататък - SD) е най-често срещаният индикатор за дисперсията на коригиращите стойности около средноаритметичната стойност.

6. Коефициент на вариация - отразява степента на разсейване на коригиращите стойности

7. коефициент на колебание - отразява относителното колебание на екстремните ценови стойности в извадката около средната

Таблица 2. Статистически показатели на оригиналната извадка

Коефициентът на вариация, който характеризира хомогенността на данните, е 12,29%, но коефициентът на колебание е твърде висок. По този начин можем да кажем, че оригиналната извадка не е хомогенна, така че нека да преминем към изчисляване на доверителния интервал.

Етап 3. Изчисляване на доверителния интервал

Метод 1. Изчисляване с използване на медианата и стандартното отклонение.

Доверителният интервал се определя, както следва: минимална стойност - стандартното отклонение се изважда от медианата; максимална стойност - стандартното отклонение се добавя към медианата.

Така доверителният интервал (47179 CU; 60689 CU)

Ориз. 2. Стойности, попадащи в доверителен интервал 1.



Метод 2. Конструиране на доверителен интервал с помощта на критичната стойност на t-статистиката (коефициент на Стюдънт)

С.В. Грибовски в книгата си „Математически методи за оценка на стойността на имота” описва метод за изчисляване на доверителния интервал чрез коефициента на Стюдънт. Когато изчислява с помощта на този метод, оценителят трябва сам да зададе нивото на значимост ∝, което определя вероятността, с която ще бъде конструиран доверителният интервал. Обикновено се използват нива на значимост от 0,1; 0,05 и 0,01. Те съответстват на доверителни вероятности от 0,9; 0,95 и 0,99. С този метод се приема, че истинските стойности на математическото очакване и дисперсията са практически неизвестни (което почти винаги е вярно при решаване на практически проблеми с оценка).

Формула за доверителен интервал:

n - размер на извадката;

Критичната стойност на t-статистиката (разпределение на Стюдънт) с ниво на значимост ∝, броят на степените на свобода n-1, което се определя от специални статистически таблици или с помощта на MS Excel (→"Статистически"→ STUDIST);

∝ - ниво на значимост, приемете ∝=0,01.

Ориз. 2. Стойности, попадащи в доверителния интервал 2.

Етап 4. Анализ на различни методи за изчисляване на доверителния интервал

Два метода за изчисляване на доверителния интервал - чрез медианата и коефициента на Стюдънт - доведоха до различни стойности на интервалите. Съответно получихме две различни почистени проби.

Таблица 3. Статистика за три проби.

Индекс

Първоначална проба

1 вариант

Вариант 2

Средна стойност

дисперсия

Коеф. вариации

Коеф. трептения

Брой излезли от експлоатация обекти, бр.

Въз основа на извършените изчисления можем да кажем, че стойностите на доверителния интервал, получени по различни методи, се пресичат, така че можете да използвате всеки от методите за изчисление по преценка на оценителя.

Ние обаче смятаме, че при работа в системата estimatica.pro е препоръчително да изберете метод за изчисляване на доверителния интервал в зависимост от степента на развитие на пазара:

  • ако пазарът е неразвит, използвайте метода за изчисление, като използвате медианата и стандартното отклонение, тъй като броят на пенсионираните обекти в този случай е малък;
  • ако пазарът е развит, приложете изчислението чрез критичната стойност на t-статистиката (коефициент на Стюдънт), тъй като е възможно да се формира голяма първоначална извадка.

При изготвянето на статията са използвани:

1. Грибовски С.В., Сивец С.А., Левикина И.А. Математически методи за оценка на стойността на имотите. Москва, 2014 г

2. Системни данни estimatica.pro

Доверителни интервали ( Английски Доверителни интервали) един от видовете интервални оценки, използвани в статистиката, които се изчисляват за дадено ниво на значимост. Те ни позволяват да направим твърдението, че истинската стойност на неизвестен статистически параметър на съвкупността е в рамките на получения диапазон от стойности с вероятност, която е определена от избраното ниво на статистическа значимост.

Нормална дистрибуция

Когато дисперсията (σ 2) на съвкупността от данни е известна, z-резултатът може да се използва за изчисляване на доверителните граници (крайните точки на доверителния интервал). В сравнение с използването на t-разпределението, използването на z-резултат ще ви позволи да конструирате не само по-тесен доверителен интервал, но и по-надеждни оценки на очакваната стойност и стандартното отклонение (σ), тъй като z-резултатът се основава на нормална дистрибуция.

Формула

За определяне на граничните точки на доверителния интервал, при условие че е известно стандартното отклонение на съвкупността от данни, се използва следната формула

L = X - Z α/2 σ
√n

Пример

Да приемем, че размерът на извадката е 25 наблюдения, очакваната стойност на извадката е 15, а стандартното отклонение на популацията е 8. За ниво на значимост от α=5%, Z-резултатът е Z α/2 =1,96. В този случай долната и горната граница на доверителния интервал ще бъдат

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Така можем да кажем, че с 95% вероятност математическото очакване на населението ще попадне в диапазона от 11.864 до 18.136.

Методи за стесняване на доверителния интервал

Нека приемем, че диапазонът е твърде широк за целите на нашето изследване. Има два начина за намаляване на диапазона на доверителния интервал.

  1. Намалете нивото на статистическа значимост α.
  2. Увеличете размера на извадката.

Намалявайки нивото на статистическа значимост до α=10%, получаваме Z-резултат, равен на Z α/2 =1,64. В този случай долната и горната граница на интервала ще бъдат

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

И самият доверителен интервал може да бъде записан във формата

В този случай можем да направим предположението, че с 90% вероятност математическото очакване на населението ще попадне в диапазона .

Ако искаме да не намаляваме нивото на статистическа значимост α, тогава единствената алтернатива е да увеличим размера на извадката. Увеличавайки го до 144 наблюдения, получаваме следните стойности на границите на доверие

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Самият доверителен интервал ще има следната форма

По този начин стесняването на доверителния интервал без намаляване на нивото на статистическа значимост е възможно само чрез увеличаване на размера на извадката. Ако увеличаването на размера на извадката не е възможно, тогава стесняването на доверителния интервал може да се постигне единствено чрез намаляване на нивото на статистическа значимост.

Конструиране на доверителен интервал за разпределение, различно от нормалното

Ако стандартното отклонение на популацията не е известно или разпределението е различно от нормалното, t-разпределението се използва за конструиране на доверителен интервал. Тази техника е по-консервативна, което се отразява в по-широки доверителни интервали в сравнение с техниката, базирана на Z-скора.

Формула

За да изчислите долната и горната граница на доверителния интервал въз основа на t-разпределението, използвайте следните формули

L = X - t α σ
√n

Разпределението на Студент или t-разпределението зависи само от един параметър - броя на степените на свобода, който е равен на броя на отделните стойности на атрибута (броя наблюдения в извадката). Стойността на t-критерия на Стюдънт за даден брой степени на свобода (n) и нивото на статистическа значимост α могат да бъдат намерени в референтните таблици.

Пример

Да приемем, че размерът на извадката е 25 индивидуални стойности, очакваната стойност на извадката е 50, а стандартното отклонение на извадката е 28. Необходимо е да се изгради доверителен интервал за нивото на статистическа значимост α=5%.

В нашия случай броят на степените на свобода е 24 (25-1), следователно съответната таблична стойност на t-теста на Student за нивото на статистическа значимост α=5% е 2,064. Следователно долната и горната граница на доверителния интервал ще бъдат

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

И самият интервал може да бъде записан във формата

Така можем да кажем, че с 95% вероятност математическото очакване на населението ще бъде в диапазона .

Използването на разпределението t ви позволява да стесните доверителния интервал или чрез намаляване на статистическата значимост, или чрез увеличаване на размера на извадката.

Като намалим статистическата значимост от 95% на 90% в условията на нашия пример, получаваме съответната таблична стойност на t-теста на Стюдънт от 1,711.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

В този случай можем да кажем, че с 90% вероятност математическото очакване на населението ще бъде в диапазона .

Ако не искаме да намалим статистическата значимост, тогава единствената алтернатива е да увеличим размера на извадката. Да кажем, че това са 64 индивидуални наблюдения, а не 25, както е в първоначалното състояние на примера. Табличната стойност на t-теста на Стюдънт за 63 степени на свобода (64-1) и ниво на статистическа значимост α=5% е 1,998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Това ни позволява да кажем, че с 95% вероятност математическото очакване на населението ще бъде в диапазона .

Големи проби

Големите извадки са извадки от съвкупност от данни, в която броят на индивидуалните наблюдения надвишава 100. Статистическите проучвания показват, че по-големите извадки са склонни да бъдат нормално разпределени, дори ако разпределението на популацията не е нормално. В допълнение, за такива проби използването на z-резултат и t-разпределение дава приблизително еднакви резултати при конструиране на доверителни интервали. По този начин за големи проби е приемливо да се използва z-резултат за нормалното разпределение вместо t-разпределението.

Нека обобщим

Доверителни интервали.

Изчисляването на доверителния интервал се основава на средната грешка на съответния параметър. Доверителен интервал показва в какви граници с вероятност (1-a) се намира истинската стойност на оценения параметър. Тук a е нивото на значимост, (1-a) се нарича също доверителна вероятност.

В първата глава показахме, че например за средноаритметичната стойност истинската средна стойност на съвкупността в приблизително 95% от случаите е в рамките на 2 стандартни грешки от средната стойност. По този начин границите на 95% доверителен интервал за средната стойност ще бъдат отделени от средната стойност на извадката с двойната средна грешка на средната стойност, т.е. ние умножаваме средната грешка на средната стойност по определен коефициент в зависимост от нивото на достоверност. За средната стойност и разликата на средните стойности се взема коефициентът на Стюдънт (критичната стойност на теста на Стюдънт), за дела и разликата на дяловете - критичната стойност на критерия z. Произведението на коефициента и средната грешка може да се нарече максимална грешка на даден параметър, т.е. максималното, което можем да получим, когато го оценяваме.

Доверителен интервал за средноаритметично : .

Ето примерната средна стойност;

Средна грешка на средноаритметичната стойност;

с -извадково стандартно отклонение;

н

f = n-1 (Коефициент на ученика).

Доверителен интервал за разлики на средните аритметични :

Ето разликата между примерните средни стойности;

- средна грешка на разликата между средните аритметични;

s 1, s 2 –извадкови стандартни отклонения;

n1,n2

Критичната стойност на теста на Стюдънт за дадено ниво на значимост а и броя на степените на свобода f=n 1 +n 2-2 (Коефициент на ученика).

Доверителен интервал за акции :

.

Тук d е фракцията на пробата;

– средна дробна грешка;

н– размер на извадката (размер на групата);

Доверителен интервал за разлика в дяловете :

Ето разликата в примерните дялове;

– средна грешка на разликата между средните аритметични;

n1,n2– обеми на пробите (брой групи);

Критичната стойност на критерия z при дадено ниво на значимост a ( , , ).

Чрез изчисляване на доверителните интервали за разликата между индикаторите, ние, първо, директно виждаме възможните стойности на ефекта, а не само неговата точкова оценка. Второ, можем да направим заключение относно приемането или отхвърлянето на нулевата хипотеза и, трето, можем да направим заключение относно силата на теста.

Когато тествате хипотези с помощта на доверителни интервали, трябва да се придържате към следното правило:

Ако 100(1-a) процентният доверителен интервал на разликата в средните стойности не съдържа нула, тогава разликите са статистически значими при ниво на значимост a; напротив, ако този интервал съдържа нула, тогава разликите не са статистически значими.

Наистина, ако този интервал съдържа нула, това означава, че сравняваният показател може да бъде по-голям или по-малък в една от групите в сравнение с другата, т.е. наблюдаваните разлики се дължат на случайност.

Мощността на теста може да се прецени по местоположението на нулата в рамките на доверителния интервал. Ако нулата е близо до долната или горната граница на интервала, тогава е възможно при по-голям брой сравнявани групи разликите да достигнат статистическа значимост. Ако нулата е близо до средата на интервала, това означава, че както увеличението, така и намаляването на показателя в експерименталната група са еднакво вероятни и вероятно наистина няма разлики.

Примери:

За да се сравни хирургическата смъртност при използване на два различни вида анестезия: 61 души са оперирани с първия вид анестезия, 8 са починали, с втория тип - 67 души, 10 са починали.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Разликата в леталността на сравняваните методи ще бъде в диапазона (-0,018 - 0,122; -0,018 + 0,122) или (-0,14; 0,104) с вероятност 100(1-a) = 95%. Интервалът съдържа нула, т.е. не може да се отхвърли хипотезата за еднаква смъртност при два различни типа анестезия.

По този начин смъртността може и ще намалее до 14% и ще се увеличи до 10,4% с вероятност от 95%, т.е. нула е приблизително в средата на интервала, така че може да се твърди, че най-вероятно тези два метода наистина не се различават по смъртност.

В примера, обсъден по-рано, средното време на натискане по време на теста за потупване беше сравнено в четири групи студенти, различаващи се по резултати от изпита. Нека изчислим доверителните интервали за средното време за пресоване за студенти, които са издържали изпита с оценки 2 и 5, и доверителния интервал за разликата между тези средни стойности.

Коефициентите на Стюдънт се намират с помощта на таблиците за разпределение на Стюдънт (виж приложението): за първа група: = t(0,05;48) = 2,011; за втората група: = t(0,05;61) = 2,000. Така доверителните интервали за първата група: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), за втората група (156,55- 2000*1,88; 156,55+2000*1,88) = (152,8 ; 160.3). Така за тези, които са издържали изпита с 2, средното време на натискане варира от 157,8 ms до 166,6 ms с вероятност от 95%, за тези, които са издържали изпита с 5 – от 152,8 ms до 160,3 ms с вероятност от 95% .

Можете също така да тествате нулевата хипотеза, като използвате доверителни интервали за средни стойности, а не само за разликата в средните стойности. Например, както в нашия случай, ако доверителните интервали за средните се припокриват, тогава нулевата хипотеза не може да бъде отхвърлена. За да се отхвърли хипотеза при избрано ниво на значимост, съответните доверителни интервали не трябва да се припокриват.

Да намерим доверителния интервал за разликата в средното време на пресоване в групите, издържали изпита с оценки 2 и 5. Разлика на средните стойности: 162.19 – 156.55 = 5.64. Коефициент на Студент: = t(0.05;49+62-2) = t(0.05;109) = 1.982. Груповите стандартни отклонения ще бъдат равни на: ; . Изчисляваме средната грешка на разликата между средните: . Доверителен интервал: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Така че разликата в средното време на пресоване в групите, издържали изпита с 2 и 5, ще бъде в диапазона от -0,044 ms до 11,33 ms. Този интервал включва нула, т.е. Средното време за пресоване за тези, които са издържали добре изпита, може или да се увеличи, или да намалее в сравнение с тези, които са издържали изпита незадоволително, т.е. нулевата хипотеза не може да бъде отхвърлена. Но нулата е много близо до долната граница и е много по-вероятно времето за пресоване да намалее за тези, които са преминали добре. По този начин можем да заключим, че все още има разлики в средното време на пресоване между тези, които са преминали 2 и 5, просто не можахме да ги открием предвид промяната в средното време, разпространението на средното време и размерите на извадката.



Силата на теста е вероятността за отхвърляне на неправилна нулева хипотеза, т.е. открийте разликите там, където те действително съществуват.

Силата на теста се определя въз основа на нивото на значимост, големината на разликите между групите, разпространението на стойностите в групите и размера на извадките.

За t теста на Стюдънт и дисперсионния анализ могат да се използват диаграми на чувствителността.

Силата на критерия може да се използва за предварително определяне на необходимия брой групи.

Доверителният интервал показва в какви граници се намира истинската стойност на оценения параметър с дадена вероятност.

Използвайки доверителни интервали, можете да тествате статистически хипотези и да правите заключения относно чувствителността на критериите.

ЛИТЕРАТУРА.

Гланц С. – Глава 6,7.

Реброва О.Ю. – с.112-114, с.171-173, с.234-238.

Сидоренко Е.В. – с.32-33.

Въпроси за самопроверка на учениците.

1. Каква е силата на критерия?

2. В какви случаи е необходимо да се оцени силата на критериите?

3. Методи за изчисляване на мощността.

6. Как да тестваме статистическа хипотеза с помощта на доверителен интервал?

7. Какво може да се каже за силата на критерия при изчисляване на доверителния интервал?

Задачи.

Доверителен интервал за математическо очакване - това е интервал, изчислен от данни, които с известна вероятност съдържат математическото очакване на генералната съвкупност. Естествена оценка за математическото очакване е средноаритметичното на неговите наблюдавани стойности. Затова през целия урок ще използваме термините „средна стойност“ и „средна стойност“. При проблеми с изчисляване на доверителен интервал най-често изискваният отговор е нещо като „Доверителният интервал на средното число [стойност в определен проблем] е от [по-малка стойност] до [по-голяма стойност].“ Използвайки доверителен интервал, можете да оцените не само средните стойности, но и съотношението на определена характеристика на общата съвкупност. В урока се разглеждат средни стойности, дисперсия, стандартно отклонение и грешка, чрез които ще стигнем до нови определения и формули Характеристики на извадката и съвкупността .

Точкови и интервални оценки на средната стойност

Ако средната стойност на съвкупността се оценява с число (точка), тогава специфична средна стойност, която се изчислява от извадка от наблюдения, се приема като оценка на неизвестната средна стойност на съвкупността. В този случай стойността на извадковата средна - случайна променлива - не съвпада със средната стойност на генералната съвкупност. Следователно, когато посочвате средната стойност на извадката, трябва едновременно да посочите грешката на извадката. Мярката за извадкова грешка е стандартната грешка, която се изразява в същите единици като средната стойност. Поради това често се използва следното обозначение: .

Ако оценката на средната стойност трябва да бъде свързана с определена вероятност, тогава параметърът от интерес в съвкупността трябва да бъде оценен не с едно число, а с интервал. Доверителният интервал е интервал, в който с определена вероятност Пнамира се стойността на прогнозния индикатор за населението. Доверителен интервал, в който е вероятно П = 1 - α се намира случайната променлива, изчислена както следва:

,

α = 1 - П, който може да се намери в приложението към почти всяка книга по статистика.

На практика средната стойност на съвкупността и дисперсията не са известни, така че дисперсията на популацията се заменя с дисперсията на извадката, а средната популация с извадковата средна стойност. По този начин доверителният интервал в повечето случаи се изчислява, както следва:

.

Формулата на доверителния интервал може да се използва за оценка на средната популация if

  • стандартното отклонение на съвкупността е известно;
  • или стандартното отклонение на популацията е неизвестно, но размерът на извадката е по-голям от 30.

Средната стойност на извадката е безпристрастна оценка на средната стойност на популацията. На свой ред дисперсията на извадката не е безпристрастна оценка на дисперсията на популацията. За да получите безпристрастна оценка на дисперсията на популацията във формулата за дисперсия на извадката, размер на извадката нтрябва да се замени с н-1.

Пример 1.От 100 произволно избрани кафенета в даден град е събрана информация, че средният брой служители в тях е 10,5 при стандартно отклонение от 4,6. Определете 95% доверителен интервал за броя на служителите в кафенето.

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

По този начин 95% доверителен интервал за средния брой служители в кафенето варира от 9,6 до 11,4.

Пример 2.За произволна извадка от популация от 64 наблюдения бяха изчислени следните общи стойности:

сбор от стойности в наблюденията,

сума на квадратните отклонения на стойностите от средната .

Изчислете 95% доверителен интервал за математическото очакване.

Нека изчислим стандартното отклонение:

,

Нека изчислим средната стойност:

.

Заменяме стойностите в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

Така 95% доверителният интервал за математическото очакване на тази извадка варира от 7,484 до 11,266.

Пример 3.За произволна популационна извадка от 100 наблюдения изчислената средна стойност е 15,2, а стандартното отклонение е 3,2. Изчислете 95% доверителен интервал за очакваната стойност, след това 99% доверителен интервал. Ако мощността на извадката и нейната вариация останат непроменени и коефициентът на доверие се увеличи, ще се стесни или разшири доверителният интервал?

Заменяме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,05 .

Получаваме:

.

По този начин 95% доверителен интервал за средната стойност на тази проба варира от 14,57 до 15,82.

Отново заместваме тези стойности в израза за доверителния интервал:

където е критичната стойност на стандартното нормално разпределение за нивото на значимост α = 0,01 .

Получаваме:

.

Така 99% доверителният интервал за средната стойност на тази проба варира от 14,37 до 16,02.

Както виждаме, с увеличаването на коефициента на доверие критичната стойност на стандартното нормално разпределение също се увеличава и следователно началната и крайната точка на интервала са разположени по-далеч от средната стойност и по този начин интервалът на доверие за математическото очакване се увеличава .

Точкови и интервални оценки на специфичното тегло

Делът на някакъв примерен атрибут може да се интерпретира като точкова оценка на дела стрсъс същата характеристика в общата популация. Ако тази стойност трябва да бъде свързана с вероятност, тогава трябва да се изчисли доверителният интервал на специфичното тегло стрхарактеристика в популацията с вероятност П = 1 - α :

.

Пример 4.В някой град има двама кандидати АИ бсе кандидатират за кмет. На случаен принцип са анкетирани 200 жители на града, от които 46% са отговорили, че биха гласували за кандидата А, 26% - за кандидата ба 28% не знаят за кого ще гласуват. Определете 95% доверителен интервал за дела на жителите на града, подкрепящи кандидата А.

Всяка извадка дава само приблизителна представа за генералната съвкупност и всички статистически характеристики на извадката (средна стойност, режим, дисперсия...) са някакво приближение или да речем оценка на общи параметри, които в повечето случаи не е възможно да се изчислят поради до недостъпността на общото население (Фигура 20) .

Фигура 20. Грешка при вземане на проби

Но можете да посочите интервала, в който с определена степен на вероятност се намира истинската (обща) стойност на статистическата характеристика. Този интервал се нарича д доверителен интервал (CI).

Така че общата средна стойност с вероятност от 95% е в рамките

от до, (20)

Където T – таблична стойност на теста на Студент за α =0,05 и f= н-1

В този случай може да се намери и 99% CI T избран за α =0,01.

Какво е практическото значение на доверителния интервал?

    Широкият доверителен интервал показва, че средната стойност на извадката не отразява точно средната стойност на популацията. Това обикновено се дължи на недостатъчен размер на извадката или на нейната хетерогенност, т.е. голяма дисперсия. И двете дават по-голяма грешка на средната стойност и съответно по-широк CI. И това е основата за връщане към етапа на планиране на изследванията.

    Горната и долната граница на CI дават оценка дали резултатите ще бъдат клинично значими

Нека се спрем по-подробно на въпроса за статистическата и клиничната значимост на резултатите от изследването на груповите свойства. Нека си припомним, че задачата на статистиката е да открие поне някои разлики в общите популации въз основа на извадкови данни. Предизвикателството за клиницистите е да открият разлики (не каквито и да е), които ще подпомогнат диагнозата или лечението. А статистическите заключения не винаги са основа за клинични заключения. По този начин, статистически значимо понижение на хемоглобина с 3 g/l не е причина за безпокойство. И обратно, ако някакъв проблем в човешкото тяло не е разпространен на ниво цялото население, това не е причина да не се справяме с този проблем.

Нека да разгледаме тази ситуация пример.

Изследователите се чудеха дали момчетата, които са страдали от някакво инфекциозно заболяване, изостават от връстниците си в растеж. За целта е проведено извадково изследване, в което са участвали 10 момчета, страдащи от това заболяване. Резултатите са представени в Таблица 23.

Таблица 23. Резултати от статистическа обработка

долна граница

горен лимит

Стандарти (cm)

средно аритметично

От тези изчисления следва, че извадковият среден ръст на 10-годишните момчета, преболедували някакво инфекциозно заболяване, е близък до нормалния (132,5 cm). Но долната граница на доверителния интервал (126,6 cm) показва, че има 95% вероятност истинският среден ръст на тези деца да съответства на понятието „нисък ръст“, т.е. тези деца са закърнели.

В този пример резултатите от изчисленията на доверителния интервал са клинично значими.

КАТЕГОРИИ

ПОПУЛЯРНИ СТАТИИ

2023 “kingad.ru” - ултразвуково изследване на човешки органи