95 razlika intervala pouzdanosti od SD. Interval pouzdanosti

Često procjenitelj mora analizirati tržište nekretnina segmenta u kojem se nalazi nekretnina koja se procjenjuje. Ako je tržište razvijeno, može biti teško analizirati cijeli skup prezentiranih objekata, pa se za analizu koristi uzorak objekata. Ovaj uzorak ne ispadne uvijek homogen, ponekad ga je potrebno očistiti od ekstremnih točaka - previsokih ili preniskih tržišnih ponuda. U tu svrhu koristi se interval pouzdanosti. Svrha ovog rada je provesti komparativnu analizu dviju metoda za izračun intervala pouzdanosti i odabrati optimalnu opciju izračuna pri radu s različitim uzorcima u sustavu estimatica.pro.

Interval pouzdanosti je interval vrijednosti atributa izračunat na temelju uzorka, koji s poznatom vjerojatnošću sadrži procijenjeni parametar opće populacije.

Smisao izračuna intervala pouzdanosti je konstruirati takav interval na temelju podataka uzorka kako bi se sa zadanom vjerojatnošću moglo ustvrditi da je vrijednost procijenjenog parametra u tom intervalu. Drugim riječima, interval pouzdanosti sadrži nepoznatu vrijednost procijenjene vrijednosti s određenom vjerojatnošću. Što je širi interval, veća je netočnost.

Postoje različite metode za određivanje intervala pouzdanosti. U ovom ćemo članku razmotriti 2 metode:

  • kroz medijan i standardnu ​​devijaciju;
  • preko kritične vrijednosti t-statistike (Studentov koeficijent).

Faze komparativne analize različitih metoda izračuna CI:

1. formirati uzorak podataka;

2. obrađujemo ga statističkim metodama: izračunavamo prosječnu vrijednost, medijan, varijancu itd.;

3. izračunati interval pouzdanosti na dva načina;

4. analizirati očišćene uzorke i dobivene intervale pouzdanosti.

Faza 1. Uzorkovanje podataka

Uzorak je formiran pomoću sustava estimatica.pro. Uzorak je uključivao 91 ponudu za prodaju jednosobnih stanova u 3. cjenovnoj zoni s tipom rasporeda "Hruščov".

Tablica 1. Inicijalni uzorak

Cijena 1 m2, jed

Sl. 1. Inicijalni uzorak



Faza 2. Obrada početnog uzorka

Obrada uzorka statističkim metodama zahtijeva izračun sljedećih vrijednosti:

1. Aritmetička sredina

2. Medijan je broj koji karakterizira uzorak: točno polovica elemenata uzorka je veća od medijana, druga polovica je manja od medijana

(za uzorak s neparnim brojem vrijednosti)

3. Raspon - razlika između maksimalne i minimalne vrijednosti u uzorku

4. Varijanca - koristi se za točniju procjenu varijacije podataka

5. Standardna devijacija uzorka (u daljnjem tekstu - SD) je najčešći pokazatelj disperzije vrijednosti prilagodbe oko aritmetičke sredine.

6. Koeficijent varijacije - odražava stupanj raspršenja vrijednosti prilagodbe

7. koeficijent oscilacije - odražava relativnu fluktuaciju ekstremnih vrijednosti cijene u uzorku oko prosjeka

Tablica 2. Statistički pokazatelji izvornog uzorka

Koeficijent varijacije, koji karakterizira homogenost podataka, iznosi 12,29%, ali je koeficijent oscilacije previsok. Dakle, možemo reći da izvorni uzorak nije homogen, pa prijeđimo na izračunavanje intervala pouzdanosti.

Faza 3. Izračun intervala pouzdanosti

Metoda 1. Izračun korištenjem medijana i standardne devijacije.

Interval pouzdanosti određuje se na sljedeći način: minimalna vrijednost - standardna devijacija se oduzima od medijana; maksimalna vrijednost - standardna devijacija se dodaje medijanu.

Dakle, interval pouzdanosti (47179 CU; 60689 CU)

Riža. 2. Vrijednosti unutar intervala pouzdanosti 1.



Metoda 2. Konstruiranje intervala pouzdanosti pomoću kritične vrijednosti t-statistike (Studentov koeficijent)

S.V. Gribovsky u svojoj knjizi “Matematičke metode za procjenu vrijednosti nekretnine” opisuje metodu za izračunavanje intervala pouzdanosti preko Studentovog koeficijenta. Pri izračunu ovom metodom procjenitelj mora sam postaviti razinu značajnosti ∝, koja određuje vjerojatnost s kojom će se konstruirati interval pouzdanosti. Obično se koriste razine značajnosti od 0,1; 0,05 i 0,01. Odgovaraju vjerojatnosti pouzdanosti od 0,9; 0,95 i 0,99. Ovom metodom se pretpostavlja da su prave vrijednosti matematičkog očekivanja i varijance praktički nepoznate (što je gotovo uvijek točno kada se rješavaju praktični problemi procjene).

Formula intervala pouzdanosti:

n - veličina uzorka;

Kritična vrijednost t-statistike (Studentova distribucija) s razinom značajnosti ∝, broj stupnjeva slobode n-1, koja se utvrđuje iz posebnih statističkih tablica ili korištenjem MS Excel-a (→"Statistical"→ STUDIST);

∝ - razina značajnosti, uzeti ∝=0,01.

Riža. 2. Vrijednosti unutar intervala pouzdanosti 2.

Faza 4. Analiza različitih metoda za izračunavanje intervala pouzdanosti

Dvije metode izračunavanja intervala pouzdanosti - preko medijana i Studentovog koeficijenta - dovele su do različitih vrijednosti intervala. Sukladno tome, dobili smo dva različito očišćena uzorka.

Tablica 3. Statistika za tri uzorka.

Indeks

Inicijalni uzorak

1 opcija

opcija 2

Prosječna vrijednost

Disperzija

Coef. varijacije

Coef. oscilacije

Broj povučenih objekata, kom.

Na temelju izvedenih izračuna možemo reći da se vrijednosti intervala pouzdanosti dobivene različitim metodama presijecaju, tako da možete koristiti bilo koju od metoda izračuna prema nahođenju procjenitelja.

Ipak, smatramo da je pri radu u sustavu estimatica.pro preporučljivo odabrati metodu izračuna intervala pouzdanosti ovisno o stupnju razvijenosti tržišta:

  • ako je tržište nerazvijeno, koristite metodu izračuna koristeći medijan i standardnu ​​devijaciju, budući da je broj povučenih objekata u ovom slučaju mali;
  • ako je tržište razvijeno, primijeniti izračun preko kritične vrijednosti t-statistike (Studentov koeficijent), jer je moguće formirati veliki početni uzorak.

U pripremi članka korišteni su:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematičke metode procjene vrijednosti nekretnina. Moskva, 2014

2. Sustav podataka estimatica.pro

Intervali pouzdanosti ( Engleski Intervali povjerenja) jedna od vrsta intervalnih procjena koje se koriste u statistici, a koje se izračunavaju za danu razinu značajnosti. Omogućuju nam tvrdnju da je prava vrijednost nepoznatog statističkog parametra populacije unutar dobivenog raspona vrijednosti s vjerojatnošću koja je određena odabranom razinom statističke značajnosti.

Normalna distribucija

Kada je poznata varijanca (σ 2) populacije podataka, z-rezultat se može koristiti za izračunavanje granica pouzdanosti (krajnje točke intervala pouzdanosti). U usporedbi s korištenjem t-distribucije, korištenje z-rezultata omogućit će vam konstruiranje ne samo užeg intervala pouzdanosti, već i pouzdanijih procjena očekivane vrijednosti i standardne devijacije (σ), budući da se z-rezultat temelji na normalna distribucija.

Formula

Za određivanje graničnih točaka intervala pouzdanosti, pod uvjetom da je poznata standardna devijacija populacije podataka, koristi se sljedeća formula

L = X - Z α/2 σ
√n

Primjer

Pretpostavimo da je veličina uzorka 25 opažanja, očekivana vrijednost uzorka je 15, a standardna devijacija populacije je 8. Za razinu značajnosti od α=5%, Z-rezultat je Z α/2 =1,96. U tom će slučaju donja i gornja granica intervala pouzdanosti biti

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Dakle, možemo reći da će s 95% vjerojatnosti matematičko očekivanje stanovništva pasti u rasponu od 11.864 do 18.136.

Metode sužavanja intervala povjerenja

Pretpostavimo da je raspon preširok za potrebe naše studije. Postoje dva načina za smanjenje raspona intervala pouzdanosti.

  1. Smanjite razinu statističke značajnosti α.
  2. Povećajte veličinu uzorka.

Smanjenjem razine statističke značajnosti na α=10%, dobivamo Z-score jednak Z α/2 =1,64. U ovom slučaju, donja i gornja granica intervala bit će

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

I sam interval pouzdanosti može se napisati u obliku

U ovom slučaju možemo pretpostaviti da će s vjerojatnošću od 90% matematičko očekivanje populacije pasti unutar raspona .

Ako ne želimo smanjiti razinu statističke značajnosti α, tada je jedina alternativa povećanje veličine uzorka. Povećavajući ga na 144 opažanja, dobivamo sljedeće vrijednosti granica pouzdanosti

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Sam interval pouzdanosti imat će sljedeći oblik

Dakle, sužavanje intervala pouzdanosti bez smanjenja razine statističke značajnosti moguće je samo povećanjem veličine uzorka. Ako povećanje veličine uzorka nije moguće, tada se sužavanje intervala pouzdanosti može postići isključivo smanjenjem razine statističke značajnosti.

Konstruiranje intervala pouzdanosti za distribuciju koja nije normalna

Ako standardna devijacija populacije nije poznata ili se distribucija razlikuje od normalne, t-distribucija se koristi za konstrukciju intervala pouzdanosti. Ova tehnika je konzervativnija, što se očituje u širim intervalima pouzdanosti, u odnosu na tehniku ​​temeljenu na Z-skoru.

Formula

Za izračun donje i gornje granice intervala pouzdanosti na temelju t-distribucije koristite sljedeće formule

L = X - t α σ
√n

Studentova distribucija ili t-distribucija ovisi samo o jednom parametru - broju stupnjeva slobode, koji je jednak broju pojedinačnih vrijednosti atributa (broju opažanja u uzorku). Vrijednost Studentovog t-testa za zadani broj stupnjeva slobode (n) i razinu statističke značajnosti α mogu se pronaći u referentnim tablicama.

Primjer

Pretpostavimo da je veličina uzorka 25 pojedinačnih vrijednosti, očekivana vrijednost uzorka 50, a standardna devijacija uzorka 28. Potrebno je konstruirati interval pouzdanosti za razinu statističke značajnosti α=5%.

U našem slučaju broj stupnjeva slobode je 24 (25-1), pa je odgovarajuća tablična vrijednost Studentovog t-testa za razinu statističke značajnosti α=5% 2,064. Stoga će donja i gornja granica intervala pouzdanosti biti

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

I sam interval se može napisati u obliku

Dakle, možemo reći da će s 95% vjerojatnosti matematičko očekivanje stanovništva biti u rasponu .

Korištenje t distribucije omogućuje vam sužavanje intervala pouzdanosti smanjenjem statističke značajnosti ili povećanjem veličine uzorka.

Smanjenjem statističke značajnosti s 95% na 90% u uvjetima našeg primjera, dobivamo odgovarajuću tabličnu vrijednost Studentovog t-testa od 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

U ovom slučaju možemo reći da će s 90% vjerojatnosti matematičko očekivanje populacije biti u rasponu .

Ako ne želimo smanjiti statističku značajnost, onda je jedina alternativa povećanje veličine uzorka. Recimo da se radi o 64 pojedinačna opažanja, a ne 25 kao u izvornom stanju primjera. Tablična vrijednost Studentovog t-testa za 63 stupnja slobode (64-1) i razinu statističke značajnosti α=5% iznosi 1,998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

To nam omogućuje da kažemo da će s vjerojatnošću od 95% matematičko očekivanje populacije biti u rasponu .

Veliki uzorci

Veliki uzorci su uzorci iz populacije podataka u kojoj broj pojedinačnih opažanja prelazi 100. Statističke studije su pokazale da veći uzorci teže normalnoj distribuciji, čak i ako distribucija populacije nije normalna. Nadalje, za takve uzorke uporaba z-rezultata i t-distribucije daje približno iste rezultate pri konstruiranju intervala pouzdanosti. Stoga je za velike uzorke prihvatljivo koristiti z-rezultat za normalnu distribuciju umjesto t-distribucije.

Sažmimo to

Intervali povjerenja.

Izračun intervala pouzdanosti temelji se na prosječnoj pogrešci odgovarajućeg parametra. Interval pouzdanosti pokazuje unutar kojih se granica s vjerojatnošću (1-a) nalazi prava vrijednost procijenjenog parametra. Ovdje je a razina značajnosti, (1-a) također se naziva vjerojatnost pouzdanosti.

U prvom poglavlju smo pokazali da, na primjer, za aritmetičku sredinu, prava srednja vrijednost populacije u približno 95% slučajeva leži unutar 2 standardne pogreške srednje vrijednosti. Dakle, granice intervala pouzdanosti od 95% za srednju vrijednost bit će odvojene od srednje vrijednosti uzorka dvostrukom srednjom pogreškom srednje vrijednosti, tj. množimo prosječnu pogrešku srednje s određenim koeficijentom ovisno o razini pouzdanosti. Za prosjek i razliku prosjeka uzima se Studentov koeficijent (kritična vrijednost Studentovog testa), za udio i razliku udjela kritična vrijednost z kriterija. Umnožak koeficijenta i prosječne pogreške može se nazvati maksimalnom pogreškom određenog parametra, tj. maksimum koji možemo dobiti pri njegovoj procjeni.

Interval pouzdanosti za aritmetička sredina : .

Ovdje je srednja vrijednost uzorka;

Prosječna pogreška aritmetičke sredine;

s – standardna devijacija uzorka;

n

f = n-1 (koeficijent studenta).

Interval pouzdanosti za razlike aritmetičkih sredina :

Ovdje je razlika između srednjih vrijednosti uzorka;

- prosječna pogreška razlike aritmetičkih sredina;

s 1 , s 2 – standardna odstupanja uzorka;

n1,n2

Kritična vrijednost Studentova testa za zadanu razinu značajnosti a i broj stupnjeva slobode f=n 1 +n 2-2 (koeficijent studenta).

Interval pouzdanosti za dionice :

.

Ovdje je d udio uzorka;

– prosječna pogreška razlomka;

n– veličina uzorka (veličina grupe);

Interval pouzdanosti za razlika udjela :

Ovdje je razlika u uzorcima udjela;

– prosječna pogreška razlike aritmetičkih sredina;

n1,n2– količine uzorka (broj grupa);

Kritična vrijednost z kriterija na zadanoj razini značajnosti a ( , , ).

Izračunavanjem intervala pouzdanosti za razliku između indikatora, mi, prvo, izravno vidimo moguće vrijednosti učinka, a ne samo njegovu točkastu procjenu. Drugo, možemo izvući zaključak o prihvaćanju ili odbijanju nulte hipoteze i, treće, možemo izvući zaključak o snazi ​​testa.

Kada testirate hipoteze pomoću intervala pouzdanosti, morate se pridržavati sljedećeg pravila:

Ako 100(1-a) postotni interval pouzdanosti razlike u sredinama ne sadrži nulu, tada su razlike statistički značajne na razini značajnosti a; naprotiv, ako taj interval sadrži nulu, tada razlike nisu statistički značajne.

Doista, ako taj interval sadrži nulu, to znači da indikator koji se uspoređuje može biti veći ili manji u jednoj od skupina u usporedbi s drugom, tj. uočene razlike posljedica su slučajnosti.

Snaga testa može se procijeniti prema položaju nule unutar intervala pouzdanosti. Ako je nula blizu donje ili gornje granice intervala, tada je moguće da bi s većim brojem skupina koje se uspoređuju razlike dosegle statističku značajnost. Ako je nula blizu sredine intervala, to znači da su i povećanje i smanjenje pokazatelja u eksperimentalnoj skupini jednako vjerojatni i, vjerojatno, stvarno nema razlika.

Primjeri:

Za usporedbu kirurške smrtnosti pri korištenju dvije različite vrste anestezije: 61 osoba je operirana s prvom vrstom anestezije, 8 je umrlo, s drugom vrstom – 67 osoba, 10 je umrlo.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Razlika u letalnosti uspoređivanih metoda bit će u rasponu (-0,018 - 0,122; -0,018 + 0,122) ili (-0,14; 0,104) s vjerojatnošću 100(1-a) = 95%. Interval sadrži nulu, tj. ne može se odbaciti hipoteza o jednakoj smrtnosti s dvije različite vrste anestezije.

Tako se stopa smrtnosti može i hoće smanjiti na 14% i povećati na 10,4% s vjerojatnošću od 95%, tj. nula je otprilike u sredini intervala, pa se može tvrditi da se najvjerojatnije ove dvije metode stvarno ne razlikuju u letalnosti.

U primjeru o kojem smo ranije raspravljali, prosječno vrijeme pritiskanja tijekom testa tapkanja uspoređeno je u četiri grupe studenata koji su se razlikovali u rezultatima ispita. Izračunajmo intervale pouzdanosti za prosječno vrijeme prešanja za studente koji su ispit položili s ocjenama 2 i 5 te interval pouzdanosti za razliku između tih prosjeka.

Studentovi koeficijenti se nalaze pomoću tablica Studentove distribucije (vidi prilog): za prvu skupinu: = t(0,05;48) = 2,011; za drugu skupinu: = t(0,05;61) = 2.000. Dakle, intervali pouzdanosti za prvu skupinu: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), za drugu skupinu (156,55- 2000*1,88; 156,55+2000*1,88) = (152,8 ; 160.3). Tako se za one koji su ispit položili s 2 prosječno vrijeme pritiskanja kreće od 157,8 ms do 166,6 ms s vjerojatnošću od 95%, za one koji su ispit položili s 5 – od 152,8 ms do 160,3 ms s vjerojatnošću od 95%. .

Također možete testirati nultu hipotezu koristeći intervale pouzdanosti za srednje vrijednosti, a ne samo za razliku u srednjim vrijednostima. Na primjer, kao u našem slučaju, ako se intervali pouzdanosti za srednje vrijednosti preklapaju, tada se nulta hipoteza ne može odbaciti. Za odbacivanje hipoteze na odabranoj razini značajnosti, odgovarajući intervali pouzdanosti ne smiju se preklapati.

Nađimo interval pouzdanosti za razliku prosječnog vremena prešanja u grupama koje su ispit položile s ocjenom 2 i 5. Razlika prosjeka: 162,19 – 156,55 = 5,64. Studentov koeficijent: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grupne standardne devijacije bit će jednake: ; . Izračunavamo prosječnu pogrešku razlike između sredina: . Interval pouzdanosti: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Dakle, razlika u prosječnom vremenu prešanja u grupama koje su položile ispit s 2 i 5 bit će u rasponu od -0,044 ms do 11,33 ms. Ovaj interval uključuje nulu, tj. Prosječno vrijeme tiska za one koji su dobro položili ispit može se povećati ili smanjiti u odnosu na one koji su ispit položili nezadovoljavajuće, tj. nulta hipoteza se ne može odbaciti. No, nula je vrlo blizu donje granice i vjerojatnije je da će se vrijeme prešanja smanjiti za one koji su dobro prošli. Dakle, možemo zaključiti da još uvijek postoje razlike u prosječnom vremenu prešanja između onih koji su prošli 2 i 5, samo ih nismo mogli otkriti s obzirom na promjenu prosječnog vremena, širenje prosječnog vremena i veličinu uzorka.



Snaga testa je vjerojatnost odbacivanja netočne nulte hipoteze, tj. pronaći razlike tamo gdje one zapravo postoje.

Snaga testa određena je na temelju razine značajnosti, veličine razlika između skupina, širenja vrijednosti u skupinama i veličine uzoraka.

Za Studentov t test i analizu varijance mogu se koristiti dijagrami osjetljivosti.

Snaga kriterija može se koristiti za preliminarno određivanje potrebnog broja grupa.

Interval pouzdanosti pokazuje unutar kojih se granica s danom vjerojatnošću nalazi prava vrijednost procijenjenog parametra.

Pomoću intervala pouzdanosti možete testirati statističke hipoteze i izvući zaključke o osjetljivosti kriterija.

KNJIŽEVNOST.

Glanz S. – Poglavlje 6,7.

Rebrova O.Yu. – str.112-114, str.171-173, str.234-238.

Sidorenko E.V. – str.32-33.

Pitanja za samotestiranje učenika.

1. Koja je snaga kriterija?

2. U kojim slučajevima je potrebno vrednovati snagu kriterija?

3. Metode proračuna snage.

6. Kako testirati statističku hipotezu pomoću intervala pouzdanosti?

7. Što se može reći o snazi ​​kriterija pri izračunavanju intervala pouzdanosti?

Zadaci.

Interval pouzdanosti za matematičko očekivanje - ovo je interval izračunat iz podataka koji s poznatom vjerojatnošću sadrži matematičko očekivanje opće populacije. Prirodna procjena matematičkog očekivanja je aritmetička sredina njegovih promatranih vrijednosti. Stoga ćemo tijekom cijele lekcije koristiti pojmove "prosjek" i "prosječna vrijednost". U problemima izračuna intervala pouzdanosti, odgovor koji se najčešće traži je nešto poput "Interval pouzdanosti prosječnog broja [vrijednosti u određenom problemu] je od [manje vrijednosti] do [veće vrijednosti]." Pomoću intervala pouzdanosti možete procijeniti ne samo prosječne vrijednosti, već i udio određene karakteristike opće populacije. U lekciji se govori o prosječnim vrijednostima, disperziji, standardnoj devijaciji i pogrešci preko kojih ćemo doći do novih definicija i formula. Obilježja uzorka i populacije .

Točkaste i intervalne procjene srednje vrijednosti

Ako se prosječna vrijednost populacije procjenjuje brojem (točkom), tada se kao procjena nepoznate prosječne vrijednosti populacije uzima određeni prosjek koji se izračunava iz uzorka opažanja. U ovom slučaju vrijednost uzorkačke sredine – slučajne varijable – ne podudara se sa srednjom vrijednošću opće populacije. Stoga, kada označavate srednju vrijednost uzorka, morate istovremeno navesti pogrešku uzorkovanja. Mjera greške uzorkovanja je standardna greška, koja se izražava u istim jedinicama kao i srednja vrijednost. Stoga se često koristi sljedeća oznaka: .

Ako procjenu prosjeka treba povezati s određenom vjerojatnošću, tada se parametar od interesa u populaciji mora procijeniti ne jednim brojem, već intervalom. Interval povjerenja je interval u kojem se s određenom vjerojatnošću P nalazi se vrijednost procijenjenog pokazatelja populacije. Interval pouzdanosti u kojem je to vjerojatno P = 1 - α pronađena je slučajna varijabla, izračunata na sljedeći način:

,

α = 1 - P, koji se može naći u dodatku gotovo svake knjige o statistici.

U praksi srednja vrijednost populacije i varijanca nisu poznati, pa se varijanca populacije zamjenjuje varijancom uzorka, a srednja vrijednost populacije sredinom uzorka. Stoga se interval pouzdanosti u većini slučajeva izračunava na sljedeći način:

.

Formula intervala pouzdanosti može se koristiti za procjenu srednje vrijednosti populacije ako

  • poznata je standardna devijacija populacije;
  • ili je standardna devijacija populacije nepoznata, ali je veličina uzorka veća od 30.

Srednja vrijednost uzorka je nepristrana procjena srednje vrijednosti populacije. S druge strane, varijanca uzorka nije nepristrana procjena varijance populacije. Za dobivanje nepristrane procjene varijance populacije u formuli varijance uzorka, veličina uzorka n treba zamijeniti sa n-1.

Primjer 1. Od 100 nasumično odabranih kafića u određenom gradu prikupljen je podatak da je prosječan broj zaposlenih u njima 10,5 sa standardnom devijacijom od 4,6. Odredite 95% interval pouzdanosti za broj zaposlenih u kafiću.

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Tako se 95%-tni interval pouzdanosti za prosječan broj zaposlenih u kafiću kretao od 9,6 do 11,4.

Primjer 2. Za slučajni uzorak iz populacije od 64 opažanja, izračunate su sljedeće ukupne vrijednosti:

zbroj vrijednosti u promatranjima,

zbroj kvadrata odstupanja vrijednosti od prosjeka .

Izračunajte interval pouzdanosti od 95% za matematičko očekivanje.

Izračunajmo standardnu ​​devijaciju:

,

Izračunajmo prosječnu vrijednost:

.

Zamjenjujemo vrijednosti u izraz za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Dobivamo:

Stoga je 95%-tni interval pouzdanosti za matematičko očekivanje ovog uzorka bio u rasponu od 7,484 do 11,266.

Primjer 3. Za slučajni uzorak populacije od 100 opažanja, izračunata sredina je 15,2, a standardna devijacija je 3,2. Izračunajte 95% interval pouzdanosti za očekivanu vrijednost, zatim 99% interval pouzdanosti. Ako snaga uzorka i njezina varijacija ostanu nepromijenjeni, a koeficijent pouzdanosti raste, hoće li se interval pouzdanosti suziti ili proširiti?

Zamjenjujemo ove vrijednosti u izraz za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,05 .

Dobivamo:

.

Stoga je 95%-tni interval pouzdanosti za srednju vrijednost ovog uzorka bio u rasponu od 14,57 do 15,82.

Ponovno zamijenimo ove vrijednosti u izrazu za interval pouzdanosti:

gdje je kritična vrijednost standardne normalne distribucije za razinu značajnosti α = 0,01 .

Dobivamo:

.

Stoga je 99% interval pouzdanosti za srednju vrijednost ovog uzorka bio u rasponu od 14,37 do 16,02.

Kao što vidimo, kako se koeficijent pouzdanosti povećava, kritična vrijednost standardne normalne distribucije također raste, i, posljedično, početna i završna točka intervala nalaze se dalje od srednje vrijednosti, a time se povećava interval pouzdanosti za matematičko očekivanje .

Točkaste i intervalne procjene specifične težine

Udio nekog atributa uzorka može se interpretirati kao procjena udjela str istih karakteristika u općoj populaciji. Ako ovu vrijednost treba povezati s vjerojatnošću, tada treba izračunati interval pouzdanosti specifične težine str karakterističan u populaciji s vjerojatnošću P = 1 - α :

.

Primjer 4. U nekom gradu postoje dva kandidata A I B kandidiraju se za gradonačelnika. Nasumično je anketirano 200 stanovnika grada, od kojih je 46% odgovorilo da bi glasalo za kandidata A, 26% - za kandidata B a 28% ne zna za koga će glasati. Odredite interval pouzdanosti od 95% za udio stanovnika grada koji podržavaju kandidata A.

Svaki uzorak daje samo približnu sliku opće populacije, a sve statističke karakteristike uzorka (srednja vrijednost, mod, varijanca...) su neke aproksimacije ili recimo procjena općih parametara, koje u većini slučajeva nije moguće izračunati zbog na nedostupnost općoj populaciji (Slika 20) .

Slika 20. Greška uzorkovanja

Ali možete odrediti interval u kojem se, s određenim stupnjem vjerojatnosti, nalazi prava (opća) vrijednost statističke karakteristike. Taj se interval naziva d interval pouzdanosti (CI).

Dakle, opća prosječna vrijednost s vjerojatnošću od 95% leži unutar

od do, (20)

Gdje t – tablična vrijednost Studentovog testa za α =0,05 i f= n-1

U ovom slučaju također se može naći 99% CI t odabran za α =0,01.

Koji je praktični značaj intervala pouzdanosti?

    Široki interval pouzdanosti ukazuje da srednja vrijednost uzorka ne odražava točno srednju vrijednost populacije. To je obično zbog nedovoljne veličine uzorka ili njegove heterogenosti, tj. velika disperzija. Oba daju veću pogrešku srednje vrijednosti i, sukladno tome, širi CI. I to je osnova za povratak u fazu planiranja istraživanja.

    Gornje i donje granice CI daju procjenu hoće li rezultati biti klinički značajni

Zaustavimo se detaljnije o pitanju statističke i kliničke važnosti rezultata proučavanja grupnih svojstava. Prisjetimo se da je zadatak statistike otkriti barem neke razlike u općim populacijama na temelju podataka uzorka. Izazov za kliničare je otkriti razlike (ne bilo koje) koje će pomoći u dijagnozi ili liječenju. A statistički zaključci nisu uvijek temelj za kliničke zaključke. Dakle, statistički značajno smanjenje hemoglobina za 3 g/l nije razlog za zabrinutost. I obrnuto, ako neki problem u ljudskom organizmu nije raširen na razini cijele populacije, to nije razlog da se s tim problemom ne pozabavimo.

Pogledajmo ovu situaciju primjer.

Istraživače je zanimalo zaostaju li dječaci koji su bolovali od neke vrste zarazne bolesti u rastu za svojim vršnjacima. U tu svrhu provedeno je ogledno istraživanje u kojem je sudjelovalo 10 dječaka koji su bolovali od ove bolesti. Rezultati su prikazani u tablici 23.

Tablica 23. Rezultati statističke obrade

donja granica

Gornja granica

Standardi (cm)

prosjek

Iz ovih izračuna proizlazi da je prosječna visina uzorka desetogodišnjih dječaka koji su bolovali od neke zarazne bolesti blizu normalne (132,5 cm). Međutim, donja granica intervala pouzdanosti (126,6 cm) pokazuje da postoji 95%-tna vjerojatnost da stvarna prosječna visina ove djece odgovara konceptu „niske visine“, tj. ova djeca su zakržljala.

U ovom su primjeru rezultati izračuna intervala pouzdanosti klinički značajni.

KATEGORIJE

POPULARNI ČLANCI

2023 “kingad.ru” - ultrazvučni pregled ljudskih organa