95 diferență de interval de încredere față de sd. Interval de încredere

Adesea, evaluatorul trebuie să analizeze piața imobiliară a segmentului în care se află proprietatea evaluată. Dacă piața este dezvoltată, poate fi dificil să se analizeze întregul set de obiecte prezentate, așa că pentru analiză se folosește un eșantion de obiecte. Acest eșantion nu se dovedește întotdeauna a fi omogen; uneori este necesar să îl curățați de punctele extreme - oferte de piață prea mari sau prea scăzute. În acest scop este folosit interval de încredere. Scopul acestui studiu este de a efectua o analiză comparativă a două metode de calculare a intervalului de încredere și de a selecta opțiunea optimă de calcul atunci când se lucrează cu diferite eșantioane în sistemul estimatica.pro.

Intervalul de încredere este un interval de valori ale atributelor calculate pe baza unui eșantion, care, cu o probabilitate cunoscută, conține parametrul estimat al populației generale.

Scopul calculării unui interval de încredere este de a construi un astfel de interval pe baza datelor eșantionului, astfel încât să se poată afirma cu o probabilitate dată că valoarea parametrului estimat se află în acest interval. Cu alte cuvinte, intervalul de încredere conține valoarea necunoscută a valorii estimate cu o anumită probabilitate. Cu cât intervalul este mai larg, cu atât este mai mare inexactitatea.

Există diferite metode pentru determinarea intervalului de încredere. În acest articol ne vom uita la 2 metode:

  • prin abaterea mediană și standard;
  • prin valoarea critică a t-statisticilor (coeficientul Student).

Etapele analizei comparative a diferitelor metode de calcul al CI:

1. formați un eșantion de date;

2. o procesăm folosind metode statistice: calculăm valoarea medie, mediana, varianța etc.;

3. calculați intervalul de încredere în două moduri;

4. analizați probele curățate și intervalele de încredere rezultate.

Etapa 1. Eșantionarea datelor

Eșantionul a fost format folosind sistemul estimatica.pro. Eșantionul a inclus 91 de oferte pentru vânzarea de apartamente cu 1 cameră în zona a 3-a de preț cu aspectul de tip „Hrușciov”.

Tabelul 1. Proba inițială

Pret 1 mp, unitate

Fig.1. Proba inițială



Etapa 2. Prelucrarea probei inițiale

Procesarea unui eșantion folosind metode statistice necesită calcularea următoarelor valori:

1. Media aritmetică

2. Mediana este un număr care caracterizează eșantionul: exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, cealaltă jumătate sunt mai mici decât mediana

(pentru un eșantion cu un număr impar de valori)

3. Interval - diferența dintre valorile maxime și minime din eșantion

4. Varianta - folosită pentru a estima mai precis variația datelor

5. Abaterea standard eșantion (în continuare - SD) este cel mai frecvent indicator al dispersării valorilor de ajustare în jurul mediei aritmetice.

6. Coeficient de variație – reflectă gradul de împrăștiere a valorilor de ajustare

7. coeficient de oscilație - reflectă fluctuația relativă a valorilor extreme ale prețurilor din eșantion în jurul valorii medii

Tabelul 2. Indicatori statistici ai eșantionului inițial

Coeficientul de variație, care caracterizează omogenitatea datelor, este de 12,29%, dar coeficientul de oscilație este prea mare. Astfel, putem spune că eșantionul original nu este omogen, așa că să trecem la calcularea intervalului de încredere.

Etapa 3. Calculul intervalului de încredere

Metoda 1. Calcul folosind mediana și abaterea standard.

Intervalul de încredere se determină astfel: valoare minimă - abaterea standard se scade din mediană; valoarea maximă - abaterea standard se adaugă la mediană.

Astfel, intervalul de încredere (47179 CU; 60689 CU)

Orez. 2. Valori care se încadrează în intervalul de încredere 1.



Metoda 2. Construirea unui interval de încredere folosind valoarea critică a statisticilor t (coeficientul studentului)

S.V. Gribovsky în cartea sa „Metode matematice pentru estimarea valorii proprietății” descrie o metodă de calculare a intervalului de încredere prin coeficientul Student. Atunci când calculează folosind această metodă, estimatorul trebuie să stabilească el însuși nivelul de semnificație ∝, care determină probabilitatea cu care va fi construit intervalul de încredere. În mod obișnuit, sunt utilizate niveluri de semnificație de 0,1; 0,05 și 0,01. Ele corespund probabilităților de încredere de 0,9; 0,95 și 0,99. Cu această metodă, se presupune că adevăratele valori ale așteptării și varianței matematice sunt practic necunoscute (ceea ce este aproape întotdeauna adevărat atunci când se rezolvă probleme practice de estimare).

Formula intervalului de încredere:

n - dimensiunea eșantionului;

Valoarea critică a t-statisticilor (distribuția Student) cu un nivel de semnificație ∝, numărul de grade de libertate n-1, care se determină din tabele statistice speciale sau folosind MS Excel (→„Statistice”→ STUDIST);

∝ - nivelul de semnificație, luați ∝=0,01.

Orez. 2. Valori care se încadrează în intervalul de încredere 2.

Etapa 4. Analiza diferitelor metode de calcul a intervalului de încredere

Două metode de calcul a intervalului de încredere - prin mediană și coeficientul Student - au condus la valori diferite ale intervalelor. În consecință, am primit două mostre diferite curățate.

Tabelul 3. Statistici pentru trei eșantioane.

Index

Proba inițială

1 opțiune

Opțiunea 2

Valoarea medie

Dispersia

Coef. variatii

Coef. oscilații

Număr de obiecte retrase, buc.

Pe baza calculelor efectuate, putem spune că valorile intervalului de încredere obținute prin diferite metode se intersectează, astfel încât puteți utiliza oricare dintre metodele de calcul la discreția evaluatorului.

Considerăm însă că atunci când lucrăm în sistemul estimatica.pro, este indicat să alegeți o metodă de calcul a intervalului de încredere în funcție de gradul de dezvoltare a pieței:

  • dacă piața este nedezvoltată, utilizați metoda de calcul folosind mediana și abaterea standard, deoarece numărul de obiecte retrase în acest caz este mic;
  • dacă piața este dezvoltată, aplicați calculul prin valoarea critică a t-statisticilor (coeficientul Student), deoarece este posibil să se formeze un eșantion inițial mare.

La pregătirea articolului s-au folosit următoarele:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematice de evaluare a valorii proprietatii. Moscova, 2014

2. System data estimatica.pro

Intervale de încredere ( Engleză Intervale de încredere) unul dintre tipurile de estimări de interval utilizate în statistică, care sunt calculate pentru un anumit nivel de semnificație. Ele ne permit să facem afirmația că valoarea adevărată a unui parametru statistic necunoscut al populației se află în intervalul de valori obținut cu o probabilitate care este specificată de nivelul de semnificație statistică selectat.

Distributie normala

Când varianța (σ 2) a populației de date este cunoscută, scorul z poate fi utilizat pentru a calcula limitele de încredere (punctele finale ale intervalului de încredere). În comparație cu utilizarea distribuției t, utilizarea scorului z vă va permite să construiți nu numai un interval de încredere mai îngust, ci și estimări mai fiabile ale valorii așteptate și a abaterii standard (σ), deoarece scorul z se bazează pe o distributie normala.

Formulă

Pentru a determina punctele limită ale intervalului de încredere, cu condiția ca abaterea standard a populației de date să fie cunoscută, se utilizează următoarea formulă

L = X - Z α/2 σ
√n

Exemplu

Să presupunem că dimensiunea eșantionului este de 25 de observații, valoarea așteptată a eșantionului este 15 și abaterea standard a populației este 8. Pentru un nivel de semnificație de α=5%, scorul Z este Z α/2 =1,96. În acest caz, limitele inferioare și superioare ale intervalului de încredere vor fi

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Astfel, putem spune că cu o probabilitate de 95% așteptarea matematică a populației va scădea în intervalul de la 11.864 la 18.136.

Metode de îngustare a intervalului de încredere

Să presupunem că intervalul este prea mare pentru scopurile studiului nostru. Există două moduri de a reduce intervalul de încredere.

  1. Reduceți nivelul de semnificație statistică α.
  2. Măriți dimensiunea eșantionului.

Reducerea nivelului de semnificație statistică la α=10%, obținem un scor Z egal cu Z α/2 =1,64. În acest caz, limitele inferioare și superioare ale intervalului vor fi

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Iar intervalul de încredere în sine poate fi scris sub formă

În acest caz, putem presupune că, cu o probabilitate de 90%, așteptările matematice ale populației se vor încadra în intervalul .

Dacă dorim să nu reducem nivelul de semnificație statistică α, atunci singura alternativă este creșterea dimensiunii eșantionului. Mărind-o la 144 de observații, obținem următoarele valori ale limitelor de încredere

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Intervalul de încredere în sine va avea următoarea formă

Astfel, îngustarea intervalului de încredere fără a reduce nivelul de semnificație statistică este posibilă doar prin creșterea dimensiunii eșantionului. Dacă mărirea dimensiunii eșantionului nu este posibilă, atunci îngustarea intervalului de încredere poate fi realizată numai prin reducerea nivelului de semnificație statistică.

Construirea unui interval de încredere pentru o altă distribuție decât cea normală

Dacă abaterea standard a populației nu este cunoscută sau distribuția este diferită de normală, distribuția t este utilizată pentru a construi un interval de încredere. Această tehnică este mai conservatoare, ceea ce se reflectă în intervale de încredere mai largi, în comparație cu tehnica bazată pe scorul Z.

Formulă

Pentru a calcula limitele inferioare și superioare ale intervalului de încredere pe baza distribuției t, utilizați următoarele formule

L = X - t α σ
√n

Distribuția Student sau distribuția t depinde de un singur parametru - numărul de grade de libertate, care este egal cu numărul de valori individuale ale atributului (numărul de observații din eșantion). Valoarea testului t Student pentru un anumit număr de grade de libertate (n) și nivelul de semnificație statistică α pot fi găsite în tabelele de referință.

Exemplu

Să presupunem că dimensiunea eșantionului este de 25 de valori individuale, valoarea așteptată a eșantionului este de 50 și abaterea standard a eșantionului este de 28. Este necesar să se construiască un interval de încredere pentru nivelul de semnificație statistică α=5%.

În cazul nostru, numărul de grade de libertate este 24 (25-1), prin urmare valoarea tabelului corespunzătoare a testului t Student pentru nivelul de semnificație statistică α=5% este 2,064. Prin urmare, limitele inferioare și superioare ale intervalului de încredere vor fi

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Și intervalul în sine poate fi scris sub formă

Astfel, putem spune că cu o probabilitate de 95% așteptările matematice ale populației vor fi în intervalul .

Utilizarea distribuției t vă permite să restrângeți intervalul de încredere fie prin reducerea semnificației statistice, fie prin creșterea dimensiunii eșantionului.

Reducând semnificația statistică de la 95% la 90% în condițiile exemplului nostru, obținem valoarea tabelului corespunzătoare a testului t Student de 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

În acest caz, putem spune că cu o probabilitate de 90% așteptările matematice ale populației vor fi în intervalul .

Dacă nu dorim să reducem semnificația statistică, atunci singura alternativă este creșterea dimensiunii eșantionului. Să presupunem că este vorba de 64 de observații individuale și nu de 25 ca în starea inițială a exemplului. Valoarea de tabel a testului t Student pentru 63 de grade de libertate (64-1) și nivelul de semnificație statistică α=5% este 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Acest lucru ne permite să spunem că, cu o probabilitate de 95%, așteptările matematice ale populației vor fi în intervalul .

Mostre mari

Eșantioanele mari sunt eșantioane dintr-o populație de date în care numărul de observații individuale depășește 100. Studiile statistice au arătat că eșantioanele mai mari tind să fie distribuite normal, chiar dacă distribuția populației nu este normală. În plus, pentru astfel de eșantioane, utilizarea unui scor z și a unei distribuții t oferă aproximativ aceleași rezultate la construirea intervalelor de încredere. Astfel, pentru eșantioane mari, este acceptabil să se utilizeze scorul z pentru distribuția normală în loc de distribuția t.

Să rezumam

Intervale de încredere.

Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) se află adevărata valoare a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și probabilitate de încredere.

În primul capitol am arătat că, de exemplu, pentru media aritmetică, media reală a populației în aproximativ 95% din cazuri se află în 2 erori standard ale mediei. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi separate de media eșantionului de două ori eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un anumit coeficient în funcție de nivelul de încredere. Pentru media și diferența de medii se ia coeficientul Student (valoarea critică a testului Student), pentru ponderea și diferența de cote, valoarea critică a criteriului z. Produsul dintre coeficient și eroarea medie poate fi numit eroarea maximă a unui parametru dat, adică. maximul pe care îl putem obţine la evaluarea acestuia.

Interval de încredere pentru medie aritmetică : .

Iată media eșantionului;

Eroarea medie a mediei aritmetice;

s – abaterea standard a probei;

n

f = n-1 (Coeficientul elevului).

Interval de încredere pentru diferențe de medii aritmetice :

Iată diferența dintre mediile eșantionului;

- eroarea medie a diferenţei dintre mediile aritmetice;

s 1 , s 2 – abateri standard ale probei;

n1,n2

Valoarea critică a testului Student pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n 1 + n 2-2 (Coeficientul elevului).

Interval de încredere pentru acțiuni :

.

Aici d este fracția eșantionului;

– eroare medie de fracție;

n– dimensiunea eșantionului (mărimea grupului);

Interval de încredere pentru diferenta de actiuni :

Iată diferența dintre cotele eșantionului;

– eroarea medie a diferenței dintre mediile aritmetice;

n1,n2– volume de probe (număr de grupuri);

Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

Prin calcularea intervalelor de încredere pentru diferența dintre indicatori, în primul rând, vedem direct valorile posibile ale efectului, și nu doar estimarea punctuală a acestuia. În al doilea rând, putem trage o concluzie despre acceptarea sau respingerea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea testului.

Când testați ipoteze folosind intervale de încredere, trebuie să respectați următoarea regulă:

Dacă intervalul de încredere de 100(1-a) procente al diferenței de medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație a; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

Într-adevăr, dacă acest interval conține zero, înseamnă că indicatorul comparat poate fi fie mai mare, fie mai mic într-unul dintre grupuri comparativ cu celălalt, adică. diferenţele observate se datorează întâmplării.

Puterea testului poate fi judecată după locația lui zero în intervalul de încredere. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci este posibil ca, cu un număr mai mare de grupuri comparate, diferențele să ajungă la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât o creștere, cât și o scădere a indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

Exemple:

Pentru a compara mortalitatea chirurgicală la utilizarea a două tipuri diferite de anestezie: 61 de persoane au fost operate cu primul tip de anestezie, 8 au murit, cu al doilea tip – 67 de persoane, 10 au murit.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. ipoteza mortalităţii egale cu două tipuri diferite de anestezie nu poate fi respinsă.

Astfel, rata mortalității poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, deci se poate argumenta că, cel mai probabil, aceste două metode nu diferă într-adevăr în ceea ce privește letalitatea.

În exemplul discutat mai devreme, timpul mediu de apăsare în timpul testului de atingere a fost comparat în patru grupuri de studenți care diferă în punctaje la examen. Să calculăm intervalele de încredere pentru timpul mediu de presare pentru elevii care au promovat examenul cu clasele 2 și 5 și intervalul de încredere pentru diferența dintre aceste medii.

Coeficienții lui Student se găsesc folosind tabelele de distribuție a lui Student (vezi anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), pentru al doilea grup (156,55- 2.000*1,88; 156,08)*5 (156,08)*5 (156,08) ; 160,3). Deci, pentru cei care au promovat examenul cu 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul cu 5 – de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența de medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

Să aflăm intervalul de încredere pentru diferența de timp mediu de presare la loturile care au promovat examenul cu clasele 2 și 5. Diferența de medii: 162,19 – 156,55 = 5,64. Coeficientul studentului: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Abaterile standard de grup vor fi egale cu: ; . Calculăm eroarea medie a diferenței dintre medii: . Interval de încredere: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Așadar, diferența de timp mediu de presare în grupele care au promovat examenul cu 2 și 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică Timpul mediu de presare pentru cei care au promovat bine examenul poate fie să crească, fie să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, iar timpul de presare este mult mai probabil să scadă pentru cei care au trecut bine. Astfel, putem concluziona că există încă diferențe în timpul mediu de presare între cei care au trecut de 2 și 5, pur și simplu nu le-am putut detecta având în vedere modificarea timpului mediu, răspândirea timpului mediu și dimensiunile eșantionului.



Puterea unui test este probabilitatea de a respinge o ipoteză nulă incorectă, i.e. găsiți diferențele acolo unde acestea există de fapt.

Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantioanelor.

Pentru testul t Student și analiza varianței, pot fi utilizate diagrame de sensibilitate.

Puterea criteriului poate fi utilizată pentru a determina preliminar numărul necesar de grupuri.

Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

Folosind intervale de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

LITERATURĂ.

Glanz S. – Capitolul 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko E.V. – p.32-33.

Întrebări pentru autotestarea elevilor.

1. Care este puterea criteriului?

2. În ce cazuri este necesară evaluarea puterii criteriilor?

3. Metode de calcul al puterii.

6. Cum se testează o ipoteză statistică folosind un interval de încredere?

7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

Sarcini.

Interval de încredere pentru așteptările matematice - acesta este un interval calculat din date care, cu o probabilitate cunoscuta, contine asteptarea matematica a populatiei generale. O estimare naturală a așteptărilor matematice este media aritmetică a valorilor observate. Prin urmare, pe parcursul lecției vom folosi termenii „medie” și „valoare medie”. În problemele de calculare a unui interval de încredere, un răspuns cel mai adesea cerut este ceva de genul „Intervalul de încredere al numărului mediu [valoarea unei anumite probleme] este de la [valoare mai mică] la [valoare mai mare]”. Folosind un interval de încredere, puteți evalua nu numai valorile medii, ci și proporția unei anumite caracteristici a populației generale. Valorile medii, dispersia, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt discutate în lecție Caracteristicile eșantionului și populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației este estimată printr-un număr (punct), atunci o medie specifică, care este calculată dintr-un eșantion de observații, este luată ca o estimare a valorii medii necunoscute a populației. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când indicați media eșantionului, trebuie să indicați simultan eroarea de eșantionare. Măsura erorii de eșantionare este eroarea standard, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei trebuie să fie asociată cu o anumită probabilitate, atunci parametrul de interes în populație trebuie evaluat nu printr-un număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate P se constată valoarea indicatorului populaţiei estimate. Interval de încredere în care este probabil P = 1 - α se găsește variabila aleatoare, calculată după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației;
  • sau abaterea standard a populației este necunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului n ar trebui înlocuit cu n-1.

Exemplul 1. S-au colectat informații din 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din acestea este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% pentru numărul de angajați ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a variat între 9,6 și 11,4.

Exemplul 2. Pentru un eșantion aleatoriu dintr-o populație de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru așteptările matematice.

Să calculăm abaterea standard:

,

Să calculăm valoarea medie:

.

Înlocuim valorile în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3. Pentru un eșantion de populație aleatoriu de 100 de observații, media calculată este 15,2 și abaterea standard este 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân neschimbate și coeficientul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a variat între 14,57 și 15,82.

Substituim din nou aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a variat între 14,37 și 16,02.

După cum vedem, pe măsură ce coeficientul de încredere crește, crește și valoarea critică a distribuției normale standard și, în consecință, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și astfel intervalul de încredere pentru așteptarea matematică crește. .

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unui atribut al eșantionului poate fi interpretată ca o estimare punctuală a cotei p de aceeaşi caracteristică în populaţia generală. Dacă această valoare trebuie să fie asociată cu probabilitatea, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populaţie cu probabilitate P = 1 - α :

.

Exemplul 4.Într-un oraș sunt doi candidați AȘi B candideaza la functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că ar vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Orice eșantion oferă doar o idee aproximativă a populației generale, iar toate caracteristicile statistice ale eșantionului (medie, mod, varianță...) sunt o aproximare sau spunem o estimare a parametrilor generali, care în majoritatea cazurilor nu sunt posibile de calculat datorită la inaccesibilitatea populaţiei generale (Figura 20) .

Figura 20. Eroare de eșantionare

Dar se poate preciza intervalul în care se află, cu un anumit grad de probabilitate, valoarea adevărată (generală) a caracteristicii statistice. Acest interval se numește d interval de încredere (IC).

Deci, valoarea medie generală cu o probabilitate de 95% se află în interior

de la până la, (20)

Unde t – valoarea de tabel a testului Student pentru α =0,05 și f= n-1

Un CI de 99% poate fi găsit, de asemenea, în acest caz t selectat pentru α =0,01.

Care este semnificația practică a unui interval de încredere?

    Un interval larg de încredere indică faptul că media eșantionului nu reflectă cu acuratețe media populației. Acest lucru se datorează de obicei unei dimensiuni insuficiente a eșantionului sau eterogenității acestuia, de exemplu. dispersie mare. Ambele dau o eroare mai mare a mediei și, în consecință, un CI mai larg. Și aceasta este baza pentru revenirea la etapa de planificare a cercetării.

    Limitele superioare și inferioare ale CI oferă o estimare a faptului dacă rezultatele vor fi semnificative clinic

Să ne oprim în detaliu asupra chestiunii semnificației statistice și clinice a rezultatelor studiului proprietăților grupului. Să ne amintim că sarcina statisticilor este de a detecta cel puțin unele diferențe în populațiile generale pe baza datelor eșantionului. Provocarea pentru clinicieni este de a detecta diferențele (nu oricare) care vor ajuta la diagnostic sau tratament. Iar concluziile statistice nu sunt întotdeauna la baza concluziilor clinice. Astfel, o scădere semnificativă statistic a hemoglobinei cu 3 g/l nu este un motiv de îngrijorare. Și, invers, dacă vreo problemă din corpul uman nu este răspândită la nivelul întregii populații, acesta nu este un motiv pentru a nu face față acestei probleme.

Să ne uităm la această situație exemplu.

Cercetătorii s-au întrebat dacă băieții care au suferit de vreun fel de boală infecțioasă sunt în urmă față de semenii lor în creștere. În acest scop, s-a realizat un studiu tip eșantion la care au participat 10 băieți care au suferit această boală. Rezultatele sunt prezentate în Tabelul 23.

Tabelul 23. Rezultatele prelucrărilor statistice

limita inferioara

Limita superioară

Standarde (cm)

in medie

Din aceste calcule rezultă că înălțimea medie a eșantionului a băieților de 10 ani care au suferit de vreo boală infecțioasă este aproape de normal (132,5 cm). Cu toate acestea, limita inferioară a intervalului de încredere (126,6 cm) indică faptul că există o probabilitate de 95% ca înălțimea medie adevărată a acestor copii să corespundă conceptului de „înălțime mică”, adică. acești copii sunt pipernici.

În acest exemplu, rezultatele calculelor intervalului de încredere sunt semnificative clinic.

CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane