95 diferență de interval de încredere față de sd. Interval de încredere

De multe ori evaluatorul trebuie să analizeze piața imobiliară a segmentului în care se află obiectul de evaluare. Dacă piața este dezvoltată, poate fi dificil să se analizeze întregul set de obiecte prezentate, prin urmare, pentru analiză se folosește un eșantion de obiecte. Acest eșantion nu este întotdeauna omogen, uneori este necesar să îl curățați de extreme - oferte de piață prea mari sau prea scăzute. În acest scop, se aplică interval de încredere. Scopul acestui studiu este de a efectua o analiză comparativă a două metode de calculare a intervalului de încredere și de a alege cea mai bună opțiune de calcul atunci când se lucrează cu diferite eșantioane în sistemul estimatica.pro.

Interval de încredere - calculat pe baza eșantionului, intervalul de valori ale caracteristicii, care, cu o probabilitate cunoscută, conține parametrul estimat al populației generale.

Sensul calculării intervalului de încredere este de a construi un astfel de interval pe baza datelor eșantionului, astfel încât să se poată afirma cu o probabilitate dată că valoarea parametrului estimat se află în acest interval. Cu alte cuvinte, intervalul de încredere cu o anumită probabilitate conține valoarea necunoscută a cantității estimate. Cu cât intervalul este mai larg, cu atât este mai mare inexactitatea.

Există diferite metode pentru determinarea intervalului de încredere. În acest articol, vom lua în considerare 2 moduri:

  • prin abaterea mediană și standard;
  • prin valoarea critică a statisticii t (coeficientul Student).

Etapele unei analize comparative a diferitelor metode de calcul al CI:

1. formați un eșantion de date;

2. o procesăm cu metode statistice: calculăm valoarea medie, mediana, varianța etc.;

3. calculăm intervalul de încredere în două moduri;

4. Analizați probele curățate și intervalele de încredere obținute.

Etapa 1. Eșantionarea datelor

Eșantionul a fost format folosind sistemul estimatica.pro. Eșantionul a inclus 91 de oferte pentru vânzarea de apartamente cu 1 cameră în zona de preț a 3-a cu tipul de planificare „Hrușciov”.

Tabelul 1. Proba inițială

Pretul de 1 mp, c.u.

Fig.1. Proba inițială



Etapa 2. Prelucrarea probei initiale

Prelucrarea probelor prin metode statistice necesită calcularea următoarelor valori:

1. Media aritmetică

2. Mediană - un număr care caracterizează eșantionul: exact jumătate dintre elementele eșantionului sunt mai mari decât mediana, cealaltă jumătate este mai mică decât mediana

(pentru un eșantion cu un număr impar de valori)

3. Interval - diferența dintre valorile maxime și minime din eșantion

4. Varianta - folosit pentru a estima mai precis variatia datelor

5. Abaterea standard pentru eșantion (denumită în continuare RMS) este cel mai comun indicator al dispersării valorilor de ajustare în jurul mediei aritmetice.

6. Coeficient de variație – reflectă gradul de dispersie a valorilor de ajustare

7. coeficient de oscilație - reflectă fluctuația relativă a valorilor extreme ale prețurilor din eșantion în jurul mediei

Tabelul 2. Indicatori statistici ai eșantionului inițial

Coeficientul de variație, care caracterizează omogenitatea datelor, este de 12,29%, dar coeficientul de oscilație este prea mare. Astfel, putem afirma că eșantionul original nu este omogen, deci să trecem la calcularea intervalului de încredere.

Etapa 3. Calculul intervalului de încredere

Metoda 1. Calculul prin mediană și abaterea standard.

Intervalul de încredere se determină astfel: valoarea minimă - abaterea standard se scade din mediană; valoarea maximă - la mediană se adaugă abaterea standard.

Astfel, intervalul de încredere (47179 CU; 60689 CU)

Orez. 2. Valori în intervalul de încredere 1.



Metoda 2. Construirea unui interval de încredere prin valoarea critică a statisticilor t (coeficientul studentului)

S.V. Gribovsky în cartea „Metode matematice pentru evaluarea valorii proprietății” descrie o metodă de calcul a intervalului de încredere prin coeficientul Student. La calcularea prin această metodă, estimatorul însuși trebuie să stabilească nivelul de semnificație ∝, care determină probabilitatea cu care se va construi intervalul de încredere. Nivelurile de semnificație de 0,1 sunt utilizate în mod obișnuit; 0,05 și 0,01. Ele corespund probabilităților de încredere de 0,9; 0,95 și 0,99. Cu această metodă, adevăratele valori ale așteptării și varianței matematice sunt considerate practic necunoscute (ceea ce este aproape întotdeauna adevărat atunci când se rezolvă probleme practice de evaluare).

Formula intervalului de încredere:

n - dimensiunea eșantionului;

Valoarea critică a t-statisticilor (distribuții Student) cu un nivel de semnificație ∝, numărul de grade de libertate n-1, care este determinat de tabele statistice speciale sau folosind MS Excel (→„Statistice”→ STUDRASPOBR);

∝ - nivelul de semnificație, luăm ∝=0,01.

Orez. 2. Valori în intervalul de încredere 2.

Pasul 4. Analiza diferitelor moduri de calculare a intervalului de încredere

Două metode de calcul a intervalului de încredere - prin mediană și coeficientul Student - au condus la valori diferite ale intervalelor. În consecință, au fost obținute două probe purificate diferite.

Tabelul 3. Indicatori statistici pentru trei eșantioane.

Index

Proba inițială

1 opțiune

Opțiunea 2

Rău

Dispersia

Coef. variatii

Coef. oscilații

Număr de obiecte retrase, buc.

Pe baza calculelor efectuate, putem spune că valorile intervalelor de încredere obținute prin diferite metode se intersectează, astfel încât puteți utiliza oricare dintre metodele de calcul la discreția evaluatorului.

Considerăm însă că atunci când lucrăm în sistemul estimatica.pro, este indicat să alegeți o metodă de calcul a intervalului de încredere, în funcție de gradul de dezvoltare a pieței:

  • dacă piața nu este dezvoltată, aplicați metoda de calcul prin mediană și deviația standard, deoarece numărul de obiecte retrase în acest caz este mic;
  • dacă piața este dezvoltată, aplicați calculul prin valoarea critică a t-statisticilor (coeficientul Student), deoarece este posibil să se formeze un eșantion inițial mare.

La pregătirea articolului s-au folosit:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematice de apreciere a valorii proprietatii. Moscova, 2014

2. Date din sistemul estimatica.pro

Intervale de încredere ( Engleză Intervale de încredere) unul dintre tipurile de estimări de interval utilizate în statistică, care sunt calculate pentru un anumit nivel de semnificație. Ele ne permit să facem o afirmație că valoarea adevărată a unui parametru statistic necunoscut al populației generale se află în intervalul de valori obținut cu o probabilitate care este dată de nivelul de semnificație statistică ales.

Distributie normala

Când varianța (σ 2 ) a populației de date este cunoscută, un scor z poate fi utilizat pentru a calcula limitele de încredere (punctele limită ale intervalului de încredere). În comparație cu utilizarea unei distribuții t, utilizarea unui scor z nu numai că va oferi un interval de încredere mai îngust, ci va oferi și estimări mai fiabile ale mediei și abaterii standard (σ), deoarece scorul Z se bazează pe o distribuție normală.

Formulă

Pentru a determina punctele limită ale intervalului de încredere, cu condiția ca abaterea standard a populației de date să fie cunoscută, se utilizează următoarea formulă

L = X - Z α/2 σ
√n

Exemplu

Să presupunem că dimensiunea eșantionului este de 25 de observații, media eșantionului este 15 și abaterea standard a populației este 8. Pentru un nivel de semnificație de α=5%, scorul Z este Z α/2 =1,96. În acest caz, limitele inferioare și superioare ale intervalului de încredere vor fi

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Astfel, putem afirma că, cu o probabilitate de 95%, așteptarea matematică a populației generale va scădea în intervalul de la 11.864 la 18.136.

Metode de îngustare a intervalului de încredere

Să presupunem că gama este prea largă pentru scopurile studiului nostru. Există două moduri de a reduce intervalul intervalului de încredere.

  1. Reduceți nivelul de semnificație statistică α.
  2. Măriți dimensiunea eșantionului.

Reducerea nivelului de semnificație statistică la α=10%, obținem un scor Z egal cu Z α/2 =1,64. În acest caz, limitele inferioare și superioare ale intervalului vor fi

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Iar intervalul de încredere în sine poate fi scris ca

În acest caz, putem presupune că, cu o probabilitate de 90%, așteptarea matematică a populației generale va intra în interval.

Dacă dorim să păstrăm nivelul de semnificație statistică α, atunci singura alternativă este creșterea dimensiunii eșantionului. Mărind-o la 144 de observații, obținem următoarele valori ale limitelor de încredere

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Intervalul de încredere în sine va arăta astfel:

Astfel, îngustarea intervalului de încredere fără a reduce nivelul de semnificație statistică este posibilă doar prin creșterea dimensiunii eșantionului. Dacă nu este posibilă creșterea dimensiunii eșantionului, atunci îngustarea intervalului de încredere poate fi realizată numai prin reducerea nivelului de semnificație statistică.

Construirea unui interval de încredere pentru o distribuție nenormală

Dacă abaterea standard a populației nu este cunoscută sau distribuția este nenormală, distribuția t este utilizată pentru a construi un interval de încredere. Această tehnică este mai conservatoare, care este exprimată în intervale de încredere mai largi, în comparație cu tehnica bazată pe scorul Z.

Formulă

Următoarele formule sunt utilizate pentru a calcula limitele inferioare și superioare ale intervalului de încredere pe baza distribuției t

L = X - tα σ
√n

Distribuția lui Student sau distribuția t depinde de un singur parametru - numărul de grade de libertate, care este egal cu numărul de valori individuale ale caracteristicilor (numărul de observații din eșantion). Valoarea testului t Student pentru un anumit număr de grade de libertate (n) și nivelul de semnificație statistică α pot fi găsite în tabelele de căutare.

Exemplu

Să presupunem că dimensiunea eșantionului este de 25 de valori individuale, valoarea medie a eșantionului este de 50 și abaterea standard a eșantionului este de 28. Trebuie să construiți un interval de încredere pentru nivelul de semnificație statistică α=5%.

În cazul nostru, numărul de grade de libertate este 24 (25-1), prin urmare, valoarea tabelară corespunzătoare a testului t Student pentru nivelul de semnificație statistică α=5% este 2,064. Prin urmare, limitele inferioare și superioare ale intervalului de încredere vor fi

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Iar intervalul în sine poate fi scris ca

Astfel, putem afirma că cu o probabilitate de 95% așteptarea matematică a populației generale va fi în interval.

Utilizarea unei distribuții t vă permite să restrângeți intervalul de încredere, fie prin reducerea semnificației statistice, fie prin creșterea dimensiunii eșantionului.

Reducând semnificația statistică de la 95% la 90% în condițiile exemplului nostru, obținem valoarea tabelară corespunzătoare a testului t Student 1.711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

În acest caz, putem spune că cu o probabilitate de 90% așteptarea matematică a populației generale va fi în interval.

Dacă nu dorim să reducem semnificația statistică, atunci singura alternativă este creșterea dimensiunii eșantionului. Să presupunem că este vorba de 64 de observații individuale, și nu de 25 ca în condiția inițială a exemplului. Valoarea tabelară a testului t Student pentru 63 de grade de libertate (64-1) și nivelul de semnificație statistică α=5% este 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Acest lucru ne dă ocazia să afirmăm că, cu o probabilitate de 95%, așteptările matematice ale populației generale vor fi în interval.

Mostre mari

Eșantioanele mari sunt eșantioane dintr-o populație de date cu mai mult de 100 de observații individuale.Studiile statistice au arătat că eșantioanele mai mari tind să fie distribuite normal, chiar dacă distribuția populației nu este normală. În plus, pentru astfel de eșantioane, utilizarea scorului z și a distribuției t oferă aproximativ aceleași rezultate la construirea intervalelor de încredere. Astfel, pentru eșantioane mari, este acceptabil să se folosească un scor z pentru o distribuție normală în loc de o distribuție t.

Rezumând

Intervale de încredere.

Calculul intervalului de încredere se bazează pe eroarea medie a parametrului corespunzător. Interval de încredere arată în ce limite cu probabilitate (1-a) este valoarea adevărată a parametrului estimat. Aici a este nivelul de semnificație, (1-a) se mai numește și nivelul de încredere.

În primul capitol, am arătat că, de exemplu, pentru media aritmetică, adevărata medie a populației se află în 2 erori medii ale mediei aproximativ 95% din timp. Astfel, limitele intervalului de încredere de 95% pentru medie vor fi de la media eșantionului de două ori mai mare decât eroarea medie a mediei, i.e. înmulțim eroarea medie a mediei cu un factor care depinde de nivelul de încredere. Pentru medie și diferența de medii se ia coeficientul Student (valoarea critică a criteriului Student), pentru ponderea și diferența cotelor, valoarea critică a criteriului z. Produsul coeficientului și eroarea medie poate fi numit eroarea marginală a acestui parametru, adică. maximul pe care îl putem obține atunci când îl evaluăm.

Interval de încredere pentru medie aritmetică : .

Iată media eșantionului;

Eroarea medie a mediei aritmetice;

s- abaterea standard a probei;

n

f = n-1 (Coeficientul elevului).

Interval de încredere pentru diferența de medii aritmetice :

Aici este diferența dintre mediile eșantionului;

- eroarea medie a diferenţei de medii aritmetice;

s 1 ,s 2 - abateri standard ale probei;

n1,n2

Valoarea critică a criteriului Studentului pentru un anumit nivel de semnificație a și numărul de grade de libertate f=n1 +n2-2 (Coeficientul elevului).

Interval de încredere pentru acțiuni :

.

Aici d este cota eșantionului;

– eroare medie de cotă;

n– dimensiunea eșantionului (mărimea grupului);

Interval de încredere pentru împărtășește diferențele :

Iată diferența dintre acțiunile eșantionului;

este eroarea medie a diferenței dintre mediile aritmetice;

n1,n2– dimensiunile eșantionului (număr de grupuri);

Valoarea critică a criteriului z la un nivel de semnificație dat a ( , , ).

Prin calcularea intervalelor de încredere pentru diferența de indicatori, în primul rând, vedem direct valorile posibile ale efectului, și nu doar estimarea punctuală a acestuia. În al doilea rând, putem trage o concluzie despre acceptarea sau infirmarea ipotezei nule și, în al treilea rând, putem trage o concluzie despre puterea criteriului.

La testarea ipotezelor folosind intervale de încredere, trebuie respectată următoarea regulă:

Dacă intervalul de încredere de 100(1-a)-procent al diferenței medii nu conține zero, atunci diferențele sunt semnificative statistic la nivelul de semnificație; dimpotrivă, dacă acest interval conține zero, atunci diferențele nu sunt semnificative statistic.

Într-adevăr, dacă acest interval conține zero, atunci înseamnă că indicatorul comparat poate fi fie mai mult, fie mai puțin într-unul dintre grupuri în comparație cu celălalt, i.e. diferențele observate sunt aleatorii.

După locul în care se află zero în intervalul de încredere, se poate judeca puterea criteriului. Dacă zero este aproape de limita inferioară sau superioară a intervalului, atunci poate cu un număr mai mare de grupuri comparate, diferențele ar ajunge la semnificație statistică. Dacă zero este aproape de mijlocul intervalului, înseamnă că atât creșterea, cât și scăderea indicatorului în grupul experimental sunt la fel de probabile și, probabil, chiar nu există diferențe.

Exemple:

Pentru a compara mortalitatea chirurgicală la utilizarea a două tipuri diferite de anestezie: 61 de persoane au fost operate folosind primul tip de anestezie, 8 au murit, folosind al doilea - 67 de persoane, 10 au murit.

d 1 \u003d 8/61 \u003d 0,131; d 2 \u003d 10/67 \u003d 0,149; d1-d2 = - 0,018.

Diferența de letalitate a metodelor comparate va fi în intervalul (-0,018 - 0,122; -0,018 + 0,122) sau (-0,14; 0,104) cu o probabilitate de 100(1-a) = 95%. Intervalul conține zero, adică. nu poate fi respinsă ipoteza aceleiaşi letităţi cu două tipuri diferite de anestezie.

Astfel, mortalitatea poate și va scădea la 14% și crește la 10,4% cu o probabilitate de 95%, adică. zero este aproximativ la mijlocul intervalului, deci se poate argumenta că, cel mai probabil, aceste două metode nu diferă într-adevăr în ceea ce privește letalitatea.

În exemplul considerat mai devreme, timpul mediu de atingere a fost comparat în patru grupuri de studenți care diferă în ceea ce privește scorurile la examen. Să calculăm intervalele de încredere ale timpului mediu de apăsare pentru studenții care au promovat examenul pentru 2 și 5 și intervalul de încredere pentru diferența dintre aceste medii.

Coeficienții lui Student se regăsesc din tabelele de distribuție a lui Student (vezi Anexa): pentru prima grupă: = t(0,05;48) = 2,011; pentru a doua grupă: = t(0,05;61) = 2,000. Astfel, intervale de încredere pentru primul grup: = (162,19-2,011 * 2,18; 162,19 + 2,011 * 2,18) = (157,8; 166,6) , pentru al doilea grup (156,55- 2,000*2,000*1,88..; 8 = 1,88..; 8) ; 160,3). Deci, pentru cei care au promovat examenul pentru 2, timpul mediu de apăsare variază de la 157,8 ms la 166,6 ms cu o probabilitate de 95%, pentru cei care au promovat examenul pentru 5 - de la 152,8 ms la 160,3 ms cu o probabilitate de 95% .

De asemenea, puteți testa ipoteza nulă folosind intervale de încredere pentru medii și nu doar pentru diferența dintre medii. De exemplu, ca și în cazul nostru, dacă intervalele de încredere pentru medii se suprapun, atunci ipoteza nulă nu poate fi respinsă. Pentru a respinge o ipoteză la un nivel de semnificație ales, intervalele de încredere corespunzătoare nu trebuie să se suprapună.

Să aflăm intervalul de încredere pentru diferența în timpul mediu de presare la grupele care au promovat examenul pentru 2 și 5. Diferența mediilor: 162,19 - 156,55 = 5,64. Coeficientul studentului: \u003d t (0,05; 49 + 62-2) \u003d t (0,05; 109) \u003d 1,982. Abaterile standard de grup vor fi egale cu: ; . Calculăm eroarea medie a diferenței dintre medii: . Interval de încredere: \u003d (5,64-1,982 * 2,87; 5,64 + 1,982 * 2,87) \u003d (-0,044; 11,33).

Așadar, diferența de timp mediu de presare în grupele care au promovat examenul la 2 și la 5 va fi în intervalul de la -0,044 ms la 11,33 ms. Acest interval include zero, adică timpul mediu de presare pentru cei care au promovat examenul cu rezultate excelente poate să crească și să scadă în comparație cu cei care au promovat examenul nesatisfăcător, adică. ipoteza nulă nu poate fi respinsă. Dar zero este foarte aproape de limita inferioară, timpul de apăsare este mult mai probabil să scadă pentru trecătorii excelenți. Astfel, putem concluziona că există încă diferențe în timpul mediu de clic între cei care au trecut cu 2 și cu 5, pur și simplu nu le-am putut detecta pentru o anumită modificare a timpului mediu, a răspândirii timpului mediu și a dimensiunilor eșantionului.



Puterea testului este probabilitatea de a respinge o ipoteză nulă incorectă, i.e. găsiți diferențele acolo unde sunt cu adevărat.

Puterea testului este determinată pe baza nivelului de semnificație, a mărimii diferențelor dintre grupuri, a răspândirii valorilor în grupuri și a mărimii eșantionului.

Pentru testul t Student și analiza varianței, puteți utiliza diagrame de sensibilitate.

Puterea criteriului poate fi utilizată în determinarea preliminară a numărului necesar de grupuri.

Intervalul de încredere arată în ce limite se află valoarea adevărată a parametrului estimat cu o probabilitate dată.

Cu ajutorul intervalelor de încredere, puteți testa ipoteze statistice și puteți trage concluzii despre sensibilitatea criteriilor.

LITERATURĂ.

Glantz S. - Capitolul 6.7.

Rebrova O.Yu. - p.112-114, p.171-173, p.234-238.

Sidorenko E. V. - p. 32-33.

Întrebări pentru autoexaminarea studenților.

1. Care este puterea criteriului?

2. În ce cazuri este necesară evaluarea puterii criteriilor?

3. Metode de calcul al puterii.

6. Cum se testează o ipoteză statistică folosind un interval de încredere?

7. Ce se poate spune despre puterea criteriului la calcularea intervalului de încredere?

Sarcini.

Interval de încredere pentru așteptările matematice - acesta este un astfel de interval calculat din date, care cu o probabilitate cunoscută conține așteptarea matematică a populației generale. Estimarea naturală pentru așteptarea matematică este media aritmetică a valorilor observate. Prin urmare, în continuare pe parcursul lecției vom folosi termenii „medie”, „valoare medie”. În problemele de calculare a intervalului de încredere, răspunsul cel mai adesea solicitat este „Intervalul de încredere al numărului mediu [valoarea unei anumite probleme] este de la [valoare mai mică] la [valoare mai mare]”. Cu ajutorul intervalului de încredere, este posibil să se evalueze nu numai valorile medii, ci și ponderea uneia sau alteia caracteristici a populației generale. Valorile medii, varianța, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt analizate în lecție Eșantionul și caracteristicile populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației generale este estimată printr-un număr (punct), atunci o medie specifică calculată dintr-un eșantion de observații este luată ca o estimare a mediei necunoscute a populației generale. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când se indică valoarea medie a eșantionului, este, de asemenea, necesar să se indice eroarea eșantionului în același timp. Eroarea standard este utilizată ca măsură a erorii de eșantionare, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei se cere să fie asociată cu o anumită probabilitate, atunci parametrul populației generale de interes trebuie estimat nu printr-un singur număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate, P se constată valoarea indicatorului estimat al populaţiei generale. Interval de încredere în care cu probabilitate P = 1 - α este o variabilă aleatorie, se calculează după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației generale;
  • sau abaterea standard a populației nu este cunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului este n ar trebui inlocuit cu n-1.

Exemplul 1 Informații sunt colectate de la 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din ele este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% din numărul de lucrători ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a fost între 9,6 și 11,4.

Exemplul 2 Pentru un eșantion aleatoriu dintr-o populație generală de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru valoarea așteptată.

calculați abaterea standard:

,

calculați valoarea medie:

.

Înlocuiți valorile din expresie pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3 Pentru un eșantion aleatoriu dintr-o populație generală de 100 de observații, au fost calculate o valoare medie de 15,2 și o abatere standard de 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân aceleași, dar factorul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a fost de la 14,57 la 15,82.

Din nou, înlocuim aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a fost de la 14,37 la 16,02.

După cum puteți vedea, pe măsură ce factorul de încredere crește, crește și valoarea critică a distribuției normale standard și, prin urmare, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și, astfel, intervalul de încredere pentru așteptarea matematică. crește.

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unei anumite caracteristici a eșantionului poate fi interpretată ca o estimare punctuală a cotei p aceeași trăsătură în populația generală. Dacă această valoare trebuie să fie asociată cu o probabilitate, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populația generală cu o probabilitate P = 1 - α :

.

Exemplul 4 Sunt doi candidați într-un anumit oraș Ași B candideaza la functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că vor vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Orice eșantion oferă doar o idee aproximativă a populației generale, iar toate caracteristicile statistice ale eșantionului (medie, mod, varianță ...) sunt o aproximare sau spunem o estimare a parametrilor generali, care în majoritatea cazurilor nu pot fi calculate din cauza inaccesibilitatea populaţiei generale (Figura 20) .

Figura 20. Eroare de eșantionare

Dar se poate preciza intervalul în care, cu un anumit grad de probabilitate, se află valoarea adevărată (generală) a caracteristicii statistice. Acest interval se numește d interval de încredere (IC).

Deci media generală cu o probabilitate de 95% se află în interior

de la până la, (20)

Unde t - valoarea tabelară a criteriului Student pentru α =0,05 și f= n-1

Poate fi găsit și 99% CI, în acest caz t ales pentru α =0,01.

Care este semnificația practică a unui interval de încredere?

    Un interval larg de încredere indică faptul că media eșantionului nu reflectă cu acuratețe media populației. Acest lucru se datorează de obicei unei dimensiuni insuficiente a eșantionului sau eterogenității acestuia, de exemplu. dispersie mare. Ambele dau o eroare mare în medie și, în consecință, un CI mai larg. Și acesta este motivul pentru a reveni la etapa de planificare a cercetării.

    Limitele superioare și inferioare ale CI evaluează dacă rezultatele vor fi semnificative clinic

Să ne oprim mai în detaliu asupra chestiunii semnificației statistice și clinice a rezultatelor studiului proprietăților grupului. Amintiți-vă că sarcina statisticilor este de a detecta cel puțin unele diferențe în populația generală, pe baza datelor din eșantion. Este sarcina clinicianului să găsească astfel de diferențe (nu orice) care să ajute la diagnostic sau tratament. Și nu întotdeauna concluziile statistice stau la baza concluziilor clinice. Astfel, o scădere semnificativă statistic a hemoglobinei cu 3 g/l nu este un motiv de îngrijorare. Și, invers, dacă o problemă din corpul uman nu are un caracter de masă la nivelul întregii populații, acesta nu este un motiv pentru a nu face față acestei probleme.

Vom lua în considerare această poziție în exemplu.

Cercetătorii s-au întrebat dacă băieții care au avut un fel de boală infecțioasă au rămas în urmă față de semenii lor în creștere. În acest scop, a fost realizat un studiu selectiv, la care au participat 10 băieți care aveau această boală. Rezultatele sunt prezentate în tabelul 23.

Tabelul 23. Rezultate statistice

limita inferioara

Limita superioară

Specificații (cm)

mijloc

Din aceste calcule rezultă că înălțimea medie selectivă a băieților de 10 ani care au avut un fel de boală infecțioasă este aproape de normal (132,5 cm). Cu toate acestea, limita inferioară a intervalului de încredere (126,6 cm) indică faptul că există o probabilitate de 95% ca înălțimea medie adevărată a acestor copii să corespundă conceptului de „statură mică”, adică. acești copii sunt pipernici.

În acest exemplu, rezultatele calculelor intervalului de încredere sunt semnificative clinic.

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane