Să fie făcut un eșantion dintr-o populație generală supusă legii normal distributie XN( m; ). Această ipoteză de bază a statisticii matematice se bazează pe teorema centrală a limitei. Fie cunoscută abaterea standard generală , dar așteptarea matematică a distribuției teoretice este necunoscută m(valoarea medie ).

În acest caz, eșantionul înseamnă , obținut în timpul experimentului (secțiunea 3.4.2), va fi de asemenea o variabilă aleatorie m;
). Apoi abaterea „normalizată”.
N(0;1) este o variabilă aleatorie normală standard.

Problema este de a găsi o estimare a intervalului pentru m. Să construim un interval de încredere cu două fețe pentru m astfel încât adevărata așteptare matematică îi aparține cu o probabilitate dată (fiabilitate) .

Setați un astfel de interval pentru valoare
înseamnă a găsi valoarea maximă a acestei cantități
si minim
, care sunt limitele regiunii critice:
.

Deoarece această probabilitate este
, apoi rădăcina acestei ecuații
poate fi găsit folosind tabelele funcției Laplace (Tabelul 3, Anexa 1).

Apoi cu probabilitate se poate argumenta că variabila aleatoare
, adică media generală dorită aparține intervalului
. (3.13)

valoarea
(3.14)

numit precizie estimări.

Număr
cuantilă distribuție normală - poate fi găsită ca argument al funcției Laplace (Tabelul 3, Anexa 1), având în vedere raportul 2Ф( u)=, adică F( u)=
.

În schimb, în ​​funcție de valoarea specificată a abaterii se poate afla cu ce probabilitate media generală necunoscută aparține intervalului
. Pentru a face acest lucru, trebuie să calculați

. (3.15)

Să fie prelevat un eșantion aleatoriu din populația generală prin metoda de reselecție. Din ecuație
poate fi găsit minim volumul de reeșantionare n necesare pentru a se asigura că intervalul de încredere cu o fiabilitate dată nu a depășit valoarea prestabilită . Mărimea eșantionului necesară este estimată folosind formula:

. (3.16)

Explorând acuratețea estimării
:

1) Odată cu creșterea dimensiunii eșantionului n magnitudinea scade, și, prin urmare, acuratețea estimării crește.

2) C crește fiabilitatea estimărilor valoarea argumentului este incrementată u(deoarece F(u) crește monoton) și deci crește . În acest caz, creșterea fiabilității reduce acuratețea evaluării sale .

Estima
(3.17)

numit clasic(Unde t este un parametru care depinde de Și n), deoarece caracterizează cele mai frecvent întâlnite legi de distribuţie.

3.5.3 Intervale de încredere pentru estimarea așteptării unei distribuții normale cu o abatere standard necunoscută 

Să se știe că populația generală este supusă legii distribuției normale XN( m;), unde valoarea rădăcină medie pătrată abaterile necunoscut.

Pentru a construi un interval de încredere pentru estimarea mediei generale, în acest caz, se folosesc statistici
, care are o distribuție Student cu k= n-1 grad de libertate. Aceasta rezultă din faptul că N(0;1) (vezi punctul 3.5.2) și
(vezi clauza 3.5.3) și din definiția distribuției Student (partea 1.clauza 2.11.2).

Să găsim acuratețea estimării clasice a distribuției lui Student: i.e. găsi t din formula (3.17). Fie probabilitatea îndeplinirii inegalității
dat de fiabilitate :

. (3.18)

Deoarece TSf( n-1), este evident că t depinde de Și n, așa că de obicei scriem
.

(3.19)

Unde
este funcția de distribuție a Studentului cu n-1 grad de libertate.

Rezolvarea acestei ecuații pentru m, obținem intervalul
care cu fiabilitate  acoperă parametrul necunoscut m.

Valoare t , n-1 , folosit pentru a determina intervalul de încredere al unei variabile aleatoare T(n-1), distribuit de Student cu n-1 grad de libertate se numește Coeficientul elevului. Ar trebui găsită după valorile date nși  din tabelele „Puncte critice ale distribuției Studentului”. (Tabelul 6, Anexa 1), care sunt soluțiile ecuației (3.19).

Ca rezultat, obținem următoarea expresie precizie interval de încredere pentru estimarea așteptării matematice (media generală), dacă varianța este necunoscută:

(3.20)

Astfel, există o formulă generală pentru construirea intervalelor de încredere pentru așteptările matematice ale populației generale:

unde este precizia intervalului de încredere în funcţie de varianţa cunoscută sau necunoscută se găseşte conform formulelor respectiv 3.16. și 3.20.

Sarcina 10. Au fost efectuate câteva teste, ale căror rezultate sunt enumerate în tabel:

Construirea unui interval de încredere pentru așteptarea matematică a populației generale. Intervale de încredere pentru așteptări matematice, varianță, probabilitate

Fie o variabilă aleatoare (putem vorbi despre populația generală) să fie distribuită conform legii normale, pentru care se cunoaște varianța D = 2 (> 0). Din populația generală (pe mulțimea de obiecte din care se determină o variabilă aleatorie), se realizează un eșantion de mărimea n. Eșantionul x 1 , x 2 ,..., x n este considerat ca o mulțime de n variabile aleatoare independente distribuite în același mod ca (abordarea explicată mai sus în text).

Anterior, au fost discutate și dovedite și următoarele egalități:

Mx 1 = Mx 2 = ... = Mx n = M;

Dx 1 = Dx 2 = ... = Dx n = D;

Este suficient să demonstrăm pur și simplu (omitem dovada) că și variabila aleatoare în acest caz este distribuită conform legii normale.

Să notăm cu a valoarea necunoscută M și să alegem numărul d > 0 în funcție de fiabilitatea dată, astfel încât să fie îndeplinită următoarea condiție:

P(- a< d) = (1)

Deoarece variabila aleatoare este distribuită conform legii normale cu așteptarea matematică M = M = a și varianța D = D /n = 2 /n, obținem:

P(- a< d) =P(a - d < < a + d) =

Rămâne să alegem d astfel încât egalitatea

Pentru oricine, se poate găsi un astfel de număr t din tabel care (t) \u003d / 2. Acest număr t este uneori numit cuantilă.

Acum de la egalitate

definiți valoarea lui d:

Rezultatul final îl obținem prezentând formula (1) sub forma:

Semnificația ultimei formule este următoarea: cu fiabilitate, intervalul de încredere

acoperă parametrul necunoscut a = M al populației. Se poate spune altfel: o estimare punctuală determină valoarea parametrului M cu o precizie de d= t / și fiabilitate.

Sarcină. Să existe o populație generală cu o caracteristică distribuită conform legii normale cu o dispersie egală cu 6,25. S-a realizat un eșantion de volum n = 27 și s-a obținut valoarea medie a eșantionului a caracteristicii = 12. Aflați intervalul de încredere care acoperă așteptarea matematică necunoscută a caracteristicii studiate a populației generale cu fiabilitate = 0,99.

Soluţie. În primul rând, folosind tabelul pentru funcția Laplace, găsim valoarea lui t din ecuația (t) \u003d / 2 \u003d 0,495. Pe baza valorii obținute t = 2,58, determinăm acuratețea estimării (sau jumătate din lungimea intervalului de încredere) d: d = 2,52,58 / 1,24. De aici obținem intervalul de încredere dorit: (10,76; 13,24).

ipoteza statistică variaţională generală

Interval de încredere pentru așteptarea unei distribuții normale cu varianță necunoscută

Fie o variabilă aleatoare distribuită conform legii normale cu o așteptare matematică necunoscută M, pe care o notăm cu litera a . Să facem un eșantion de mărimea n. Să determinăm eșantionul mediu și varianța eșantionului corectat s 2 folosind formule cunoscute.

Valoare aleatoare

distribuite conform legii Student cu n - 1 grade de libertate.

Sarcina este de a găsi un astfel de număr t în funcție de fiabilitatea dată și de numărul de grade de libertate n - 1, astfel încât egalitatea

sau egalitate echivalentă

Aici, între paranteze, se scrie condiția ca valoarea parametrului necunoscut a să aparțină unui anumit interval, care este intervalul de încredere. Limitele sale depind de fiabilitate, precum și de parametrii de eșantionare și s.

Pentru a determina valoarea lui t după mărime, transformăm egalitatea (2) în forma:

Acum, conform tabelului pentru o variabilă aleatoare t, distribuită conform legii lui Student, după probabilitatea 1 - și numărul de grade de libertate n - 1, găsim t. Formula (3) oferă răspunsul la problemă.

Sarcină. În testele de control a 20 de lămpi electrice, durata medie de funcționare a acestora a fost egală cu 2000 de ore cu o abatere standard (calculată ca rădăcină pătrată a variației eșantionului corectat) egală cu 11 ore. Se știe că durata de funcționare a lămpii este o variabilă aleatoare distribuită în mod normal. Determinați cu o fiabilitate de 0,95 intervalul de încredere pentru așteptarea matematică a acestei variabile aleatoare.

Soluţie. Valoarea 1 - în acest caz este egală cu 0,05. Conform tabelului de distribuție a lui Student, cu numărul de grade de libertate egal cu 19, găsim: t = 2,093. Să calculăm acum acuratețea estimării: 2,093121/ = 56,6. De aici obținem intervalul de încredere dorit: (1943,4; 2056,6).

Și altele.Toate sunt estimări ale omologilor lor teoretici, care ar putea fi obținute dacă nu ar exista un eșantion, ci populația generală. Dar, din păcate, populația generală este foarte scumpă și adesea indisponibilă.

Conceptul de estimare a intervalului

Orice estimare a eșantionului are o oarecare împrăștiere, deoarece este o variabilă aleatorie în funcție de valorile dintr-un anumit eșantion. Prin urmare, pentru inferențe statistice mai fiabile, ar trebui să se cunoască nu numai estimarea punctuală, ci și intervalul, care cu o probabilitate mare γ (gama) acoperă indicatorul estimat θ (theta).

Formal, acestea sunt două astfel de valori (statistici) T1(X)Și T2(X), Ce T1< T 2 , pentru care la un nivel dat de probabilitate γ condiția este îndeplinită:

Pe scurt, este probabil γ sau mai mult valoarea adevărată este între puncte T1(X)Și T2(X), care sunt numite limite inferioare și superioare interval de încredere.

Una dintre condițiile pentru construirea intervalelor de încredere este îngustimea maximă a acestuia, adică. ar trebui să fie cât mai scurt posibil. Dorința este destul de firească, pentru că. cercetătorul încearcă să localizeze mai precis constatarea parametrului dorit.

Rezultă că intervalul de încredere ar trebui să acopere probabilitățile maxime ale distribuției. iar scorul în sine să fie în centru.

Adică, probabilitatea de abatere (a indicatorului adevărat de la estimare) în sus este egală cu probabilitatea de abatere în jos. De asemenea, trebuie remarcat faptul că, pentru distribuțiile înclinate, intervalul din dreapta nu este egal cu intervalul din stânga.

Figura de mai sus arată clar că cu cât nivelul de încredere este mai mare, cu atât intervalul este mai larg - o relație directă.

Aceasta a fost o mică introducere în teoria estimării pe intervale a parametrilor necunoscuți. Să trecem la găsirea limitelor de încredere pentru așteptarea matematică.

Interval de încredere pentru așteptările matematice

Dacă datele originale sunt distribuite peste , atunci media va fi o valoare normală. Aceasta rezultă din regula că o combinație liniară de valori normale are și o distribuție normală. Prin urmare, pentru a calcula probabilitățile, am putea folosi aparatul matematic al legii distribuției normale.

Cu toate acestea, acest lucru va necesita cunoașterea a doi parametri - valoarea așteptată și varianța, care de obicei nu sunt cunoscute. Desigur, puteți utiliza estimări în loc de parametri (media aritmetică și ), dar atunci distribuția mediei nu va fi destul de normală, va fi ușor aplatizată. Cetățeanul irlandez William Gosset a remarcat cu pricepere acest fapt când și-a publicat descoperirea în numărul din martie 1908 al revistei Biometrica. Din motive de secret, Gosset a semnat cu Student. Așa a apărut distribuția t a Studentului.

Cu toate acestea, distribuția normală a datelor, folosită de K. Gauss în analiza erorilor în observațiile astronomice, este extrem de rară în viața terestră și este destul de dificil de stabilit acest lucru (pentru o precizie ridicată sunt necesare aproximativ 2 mii de observații). Prin urmare, cel mai bine este să renunțați la ipoteza de normalitate și să utilizați metode care nu depind de distribuția datelor originale.

Se pune întrebarea: care este distribuția mediei aritmetice dacă este calculată din datele unei distribuții necunoscute? Răspunsul este dat de binecunoscuta teoria probabilității Teorema limitei centrale(CPT). În matematică, există mai multe versiuni ale acesteia (formulările au fost rafinate de-a lungul anilor), dar toate, grosier vorbind, se reduc la afirmația că suma unui număr mare de variabile aleatoare independente se supune legii distribuției normale.

La calcularea mediei aritmetice se folosește suma variabilelor aleatoare. Din aceasta rezultă că media aritmetică are o distribuție normală, în care valoarea așteptată este valoarea așteptată a datelor inițiale, iar varianța este .

Oamenii inteligenți știu să demonstreze CLT, dar vom verifica acest lucru cu ajutorul unui experiment realizat în Excel. Să simulăm un eșantion de 50 de variabile aleatoare distribuite uniform (folosind funcția Excel RANDOMBETWEEN). Apoi vom face 1000 de astfel de mostre și vom calcula media aritmetică pentru fiecare. Să ne uităm la distribuția lor.

Se poate observa că distribuția mediei este apropiată de legea normală. Dacă volumul probelor și numărul lor sunt și mai mari, atunci asemănarea va fi și mai bună.

Acum că am văzut singuri validitatea CLT, putem, folosind , calcula intervalele de încredere pentru media aritmetică, care acoperă media adevărată sau așteptarea matematică cu o probabilitate dată.

Pentru a stabili limitele superioare și inferioare, este necesară cunoașterea parametrilor distribuției normale. De regulă, acestea nu sunt, prin urmare, sunt utilizate estimări: medie aritmeticăȘi varianța eșantionului. Din nou, această metodă oferă o aproximare bună numai pentru eșantioane mari. Când eșantioanele sunt mici, se recomandă adesea să folosiți distribuția Student. Nu crede! Distribuția lui Student pentru medie apare numai atunci când datele originale au o distribuție normală, adică aproape niciodată. Prin urmare, este mai bine să setați imediat bara minimă pentru cantitatea de date necesare și să utilizați metode corecte asimptotic. Se spune că 30 de observații sunt suficiente. Luați 50 - nu puteți greși.

T 1.2 sunt limitele inferioare și superioare ale intervalului de încredere

– medie aritmetică eșantionului

s0– abaterea standard a eșantionului (nepărtinitoare)

n - marime de mostra

γ – nivelul de încredere (de obicei egal cu 0,9, 0,95 sau 0,99)

c γ =Φ -1 ((1+γ)/2) este reciproca funcției de distribuție normală standard. În termeni simpli, acesta este numărul de erori standard de la media aritmetică la limita inferioară sau superioară (cele trei probabilități indicate corespund valorilor 1,64, 1,96 și 2,58).

Esența formulei este că se ia media aritmetică și apoi se pune deoparte o anumită sumă ( cu γ) erori standard ( s 0 /√n). Totul se știe, ia-l și numără.

Înainte de utilizarea în masă a PC-urilor, pentru a obține valorile funcției de distribuție normală și inversul acesteia, au folosit . Sunt încă folosite, dar este mai eficient să apelezi la formule Excel gata făcute. Toate elementele din formula de mai sus ( , și ) pot fi calculate cu ușurință în Excel. Dar există și o formulă gata făcută pentru calcularea intervalului de încredere - NORMA DE ÎNCREDERE. Sintaxa sa este următoarea.

NORMĂ DE ÎNCREDERE(alpha, standard_dev, size)

alfa– nivelul de semnificație sau nivelul de încredere, care în notația de mai sus este egal cu 1-γ, i.e. probabilitatea ca matematicaașteptarea va fi în afara intervalului de încredere. Cu un nivel de încredere de 0,95, alfa este 0,05 și așa mai departe.

standard_off este abaterea standard a datelor eșantionului. Nu trebuie să calculați eroarea standard, Excel va împărți la rădăcina lui n.

mărimea– dimensiunea eșantionului (n).

Rezultatul functiei CONFIDENCE.NORM este al doilea termen din formula de calcul a intervalului de incredere, i.e. jumătate de interval. În consecință, punctele inferior și superior sunt media ± valoarea obținută.

Astfel, este posibil să se construiască un algoritm universal pentru calcularea intervalelor de încredere pentru media aritmetică, care nu depinde de distribuția datelor inițiale. Prețul pentru universalitate este natura sa asimptotică, adică. necesitatea de a folosi mostre relativ mari. Cu toate acestea, în era tehnologiei moderne, colectarea cantității potrivite de date nu este de obicei dificilă.

Testarea ipotezelor statistice folosind un interval de încredere

(modulul 111)

Una dintre principalele probleme rezolvate în statistică este. Pe scurt, esența sa este aceasta. Se presupune, de exemplu, că așteptările populației generale sunt egale cu o anumită valoare. Apoi se construiește distribuția mediilor eșantionului, care poate fi observată cu o așteptare dată. În continuare, ne uităm la locul în care se află media reală în această distribuție condiționată. Dacă depășește limitele admise, atunci apariția unei astfel de medii este foarte puțin probabilă, iar cu o singură repetare a experimentului este aproape imposibil, ceea ce contrazice ipoteza propusă, care este respinsă cu succes. Dacă media nu depășește nivelul critic, atunci ipoteza nu este respinsă (dar nici nu se dovedește!).

Deci, cu ajutorul intervalelor de încredere, în cazul nostru pentru așteptare, puteți testa și unele ipoteze. Este foarte ușor de făcut. Să presupunem că media aritmetică pentru un eșantion este 100. Se testează ipoteza că așteptarea este, să zicem, 90. Adică, dacă punem întrebarea în mod primitiv, sună astfel: se poate că, cu adevărata valoare a medie egală cu 90, media observată a fost 100?

Pentru a răspunde la această întrebare, vor fi necesare informații suplimentare despre abaterea standard și dimensiunea eșantionului. Să presupunem că abaterea standard este 30, iar numărul de observații este 64 (pentru a extrage cu ușurință rădăcina). Atunci eroarea standard a mediei este 30/8 sau 3,75. Pentru a calcula intervalul de încredere de 95%, va trebui să lăsați deoparte două erori standard de ambele părți ale mediei (mai precis, 1,96). Intervalul de încredere va fi de aproximativ 100 ± 7,5 sau de la 92,5 la 107,5.

Raționamentul suplimentar este următorul. Dacă valoarea testată se încadrează în intervalul de încredere, atunci nu contrazice ipoteza, deoarece se încadrează în limitele fluctuațiilor aleatorii (cu o probabilitate de 95%). Dacă punctul testat se află în afara intervalului de încredere, atunci probabilitatea unui astfel de eveniment este foarte mică, în orice caz sub nivelul acceptabil. Prin urmare, ipoteza este respinsă ca fiind în contradicție cu datele observate. În cazul nostru, ipoteza așteptărilor se află în afara intervalului de încredere (valoarea testată de 90 nu este inclusă în intervalul de 100±7,5), deci ar trebui respinsă. Răspunzând la întrebarea primitivă de mai sus, ar trebui să spunem: nu, nu se poate, în niciun caz, acest lucru se întâmplă extrem de rar. Adesea, aceasta indică o probabilitate specifică de respingere eronată a ipotezei (p-level), și nu un nivel dat, conform căruia a fost construit intervalul de încredere, ci mai mult de altă dată.

După cum puteți vedea, nu este dificil să construiți un interval de încredere pentru medie (sau așteptări matematice). Principalul lucru este să prindeți esența și apoi lucrurile vor merge. În practică, cei mai mulți folosesc intervalul de încredere de 95%, care are aproximativ două erori standard de fiecare parte a mediei.

Asta este tot pentru acum. Toate cele bune!

Fie variabila aleatoare X a populației generale să fie distribuită normal, având în vedere că varianța și abaterea standard s ale acestei distribuții sunt cunoscute. Este necesar să se estimeze așteptările matematice necunoscute din media eșantionului. În acest caz, problema se reduce la găsirea unui interval de încredere pentru așteptarea matematică cu fiabilitate b. Dacă stabilim valoarea probabilității de încredere (fiabilitatea) b, atunci putem găsi probabilitatea de a cădea în intervalul pentru așteptarea matematică necunoscută folosind formula (6.9a):

unde Ф(t) este funcția Laplace (5.17a).

Ca rezultat, putem formula un algoritm pentru găsirea limitelor intervalului de încredere pentru așteptarea matematică dacă se cunoaște varianța D = s 2:

  1. Setați valoarea fiabilității la b .
  2. Din (6.14) exprimă Ф(t) = 0,5× b. Selectați valoarea t din tabel pentru funcția Laplace cu valoarea Ф(t) (vezi Anexa 1).
  3. Calculați abaterea e folosind formula (6.10).
  4. Scrieți intervalul de încredere conform formulei (6.12) astfel încât cu probabilitatea b următoarea inegalitate să fie adevărată:

.

Exemplul 5.

Variabila aleatoare X are o distribuție normală. Găsiți intervale de încredere pentru o estimare cu fiabilitatea b = 0,96 a mediei necunoscute a, dacă este dat:

1) abaterea standard generală s = 5;

2) media eșantionului;

3) dimensiunea eșantionului n = 49.

În formula (6.15) a intervalului de estimare a așteptării matematice A cu fiabilitatea b, toate mărimile cu excepția t sunt cunoscute. Valoarea lui t poate fi găsită folosind (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Conform tabelului din Anexa 1 pentru funcția Laplace Ф(t) = 0,48, găsiți valoarea corespunzătoare t = 2,06. Prin urmare, . Înlocuind valoarea calculată a lui e în formula (6.12), putem obține un interval de încredere: 30-1,47< a < 30+1,47.

Intervalul de încredere dorit pentru o estimare cu fiabilitatea b = 0,96 a așteptării matematice necunoscute este: 28,53< a < 31,47.

X i

Se stie ca se supun legii distributiei normale cu
. Găsiți o estimare m* pentru așteptări matematice m, construiește un interval de încredere de 90% pentru acesta.

Soluţie:

Asa de, m(2.53;5.47).

Sarcina 11. Adâncimea mării este măsurată de un instrument a cărui eroare sistematică este 0, iar erorile aleatorii sunt distribuite conform legii normale, cu o abatere standard. = 15 m. Câte măsurători independente ar trebui făcute pentru a determina adâncimea cu erori de cel mult 5 m cu un nivel de încredere de 90%?

Soluţie:

După starea problemei, avem XN( m; ), Unde = 15 m, =5m, =0,9. Să găsim volumul n.

1) Cu o fiabilitate dată = 0,9, găsim din tabelele 3 (Anexa 1) argumentul funcției Laplace u = 1.65.

2) Cunoașterea acurateței estimării date =u=5, găsiți
. Avem

. Prin urmare, numărul de încercări n25.

Sarcina 12. Prelevare de probe de temperatură t pentru primele 6 zile ale lunii ianuarie este prezentată în tabel:

Găsiți intervalul de încredere pentru așteptări m populaţia generală cu probabilitate de încredere
și estimați abaterea standard generală s.

Soluţie:


Și
.

2) Estimare imparțială găsi prin formulă
:

=-175

=234.84

;
;

=-192

=116


.

3) Deoarece varianța generală este necunoscută, dar estimarea ei este cunoscută, atunci pentru a estima așteptarea matematică m folosim distribuția lui Student (Tabelul 6, Anexa 1) și formula (3.20).

Deoarece n 1 =n 2 =6, atunci ,
, s 1 =6,85 avem:
, deci -29,2-4,1<m 1 < -29.2+4.1.

Prin urmare -33,3<m 1 <-25.1.

În mod similar, avem
, s 2 = 4,8, deci

–34.9< m 2 < -29.1. Тогда доверительные интервалы примут вид: m 1 (-33,3;-25,1) și m 2 (-34.9;-29.1).

În științele aplicate, de exemplu, în disciplinele de construcție, pentru a evalua acuratețea obiectelor sunt folosite tabele cu intervale de încredere, care sunt date în literatura de referință relevantă.

În statistică, există două tipuri de estimări: punct și interval. Estimarea punctului este un singur eșantion statistic care este utilizat pentru a estima un parametru de populație. De exemplu, media eșantionului este o estimare punctuală a mediei populației și a varianței eșantionului S2- estimarea punctuală a varianței populației σ2. sa demonstrat că media eșantionului este o estimare imparțială a așteptărilor populației. Media eșantionului se numește imparțial deoarece media tuturor mediilor eșantionului (cu aceeași dimensiune a eșantionului n) este egală cu așteptarea matematică a populației generale.

Pentru variația eșantionului S2 a devenit un estimator imparțial al varianței populației σ2, numitorul varianței eșantionului trebuie setat egal cu n – 1 , dar nu n. Cu alte cuvinte, varianța populației este media tuturor variațiilor posibile ale eșantionului.

La estimarea parametrilor populației, ar trebui să se țină cont de faptul că statisticile eșantionului precum , depind de mostre specifice. A ține cont de acest fapt, a obține estimarea intervalului așteptările matematice ale populației generale analizează distribuția mediilor eșantionului (pentru mai multe detalii, vezi). Intervalul construit este caracterizat de un anumit nivel de încredere, care este probabilitatea ca parametrul adevărat al populației generale să fie estimat corect. Intervale similare de încredere pot fi utilizate pentru a estima proporția unei caracteristici Rși principala masă distribuită a populației generale.

Descărcați nota în sau format, exemple în format

Construirea unui interval de încredere pentru așteptarea matematică a populației generale cu o abatere standard cunoscută

Construirea unui interval de încredere pentru proporția unei trăsături în populația generală

În această secțiune, conceptul de interval de încredere este extins la datele categorice. Acest lucru vă permite să estimați ponderea trăsăturii în populația generală R cu o cotă de probă RS= X/n. După cum sa menționat, dacă valorile nRȘi n(1 - p) depășește numărul 5, distribuția binomială poate fi aproximată cu cea normală. Prin urmare, pentru a estima ponderea unei trăsături în populația generală R se poate construi un interval al cărui nivel de încredere este egal cu (1 - α)x100%.


Unde pS- cota de eșantion a caracteristicii, egală cu X/n, adică numărul de succese împărțit la dimensiunea eșantionului, R- ponderea trăsăturii în populația generală, Z este valoarea critică a distribuției normale standardizate, n- marime de mostra.

Exemplul 3 Sa presupunem ca din sistemul informatic se extrage o proba, formata din 100 de facturi completate in ultima luna. Să presupunem că 10 dintre aceste facturi sunt incorecte. Prin urmare, R= 10/100 = 0,1. Nivelul de încredere de 95% corespunde valorii critice Z = 1,96.

Astfel, există o șansă de 95% ca între 4,12% și 15,88% din facturi să conțină erori.

Pentru o anumită dimensiune a eșantionului, intervalul de încredere care conține proporția trăsăturii în populația generală pare a fi mai larg decât pentru o variabilă aleatoare continuă. Acest lucru se datorează faptului că măsurătorile unei variabile aleatoare continue conțin mai multe informații decât măsurătorile datelor categorice. Cu alte cuvinte, datele categorice care iau doar două valori conțin informații insuficiente pentru a estima parametrii distribuției lor.

ÎNcalculul estimărilor extrase dintr-o populație finită

Estimarea așteptărilor matematice. Factorul de corecție pentru populația finală ( fpc) a fost folosit pentru a reduce eroarea standard cu un factor de . La calcularea intervalelor de încredere pentru estimările parametrilor populației, se aplică un factor de corecție în situațiile în care eșantioanele sunt extrase fără înlocuire. Astfel, intervalul de încredere pentru așteptarea matematică, având un nivel de încredere egal cu (1 - α)x100%, se calculează prin formula:

Exemplul 4 Pentru a ilustra aplicarea unui factor de corecție pentru o populație finită, să revenim la problema calculării intervalului de încredere pentru suma medie a facturilor discutată în exemplul 3 de mai sus. Să presupunem că o companie emite 5.000 de facturi pe lună și X= 110,27 USD, S= 28,95 USD N = 5000, n = 100, α = 0,05, t99 = 1,9842. Conform formulei (6) obținem:

Estimarea ponderii caracteristicii. Atunci când alegeți fără întoarcere, intervalul de încredere pentru proporția caracteristicii care are un nivel de încredere egal cu (1 - α)x100%, se calculează prin formula:

Intervale de încredere și probleme etice

Atunci când se eșantionează o populație și se formulează inferențe statistice, apar adesea probleme etice. Principalul este modul în care intervalele de încredere și estimările punctuale ale statisticilor eșantionului sunt de acord. Publicarea estimărilor punctului fără a specifica intervalele de încredere adecvate (de obicei la niveluri de încredere de 95%) și dimensiunea eșantionului din care sunt derivate pot fi înșelătoare. Acest lucru poate da utilizatorului impresia că o estimare punctuală este exact ceea ce are nevoie pentru a prezice proprietățile întregii populații. Astfel, este necesar să se înțeleagă că în orice cercetare, nu estimările punctuale, ci pe intervale ar trebui puse în prim-plan. În plus, trebuie acordată o atenție deosebită alegerii corecte a dimensiunilor eșantionului.

Cel mai adesea, obiectele manipulărilor statistice sunt rezultatele anchetelor sociologice ale populației pe diverse probleme politice. În același timp, rezultatele sondajului sunt plasate pe primele pagini ale ziarelor, iar eroarea de eșantionare și metodologia analizei statistice sunt tipărite undeva la mijloc. Pentru a demonstra validitatea estimărilor punctuale obţinute este necesar să se indice mărimea eşantionului pe baza căruia au fost obţinute, limitele intervalului de încredere şi nivelul de semnificaţie al acestuia.

Următoarea notă

Sunt folosite materiale din cartea Levin et al. Statistici pentru manageri. - M.: Williams, 2004. - p. 448–462

Teorema limitei centrale afirmă că, având în vedere o dimensiune a eșantionului suficient de mare, distribuția eșantionului de medii poate fi aproximată printr-o distribuție normală. Această proprietate nu depinde de tipul de distribuție a populației.

CATEGORII

ARTICOLE POPULARE

2023 "kingad.ru" - examinarea cu ultrasunete a organelor umane