Să construim un interval de încredere în MS EXCEL pentru a estima valoarea medie a distribuției în cazul unei valori de dispersie cunoscute.

Desigur alegerea nivelul de încredere depinde complet de problema rezolvată. Astfel, gradul de încredere al unui pasager aerian în fiabilitatea unui avion ar trebui să fie, fără îndoială, mai mare decât gradul de încredere al unui cumpărător în fiabilitatea unui bec electric.

Formularea problemei

Să presupunem că de la populatia fiind luate probă marimea n. Se presupune că deviație standard această distribuţie este cunoscută. Este necesar pe baza acestui lucru mostre evalua necunoscutul mijloc de distribuție(μ, ) și construiți corespunzătoare cu două fețe interval de încredere.

Estimare punctuală

După cum se știe din statistici(să o notăm medie X) este estimare imparțială a mediei acest populatiași are o distribuție N(μ;σ 2 /n).

Notă: Ce să faci dacă trebuie să construiești interval de încredereîn cazul unei distribuţii care nu este normal?În acest caz, vine în ajutor, care afirmă că cu o dimensiune suficient de mare mostre n din distribuție a nu fi normal, distribuția eșantionului de statistici X avg voi aproximativ corespund distributie normala cu parametrii N(μ;σ 2 /n).

Asa de, estimare punctuală in medie valorile de distribuție avem - asta eșantion mediu, adică medie X. Acum să începem interval de încredere.

Construirea unui interval de încredere

De obicei, cunoscând distribuția și parametrii acesteia, putem calcula probabilitatea ca variabila aleatoare să ia o valoare din intervalul pe care îl specificăm. Acum să facem invers: găsiți intervalul în care variabila aleatoare va cădea cu o probabilitate dată. De exemplu, din proprietăți distributie normala se ştie că, cu o probabilitate de 95%, o variabilă aleatoare distribuită peste legea normală, se va încadra în intervalul de aproximativ +/- 2 de la valoarea medie(vezi articolul despre). Acest interval ne va servi drept prototip interval de încredere.

Acum să vedem dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să indicăm forma distribuției și parametrii acesteia.

Cunoaștem forma de distribuție - aceasta este distributie normala(rețineți că vorbim despre distribuția eșantionului statistici medie X).

Parametrul μ ne este necunoscut (trebuie doar estimat folosind interval de încredere), dar avem o estimare a acesteia medie X, calculat pe baza mostre, care poate fi folosit.

Al doilea parametru - abaterea standard a mediei eșantionului îl vom considera cunoscut, este egal cu σ/√n.

Deoarece nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu de la valoarea medie, și din estimarea sa cunoscută medie X. Acestea. la calcul interval de încredere NU vom presupune că medie X se încadrează în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul este +/- 2 abateri standard din medie X cu 95% probabilitate va acoperi μ – media populației generale, din care a fost luat probă. Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim interval de încredere.

În plus, să clarificăm intervalul: o variabilă aleatoare distribuită peste legea normală, cu o probabilitate de 95% se încadrează în intervalul +/- 1.960 abateri standard, nu +/- 2 abateri standard. Aceasta poate fi calculată folosind formula =NORM.ST.REV((1+0,95)/2), cm. fișier exemplu Sheet Interval.

Acum putem formula o afirmație probabilistică care ne va servi să formăm interval de încredere:
„Probabilitatea ca media populatiei situat din medie a probeiîn termen de 1.960 " abaterile standard ale mediei eșantionului", egal cu 95%”.

Valoarea probabilității menționată în declarație are o denumire specială , care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivel de încredere =1 . În cazul nostru nivelul de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, scriem o expresie pentru calcul interval de încredere:

unde Z α/2 standard distributie normala(această valoare a variabilei aleatoare z, Ce P(z>=Z α/2 )=α/2).

Notă: α/2-quantila superioară definește lățimea interval de încredere V abateri standard eșantion mediu. α/2-quantila superioară standard distributie normalaîntotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, cu α=0,05, α/2-quantila superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α/2-quantila superioară Z α/2 poate fi calculat folosind formula =NORM.ST.REV(1-α/2) sau, dacă este cunoscută nivel de încredere, =NORM.ST.OBR((1+nivel de încredere)/2).

De obicei, la construirea intervale de încredere pentru estimarea mediei utilizați numai α superioară/2-cuantilă si nu folositi mai mic α/2-cuantilă. Acest lucru este posibil pentru că standard distributie normala simetric fata de axa x ( densitatea sa de distribuție simetric despre medie, adică 0). Prin urmare, nu este nevoie să se calculeze α/2-cuantilă mai mică(se numește pur și simplu α /2-quantila), deoarece este egal α superioară/2-cuantilă cu semnul minus.

Să ne amintim că, în ciuda formei distribuției valorii x, variabila aleatoare corespunzătoare medie X distribuite aproximativ Amenda N(μ;σ 2 /n) (vezi articolul despre). Prin urmare, în general, expresia de mai sus pentru interval de încredere este doar o aproximare. Dacă valoarea x este distribuită peste legea normală N(μ;σ 2 /n), apoi expresia pentru interval de încredere este exactă.

Calcul intervalului de încredere în MS EXCEL

Să rezolvăm problema.
Timpul de răspuns al unei componente electronice la un semnal de intrare este o caracteristică importantă a dispozitivului. Un inginer dorește să construiască un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Din experiența anterioară, inginerul știe că abaterea standard a timpului de răspuns este de 8 ms. Se știe că pentru a evalua timpul de răspuns, inginerul a făcut 25 de măsurători, valoarea medie a fost de 78 ms.

Soluţie: Un inginer vrea să cunoască timpul de răspuns al unui dispozitiv electronic, dar înțelege că timpul de răspuns nu este o valoare fixă, ci o variabilă aleatorie care are propria sa distribuție. Deci, cel mai bun lucru la care poate spera este să determine parametrii și forma acestei distribuții.

Din păcate, din condițiile problemei nu cunoaștem forma distribuției timpului de răspuns (nu trebuie să fie normal). , această distribuție este de asemenea necunoscută. Numai el este cunoscut deviație standardσ=8. Prin urmare, în timp ce nu putem calcula probabilitățile și construi interval de încredere.

Cu toate acestea, în ciuda faptului că nu cunoaștem distribuția timp răspuns separat, știm că conform CPT, distribuția eșantionului timpul mediu de răspuns este de aproximativ normal(vom presupune că condițiile CPT sunt efectuate, deoarece mărimea mostre destul de mare (n=25)) .

În plus, in medie această distribuţie este egală cu valoarea medie distribuția unui singur răspuns, adică μ. A deviație standard a acestei distribuții (σ/√n) poate fi calculată folosind formula =8/ROOT(25) .

De asemenea, se știe că inginerul a primit estimare punctuală parametrul μ egal cu 78 ms (X avg). Prin urmare, acum putem calcula probabilități, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (X avg și σ/√n).

Inginerul vrea să știe valorea estimataμ distribuțiile timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea matematică a distribuției eșantionului a timpului mediu de răspuns. Dacă folosim distributie normala N(X avg; σ/√n), atunci μ dorit va fi în intervalul +/-2*σ/√n cu o probabilitate de aproximativ 95%.

Nivel de semnificație este egal cu 1-0,95=0,05.

În cele din urmă, să găsim marginile din stânga și din dreapta interval de încredere.
Chenarul din stânga: =78-NORM.ST.REV(1-0,05/2)*8/ROOT(25) = 74,864
Chenarul din dreapta: =78+NORM.ST.INV(1-0,05/2)*8/ROOT(25)=81,136

Chenarul din stânga: =NORM.REV(0,05/2; 78; 8/ROOT(25))
Chenarul din dreapta: =NORM.REV(1-0,05/2; 78; 8/ROOT(25))

Răspuns: interval de încredere la Nivel de încredere de 95% și σ=8msec egală 78+/-3,136 ms.

ÎN exemplu de fișier pe foaia Sigma cunoscut, a creat o formă de calcul și construcție cu două fețe interval de încredere pentru arbitrar mostre cu σ dat și nivelul de semnificație.

Funcția CONFIDENCE.NORM().

Dacă valorile mostre sunt în gamă B20:B79 , A nivelul de semnificație egal cu 0,05; apoi formula MS EXCEL:
=MEDIE(B20:B79)-ÎNCREDERE.NORMĂ(0,05;σ; NUMĂRĂ (B20:B79))
va întoarce marginea stângă interval de încredere.

Aceeași limită poate fi calculată folosind formula:
=AVERAGE(B20:B79)-NORM.ST.REV(1-0,05/2)*σ/ROOT(COUNT(B20:B79))

Notă: Funcția CONFIDENCE.NORM() a apărut în MS EXCEL 2010. În versiunile anterioare ale MS EXCEL, a fost folosită funcția TRUST().

Interval de încredere pentru așteptările matematice - acesta este un interval calculat din date care, cu o probabilitate cunoscuta, contine asteptarea matematica a populatiei generale. O estimare naturală a așteptărilor matematice este media aritmetică a valorilor observate. Prin urmare, pe parcursul lecției vom folosi termenii „medie” și „valoare medie”. În problemele de calculare a unui interval de încredere, un răspuns cel mai adesea cerut este ceva de genul „Intervalul de încredere al numărului mediu [valoarea unei anumite probleme] este de la [valoare mai mică] la [valoare mai mare]”. Folosind un interval de încredere, puteți evalua nu numai valorile medii, ci și proporția unei anumite caracteristici a populației generale. Valorile medii, dispersia, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt discutate în lecție Caracteristicile eșantionului și populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației este estimată printr-un număr (punct), atunci o medie specifică, care este calculată dintr-un eșantion de observații, este luată ca o estimare a valorii medii necunoscute a populației. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când indicați media eșantionului, trebuie să indicați simultan eroarea de eșantionare. Măsura erorii de eșantionare este eroarea standard, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei trebuie să fie asociată cu o anumită probabilitate, atunci parametrul de interes în populație trebuie evaluat nu printr-un număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate P se constată valoarea indicatorului populaţiei estimate. Interval de încredere în care este probabil P = 1 - α se găsește variabila aleatoare, calculată după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației;
  • sau abaterea standard a populației este necunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului n ar trebui înlocuit cu n-1.

Exemplul 1. S-au colectat informații din 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din acestea este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% pentru numărul de angajați ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a variat între 9,6 și 11,4.

Exemplul 2. Pentru un eșantion aleatoriu dintr-o populație de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru așteptările matematice.

Să calculăm abaterea standard:

,

Să calculăm valoarea medie:

.

Înlocuim valorile în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3. Pentru un eșantion de populație aleatoriu de 100 de observații, media calculată este 15,2 și abaterea standard este 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân neschimbate și coeficientul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a variat între 14,57 și 15,82.

Substituim din nou aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a variat între 14,37 și 16,02.

După cum vedem, pe măsură ce coeficientul de încredere crește, crește și valoarea critică a distribuției normale standard și, în consecință, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și astfel intervalul de încredere pentru așteptarea matematică crește. .

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unui atribut al eșantionului poate fi interpretată ca o estimare punctuală a cotei p de aceeaşi caracteristică în populaţia generală. Dacă această valoare trebuie să fie asociată cu probabilitatea, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populaţie cu probabilitate P = 1 - α :

.

Exemplul 4.Într-un oraș sunt doi candidați AȘi B candideaza pentru functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că ar vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Interval de încredere– valorile limită ale unei mărimi statistice care, cu o probabilitate de încredere dată γ, se vor afla în acest interval la eșantionarea unui volum mai mare. Notat cu P(θ - ε. În practică, probabilitatea de încredere γ este aleasă dintre valori destul de apropiate de unitate: γ = 0,9, γ = 0,95, γ = 0,99.

Scopul serviciului. Folosind acest serviciu, puteți determina:

  • interval de încredere pentru media generală, interval de încredere pentru varianță;
  • interval de încredere pentru abaterea standard, interval de încredere pentru cota generală;
Soluția rezultată este salvată într-un fișier Word (vezi exemplu). Mai jos este o instrucțiune video despre cum să completați datele inițiale.

Exemplul nr. 1. Într-o fermă colectivă, dintr-un efectiv total de 1000 de oi, 100 de oi au fost tunse cu control selectiv. Ca urmare, s-a stabilit o tăiere medie a lânii de 4,2 kg per oaie. Determinați cu o probabilitate de 0,99 eroarea pătratică medie a eșantionului la determinarea mediei de forfecare a lânii per oaie și limitele în care este conținută valoarea de forfecare dacă varianța este 2,5. Eșantionul este nerepetitiv.
Exemplul nr. 2. Dintr-un lot de produse importate la postul Vămii de Nord din Moscova, 20 de mostre de produs „A” au fost prelevate prin prelevare aleatorie repetată. În urma testului, a fost stabilit conținutul mediu de umiditate al produsului „A” din probă, care s-a dovedit a fi egal cu 6% cu o abatere standard de 1%.
Determinați cu probabilitate 0,683 limitele conținutului mediu de umiditate al produsului în întregul lot de produse importate.
Exemplul nr. 3. Un sondaj efectuat pe 36 de studenți a arătat că numărul mediu de manuale citite de aceștia în cursul anului universitar a fost egal cu 6. Presupunând că numărul de manuale citite de un student pe semestru are o lege de distribuție normală cu o abatere standard egală cu 6, găsiți : A) cu o fiabilitate de 0,99 estimare de interval pentru așteptarea matematică a acestei variabile aleatoare; B) cu ce probabilitate putem spune că numărul mediu de manuale citite de un student pe semestru, calculat din acest eșantion, se va abate de la așteptarea matematică în valoare absolută cu cel mult 2.

Clasificarea intervalelor de încredere

După tipul de parametru evaluat:

După tipul de eșantion:

  1. Interval de încredere pentru un eșantion infinit;
  2. Interval de încredere pentru eșantionul final;
Eșantionul se numește reeșantionare, dacă obiectul selectat este returnat populației înainte de a-l selecta pe următorul. Eșantionul se numește non-repeat, dacă obiectul selectat nu este returnat populației. În practică, de obicei avem de-a face cu mostre nerepetitive.

Calculul erorii medii de eșantionare pentru eșantionarea aleatorie

Discrepanța dintre valorile indicatorilor obținuți din eșantion și parametrii corespunzători ai populației generale se numește eroare de reprezentativitate.
Desemnări ale parametrilor principali ai populațiilor generale și eșantionului.

Matematică și informatică. Ghid de studiu pentru întregul curs

Fie ca variabila aleatoare X a populației să fie distribuită normal, ținând cont de faptul că varianța și abaterea standard s ale acestei distribuții sunt cunoscute. Este necesar să se estimeze așteptările matematice necunoscute folosind media eșantionului. În acest caz, sarcina se reduce la găsirea unui interval de încredere pentru așteptarea matematică cu fiabilitate b. Dacă specificați valoarea probabilității de încredere (fiabilitatea) b, atunci puteți găsi probabilitatea de a cădea în intervalul pentru așteptarea matematică necunoscută folosind formula (6.9a):

unde Ф(t) este funcția Laplace (5.17a).

Ca rezultat, putem formula un algoritm pentru găsirea limitelor intervalului de încredere pentru așteptarea matematică dacă se cunoaște varianța D = s 2:

  1. Setați valoarea fiabilității – b.
  2. Din (6.14) exprimă Ф(t) = 0,5× b. Selectați valoarea lui t din tabel pentru funcția Laplace pe baza valorii Ф(t) (vezi Anexa 1).
  3. Calculați abaterea e folosind formula (6.10).
  4. Scrieți un interval de încredere folosind formula (6.12) astfel încât cu probabilitatea b inegalitatea să fie valabilă:

.

Exemplul 5.

Variabila aleatoare X are o distribuție normală. Găsiți intervale de încredere pentru o estimare cu fiabilitatea b = 0,96 a așteptării matematice necunoscute a, dacă este dat:

1) abaterea standard generală s = 5;

2) media eșantionului;

3) dimensiunea eșantionului n = 49.

În formula (6.15) a intervalului de estimare a așteptării matematice A cu fiabilitatea b toate mărimile cu excepția t sunt cunoscute. Valoarea lui t poate fi găsită folosind (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Folosind tabelul din Anexa 1 pentru funcția Laplace Ф(t) = 0,48, găsiți valoarea corespunzătoare t = 2,06. Prin urmare, . Prin înlocuirea valorii calculate a lui e în formula (6.12), puteți obține un interval de încredere: 30-1,47< a < 30+1,47.

Intervalul de încredere necesar pentru o estimare cu fiabilitatea b = 0,96 a așteptării matematice necunoscute este egal cu: 28,53< a < 31,47.

Formule de eroare medie de eșantionare
re-selectarerepeta selectia
pentru mediepentru împărțirepentru mediepentru împărțire
Relația dintre limita erorii de eșantionare (Δ) este garantată cu o oarecare probabilitate Р(t), iar eroarea medie de eșantionare are forma: sau Δ = t·μ, unde t– coeficient de încredere, determinat în funcție de nivelul de probabilitate P(t) conform tabelului funcției integrale Laplace.

Formule pentru calcularea dimensiunii eșantionului folosind o metodă de eșantionare pur aleatorie

Fie CB X o populație generală și fie β parametrul necunoscut CB X. Dacă estimarea statistică în * este consecventă, atunci cu cât dimensiunea eșantionului este mai mare, cu atât obținem mai precis valoarea lui β. Cu toate acestea, în practică, nu avem mostre foarte mari, așa că nu putem garanta o precizie mai mare.

Fie b* o estimare statistică pentru c. Valoarea |in* - in| se numește precizie de estimare. Este clar că acuratețea este CB, deoarece β* este o variabilă aleatorie. Să specificăm un mic număr pozitiv 8 și să cerem ca acuratețea estimării |в* - в| a fost mai mică de 8, adică | în* - în |< 8.

Fiabilitatea g sau probabilitatea de încredere a unei estimări în în * este probabilitatea g cu care inegalitatea |în * - în|< 8, т. е.

De obicei, fiabilitatea g este specificată în avans, iar g este considerat un număr apropiat de 1 (0,9; 0,95; 0,99; ...).

Deoarece inegalitatea |în * - în|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Intervalul (în * - 8, în * + 5) se numește interval de încredere, adică intervalul de încredere acoperă parametrul necunoscut în cu probabilitatea y. Rețineți că capetele intervalului de încredere sunt aleatorii și variază de la un eșantion la altul, deci este mai corect să spunem că intervalul (în * - 8, în * + 8) acoperă parametrul necunoscut în, mai degrabă decât în ​​aparține acestui interval.

Fie populația definită de o variabilă aleatoare X, distribuită conform unei legi normale, iar abaterea standard a este cunoscută. Necunoscuta este așteptarea matematică a = M (X). Este necesar să se găsească intervalul de încredere pentru a pentru o anumită fiabilitate y.

Eșantion mediu

este o estimare statistică pentru xr = a.

Teorema. O variabilă aleatoare xB are o distribuție normală dacă X are o distribuție normală și M (XB) = a,

A (XB) = a, unde a = y/B (X), a = M (X). l/i

Intervalul de încredere pentru a are forma:

Găsim 8.

Folosind raportul

unde Ф(r) este funcția Laplace, avem:

P ( | XB - a |<8} = 2Ф

tabelul de valori al funcției Laplace găsim valoarea lui t.

După ce a desemnat

T, obținem F(t) = g Deoarece g este dat, atunci de

Din egalitate aflăm că estimarea este corectă.

Aceasta înseamnă că intervalul de încredere pentru a are forma:

Având în vedere un eșantion din populația X

ng La" X2 Xm
n. n1 n2 nm

n = U1 + ... + nm, atunci intervalul de încredere va fi:

Exemplul 6.35. Aflați intervalul de încredere pentru estimarea așteptării matematice a a distribuției normale cu o fiabilitate de 0,95, cunoscând media eșantionului Xb = 10,43, dimensiunea eșantionului n = 100 și abaterea standard s = 5.

Să folosim formula

CATEGORII

ARTICOLE POPULARE

2023 „kingad.ru” - examinarea cu ultrasunete a organelor umane