Să construim un interval de încredere în MS EXCEL pentru estimarea valorii medii a distribuției în cazul unei valori cunoscute a varianței.

Desigur alegerea nivelul de încredere depinde complet de sarcina la îndemână. Astfel, gradul de încredere al pasagerului aerian în fiabilitatea aeronavei, desigur, ar trebui să fie mai mare decât gradul de încredere al cumpărătorului în fiabilitatea becului.

Formularea sarcinilor

Să presupunem că de la populatie luând probă marimea n. Se presupune că deviație standard această distribuţie este cunoscută. Necesar pe baza acestui fapt mostre evalua necunoscutul mijloc de distribuție(μ, ) și construiți corespunzătoare bilateral interval de încredere.

Estimarea punctului

După cum se știe din statistici(să-i spunem X cf) este estimare imparțială a mediei acest populatieși are distribuția N(μ;σ 2 /n).

Notă: Ce se întâmplă dacă trebuie să construiești interval de încredereîn cazul distribuţiei, care nu este normal?În acest caz, vine în ajutor, care spune că cu o dimensiune suficient de mare mostre n din distribuție non- normal, distribuţia prin eşantionare a statisticilor Х av va fi aproximativ corespund distributie normala cu parametrii N(μ;σ 2 /n).

Asa de, estimare punctuală mijloc valorile de distribuție avem este eșantion mediu, adică X cf. Acum hai să ne ocupăm interval de încredere.

Construirea unui interval de încredere

De obicei, cunoscând distribuția și parametrii acesteia, putem calcula probabilitatea ca o variabilă aleatorie să ia o valoare dintr-un interval dat. Acum să facem invers: găsim intervalul în care variabila aleatoare se încadrează cu o probabilitate dată. De exemplu, din proprietăți distributie normala se ştie că, cu o probabilitate de 95%, o variabilă aleatoare distribuită peste legea normală, se va încadra în intervalul de aproximativ +/- 2 de la Valoarea medie(vezi articolul despre). Acest interval va servi drept prototip pentru interval de încredere.

Acum să vedem dacă știm distribuția , pentru a calcula acest interval? Pentru a răspunde la întrebare, trebuie să precizăm forma de distribuție și parametrii acesteia.

Știm că este forma de distribuție distributie normala(rețineți că vorbim despre distribuția eșantionului statistici X cf).

Parametrul μ ne este necunoscut (trebuie doar estimat folosind interval de încredere), dar avem estimarea ei X cf, calculat pe baza probă, care poate fi folosit.

Al doilea parametru este abaterea standard medie a probei vor fi cunoscute, este egal cu σ/√n.

pentru că nu știm μ, atunci vom construi intervalul +/- 2 abateri standard nu de la Valoarea medie, dar din estimarea sa cunoscută X cf. Acestea. la calcul interval de încredere NU vom presupune că X cf se va încadra în intervalul +/- 2 abateri standard de la μ cu o probabilitate de 95% și vom presupune că intervalul este +/- 2 abateri standard din X cf cu o probabilitate de 95% va acoperi μ - media populației generale, de la care probă. Aceste două afirmații sunt echivalente, dar a doua declarație ne permite să construim interval de încredere.

În plus, rafinăm intervalul: o variabilă aleatoare distribuită peste legea normală, cu o probabilitate de 95% se încadrează în intervalul +/- 1.960 abateri standard, nu +/- 2 abateri standard. Aceasta poate fi calculată folosind formula \u003d NORM.ST.OBR ((1 + 0,95) / 2), cm. fișier exemplu Spațiere între foi.

Acum putem formula o afirmație probabilistică care ne va servi să formăm interval de încredere:
„Probabilitatea ca media populatiei situat din medie a probeiîn termen de 1.960" abaterile standard ale mediei eșantionului", este egal cu 95%.

Valoarea probabilității menționată în declarație are o denumire specială , care este asociat cu nivelul de semnificație α (alfa) printr-o expresie simplă nivel de încredere =1 . În cazul nostru nivelul de semnificație α =1-0,95=0,05 .

Acum, pe baza acestei afirmații probabilistice, scriem o expresie pentru calcul interval de încredere:

unde Zα/2 standard distributie normala(o astfel de valoare a unei variabile aleatoare z, ce P(z>=Zα/2 )=α/2).

Notă: α/2-quantila superioară definește lățimea interval de încredereîn abateri standard eșantion mediu. α/2-quantila superioară standard distributie normala este întotdeauna mai mare decât 0, ceea ce este foarte convenabil.

În cazul nostru, la α=0,05, α/2-quantila superioară este egal cu 1.960. Pentru alte niveluri de semnificație α (10%; 1%) α/2-quantila superioară Zα/2 poate fi calculat folosind formula \u003d NORM.ST.OBR (1-α / 2) sau, dacă este cunoscut nivel de încredere, =NORM.ST.OBR((1+nivel de încredere)/2).

De obicei, la construirea intervale de încredere pentru estimarea mediei utilizați numai α superioară/2-cuantilăși nu folosiți mai mic α/2-cuantilă. Acest lucru este posibil pentru că standard distributie normala simetric față de axa x ( densitatea distribuției sale simetric despre medie, adică 0). Prin urmare, nu este nevoie să se calculeze α/2-cuantilă mai mică(se numește pur și simplu α /2-quantila), deoarece este egal α superioară/2-cuantilă cu semnul minus.

Reamintim că, indiferent de forma distribuției lui x, variabila aleatoare corespunzătoare X cf distribuite aproximativ amenda N(μ;σ 2 /n) (vezi articolul despre). Prin urmare, în general, expresia de mai sus pentru interval de încredere este doar aproximativă. Dacă x este distribuit peste legea normală N(μ;σ 2 /n), apoi expresia pentru interval de încredere este exactă.

Calculul intervalului de încredere în MS EXCEL

Să rezolvăm problema.
Timpul de răspuns al unei componente electronice la un semnal de intrare este o caracteristică importantă a unui dispozitiv. Un inginer dorește să traseze un interval de încredere pentru timpul mediu de răspuns la un nivel de încredere de 95%. Din experiența anterioară, inginerul știe că abaterea standard a timpului de răspuns este de 8 ms. Se știe că inginerul a făcut 25 de măsurători pentru a estima timpul de răspuns, valoarea medie a fost de 78 ms.

Soluţie: Un inginer vrea să cunoască timpul de răspuns al unui dispozitiv electronic, dar înțelege că timpul de răspuns nu este fix, ci o variabilă aleatorie care are propria sa distribuție. Deci, cel mai bun lucru la care poate spera este să determine parametrii și forma acestei distribuții.

Din păcate, din starea problemei, nu cunoaștem forma distribuției timpului de răspuns (nu trebuie să fie normal). , această distribuție este de asemenea necunoscută. Numai el este cunoscut deviație standardσ=8. Prin urmare, în timp ce nu putem calcula probabilitățile și construi interval de încredere.

Cu toate acestea, deși nu cunoaștem distribuția timp răspuns separat, știm că conform CPT, distribuția eșantionului timpul mediu de răspuns este de aproximativ normal(vom presupune că condițiile CPT sunt efectuate, deoarece marimea mostre suficient de mare (n=25)) .

În plus, in medie această distribuţie este egală cu Valoarea medie distribuții de răspuns unitare, de ex. μ. DAR deviație standard a acestei distribuții (σ/√n) poate fi calculată folosind formula =8/ROOT(25) .

De asemenea, se știe că inginerul a primit estimare punctuală parametrul μ egal cu 78 ms (X cf). Prin urmare, acum putem calcula probabilitățile, deoarece cunoaștem forma de distribuție ( normal) și parametrii săi (Х ср și σ/√n).

Inginerul vrea să știe valorea estimataμ din distribuția timpului de răspuns. După cum sa menționat mai sus, acest μ este egal cu așteptarea distribuției eșantionului a timpului mediu de răspuns. Dacă folosim distributie normala N(X cf; σ/√n), atunci μ dorit va fi în intervalul +/-2*σ/√n cu o probabilitate de aproximativ 95%.

Nivel de semnificație este egal cu 1-0,95=0,05.

În cele din urmă, găsiți chenarul din stânga și din dreapta interval de încredere.
Chenarul din stânga: \u003d 78-NORM.ST.INR (1-0,05 / 2) * 8 / ROOT (25) = 74,864
Chenarul din dreapta: \u003d 78 + NORM. ST. OBR (1-0,05 / 2) * 8 / ROOT (25) \u003d 81,136

Chenarul din stânga: =NORM.INV(0,05/2, 78, 8/SQRT(25))
Chenarul din dreapta: =NORM.INV(1-0,05/2, 78, 8/SQRT(25))

Răspuns: interval de încredere la Nivel de încredere de 95% și σ=8msec egală 78+/-3,136 ms

LA exemplu de fișier pe foaia Sigma cunoscut a creat o formă de calcul și construcție bilateral interval de încredere pentru arbitrar mostre cu un σ dat și nivelul de semnificație.

Funcția CONFIDENCE.NORM().

Dacă valorile mostre sunt în gamă B20:B79 , A nivelul de semnificație egal cu 0,05; apoi formula MS EXCEL:
=MEDIE(B20:B79)-ÎNCREDERE(0,05,σ, NUMĂRĂ(B20:B79))
va întoarce marginea stângă interval de încredere.

Aceeași limită poate fi calculată folosind formula:
=MEDIE(B20:B79)-NORM.ST.INV(1-0,05/2)*σ/SQRT(NUMĂRĂ(B20:B79))

Notă: Funcția TRUST.NORM() a apărut în MS EXCEL 2010. Versiunile anterioare ale MS EXCEL foloseau funcția TRUST().

Interval de încredere pentru așteptările matematice - acesta este un astfel de interval calculat din date, care cu o probabilitate cunoscută conține așteptarea matematică a populației generale. Estimarea naturală pentru așteptarea matematică este media aritmetică a valorilor observate. Prin urmare, în continuare pe parcursul lecției vom folosi termenii „medie”, „valoare medie”. În problemele de calculare a intervalului de încredere, răspunsul cel mai adesea solicitat este „Intervalul de încredere al numărului mediu [valoarea unei anumite probleme] este de la [valoare mai mică] la [valoare mai mare]”. Cu ajutorul intervalului de încredere, este posibil să se evalueze nu numai valorile medii, ci și ponderea uneia sau alteia caracteristici a populației generale. Valorile medii, varianța, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt analizate în lecție Eșantionul și caracteristicile populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației generale este estimată printr-un număr (punct), atunci o medie specifică calculată dintr-un eșantion de observații este luată ca o estimare a mediei necunoscute a populației generale. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când se indică valoarea medie a eșantionului, este, de asemenea, necesar să se indice eroarea eșantionului în același timp. Eroarea standard este utilizată ca măsură a erorii de eșantionare, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei se cere să fie asociată cu o anumită probabilitate, atunci parametrul populației generale de interes trebuie estimat nu printr-un singur număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate, P se constată valoarea indicatorului estimat al populaţiei generale. Interval de încredere în care cu probabilitate P = 1 - α este o variabilă aleatorie, se calculează după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației generale;
  • sau abaterea standard a populației nu este cunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului este n ar trebui inlocuit cu n-1.

Exemplul 1 Sunt colectate informații de la 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din ele este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% din numărul de angajați ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a fost între 9,6 și 11,4.

Exemplul 2 Pentru un eșantion aleatoriu dintr-o populație generală de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru valoarea așteptată.

calculați abaterea standard:

,

calculați valoarea medie:

.

Înlocuiți valorile din expresie pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3 Pentru un eșantion aleatoriu dintr-o populație generală de 100 de observații, au fost calculate o valoare medie de 15,2 și o abatere standard de 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân aceleași, dar factorul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a fost de la 14,57 la 15,82.

Din nou, înlocuim aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a fost de la 14,37 la 16,02.

După cum puteți vedea, pe măsură ce factorul de încredere crește, crește și valoarea critică a distribuției normale standard și, prin urmare, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și, astfel, intervalul de încredere pentru așteptarea matematică. crește.

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unei anumite caracteristici a eșantionului poate fi interpretată ca o estimare punctuală a cotei p aceeași trăsătură în populația generală. Dacă această valoare trebuie să fie asociată cu o probabilitate, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populația generală cu o probabilitate P = 1 - α :

.

Exemplul 4 Sunt doi candidați într-un anumit oraș Ași B candideaza la functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că vor vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Interval de încredere sunt valorile limită ale mărimii statistice, care, cu o probabilitate de încredere dată γ, va fi în acest interval cu o dimensiune a eșantionului mai mare. Notat cu P(θ - ε . În practică, probabilitatea de încredere γ este aleasă dintre valorile γ = 0,9 , γ = 0,95 , γ = 0,99 suficient de aproape de unitate.

Atribuirea serviciului. Acest serviciu definește:

  • interval de încredere pentru media generală, interval de încredere pentru varianță;
  • interval de încredere pentru abaterea standard, interval de încredere pentru fracția generală;
Soluția rezultată este salvată într-un fișier Word (vezi exemplu). Mai jos este o instrucțiune video despre cum să completați datele inițiale.

Exemplul #1. Într-o fermă colectivă, dintr-un efectiv total de 1.000 de oi, 100 de oi au fost supuse tunderii cu control selectiv. Ca urmare, s-a stabilit o forfecare medie a lânii de 4,2 kg per oaie. Determinați cu o probabilitate de 0,99 eroarea standard a eșantionului în determinarea forfecării medii a lânii per oaie și limitele în care se află valoarea forfecării dacă varianța este 2,5. Eșantionul este nerepetitiv.
Exemplul #2. Din lotul de produse importate de la postul Vămii de Nord Moscova, au fost prelevate 20 de mostre de produs „A” în ordinea reeșantionării aleatorii. În urma verificării, a fost stabilit conținutul mediu de umiditate al produsului „A” din probă, care s-a dovedit a fi de 6% cu o abatere standard de 1%.
Determinați cu o probabilitate de 0,683 limitele conținutului mediu de umiditate al produsului în întregul lot de produse importate.
Exemplul #3. Un sondaj efectuat pe 36 de studenți a arătat că numărul mediu de manuale citite de aceștia pe an universitar s-a dovedit a fi 6. Presupunând că numărul de manuale citite de un student pe semestru are o lege de distribuție normală cu o abatere standard egală cu 6, găsiți : A) cu o fiabilitate de 0,99 estimare de interval pentru așteptarea matematică a acestei variabile aleatoare; B) cu ce probabilitate se poate argumenta că numărul mediu de manuale citite de un student pe semestru, calculat pentru acest eșantion, se abate de la așteptarea matematică în valoare absolută cu cel mult 2.

Clasificarea intervalelor de încredere

După tipul de parametru evaluat:

După tipul de eșantion:

  1. Interval de încredere pentru eșantionare infinită;
  2. Interval de încredere pentru eșantionul final;
Eșantionarea se numește reeșantionare, dacă obiectul selectat este returnat populației generale înainte de a-l alege pe următorul. Eșantionul se numește nerepetitiv. dacă obiectul selectat nu este returnat populației generale. În practică, se ocupă de obicei cu mostre care nu se repetă.

Calculul erorii medii de eșantionare pentru selecția aleatorie

Discrepanța dintre valorile indicatorilor obținuți din eșantion și parametrii corespunzători ai populației generale se numește eroare de reprezentativitate.
Desemnări ale parametrilor principali ai populației generale și eșantionului.

Matematică și informatică. Ghid de studiu pe tot parcursul cursului

Fie variabila aleatoare X a populației generale să fie distribuită normal, având în vedere că varianța și abaterea standard s ale acestei distribuții sunt cunoscute. Este necesar să se estimeze așteptările matematice necunoscute din media eșantionului. În acest caz, problema se reduce la găsirea unui interval de încredere pentru așteptarea matematică cu fiabilitate b. Dacă stabilim valoarea probabilității de încredere (fiabilitatea) b, atunci putem găsi probabilitatea de a cădea în intervalul pentru așteptarea matematică necunoscută folosind formula (6.9a):

unde Ф(t) este funcția Laplace (5.17a).

Ca rezultat, putem formula un algoritm pentru găsirea limitelor intervalului de încredere pentru așteptarea matematică dacă se cunoaște varianța D = s 2:

  1. Setați valoarea fiabilității la b .
  2. Din (6.14) exprimă Ф(t) = 0,5× b. Selectați valoarea t din tabel pentru funcția Laplace cu valoarea Ф(t) (vezi Anexa 1).
  3. Calculați abaterea e folosind formula (6.10).
  4. Scrieți intervalul de încredere conform formulei (6.12) astfel încât cu probabilitatea b următoarea inegalitate să fie adevărată:

.

Exemplul 5.

Variabila aleatoare X are o distribuție normală. Găsiți intervale de încredere pentru o estimare cu fiabilitatea b = 0,96 a mediei necunoscute a, dacă este dat:

1) abaterea standard generală s = 5;

2) media eșantionului;

3) dimensiunea eșantionului n = 49.

În formula (6.15) a intervalului de estimare a așteptării matematice A cu fiabilitatea b, toate mărimile cu excepția t sunt cunoscute. Valoarea lui t poate fi găsită folosind (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Conform tabelului din Anexa 1 pentru funcția Laplace Ф(t) = 0,48, găsiți valoarea corespunzătoare t = 2,06. Prin urmare, . Înlocuind valoarea calculată a lui e în formula (6.12), putem obține un interval de încredere: 30-1,47< a < 30+1,47.

Intervalul de încredere dorit pentru o estimare cu fiabilitatea b = 0,96 a așteptării matematice necunoscute este: 28,53< a < 31,47.

Exemple de formule de eroare medie
reselectareselecție nerepetitivă
pentru mijlocpentru împărțirepentru mijlocpentru împărțire
Raportul dintre limita erorii de eșantionare (Δ) garantat cu o oarecare probabilitate P(t), iar eroarea medie de eșantionare are forma: sau Δ = t μ, unde t– coeficient de încredere, determinat în funcție de nivelul de probabilitate P(t) conform tabelului funcției Laplace integrale.

Formule pentru calcularea mărimii eșantionului cu o metodă adecvată de selecție aleatorie

Fie CB X să formeze populația generală și β să fie un parametru necunoscut CB X. Dacă estimarea statistică în * este consecventă, atunci cu cât dimensiunea eșantionului este mai mare, cu atât valoarea lui β este mai precisă. Cu toate acestea, în practică, nu avem mostre foarte mari, așa că nu putem garanta o precizie mai mare.

Fie s* o estimare statistică pentru s. Cantitate |in* - in| se numește acuratețea estimării. Este clar că precizia este CB, deoarece s* este o variabilă aleatorie. Să stabilim un mic număr pozitiv 8 și să cerem ca acuratețea estimării |in* - in| a fost mai mică de 8, adică | în* - în |< 8.

Fiabilitatea g sau probabilitatea de încredere a estimării în by in * este probabilitatea g cu care inegalitatea |in * - in|< 8, т. е.

De obicei, fiabilitatea lui g este stabilită în avans și, pentru g, ele iau un număr apropiat de 1 (0,9; 0,95; 0,99; ...).

Deoarece inegalitatea |în * - în|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

Intervalul (în * - 8, în * + 5) se numește interval de încredere, adică intervalul de încredere acoperă parametrul necunoscut în cu probabilitatea y. Rețineți că capetele intervalului de încredere sunt aleatorii și variază de la un eșantion la altul, deci este mai corect să spunem că intervalul (la * - 8, la * + 8) acoperă parametrul necunoscut β, mai degrabă decât β aparține acestui interval. .

Fie populația generală dată de o variabilă aleatoare X, distribuită conform legii normale, în plus, abaterea standard a este cunoscută. Așteptarea matematică a = M (X) este necunoscută. Este necesar să se găsească un interval de încredere pentru a pentru o anumită fiabilitate y.

Eșantion mediu

este o estimare statistică pentru xr = a.

Teorema. O variabilă aleatoare xB are o distribuție normală dacă X are o distribuție normală și M(XB) = a,

A (XB) \u003d a, unde a \u003d y / B (X), a \u003d M (X). l/i

Intervalul de încredere pentru a are forma:

Găsim 8.

Folosind relația

unde Ф(г) este funcția Laplace, avem:

P ( | XB - a |<8} = 2Ф

Găsim valoarea lui t în tabelul de valori al funcției Laplace.

Denotand

T, obținem F(t) = g

Din egalitatea Găsiți - acuratețea estimării.

Deci intervalul de încredere pentru a are forma:

Dacă este dat un eșantion din populația generală X

ng la" X2 xm
n. n1 n2 nm

n = U1 + ... + nm, atunci intervalul de încredere va fi:

Exemplul 6.35. Găsiți intervalul de încredere pentru estimarea așteptării a unei distribuții normale cu o fiabilitate de 0,95, cunoscând media eșantionului Xb = 10,43, dimensiunea eșantionului n = 100 și abaterea standard s = 5.

Să folosim formula

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane