De ce să calculați intervalele de încredere? Interval de încredere pentru așteptările matematice

Ţintă– să predea elevilor algoritmi pentru calcularea intervalelor de încredere a parametrilor statistici.

În timpul procesării statistice a datelor, media aritmetică calculată, coeficientul de variație, coeficientul de corelație, criteriile de diferență și alte statistici punctuale ar trebui să primească limite cantitative de încredere, care indică posibile fluctuații ale indicatorului în sus și în jos în intervalul de încredere.

Exemplul 3.1 . Distribuția calciului în serul sanguin al maimuțelor, așa cum a fost stabilită anterior, se caracterizează prin următorii indicatori selectivi: = 11,94 mg%; = 0,127 mg%; n= 100. Este necesar să se determine intervalul de încredere pentru media generală ( ) cu probabilitate de încredere P = 0,95.

Media generală este cu o anumită probabilitate în intervalul:

, Unde – medie aritmetică eșantionului; t- Criteriul elevului; este eroarea mediei aritmetice.

Conform tabelului „Valorile criteriului Studentului” găsim valoarea cu un nivel de încredere de 0,95 și numărul de grade de libertate k\u003d 100-1 \u003d 99. Este egal cu 1,982. Împreună cu valorile mediei aritmetice și ale erorii statistice, o înlocuim în formula:

sau 11,69
12,19

Astfel, cu o probabilitate de 95%, se poate susține că media generală a acestei distribuții normale este între 11,69 și 12,19 mg%.

Exemplul 3.2 . Determinați limitele intervalului de încredere de 95% pentru varianța generală ( ) distribuția calciului în sângele maimuțelor, dacă se știe că
= 1,60, cu n = 100.

Pentru a rezolva problema, puteți utiliza următoarea formulă:

Unde este eroarea statistică a varianței.

Găsiți eroarea varianței eșantionului folosind formula:
. Este egal cu 0,11. Sens t- criteriu cu o probabilitate de încredere de 0,95 și numărul de grade de libertate k= 100–1 = 99 este cunoscut din exemplul anterior.

Să folosim formula și să obținem:

sau 1,38
1,82

Un interval de încredere mai precis pentru varianța generală poate fi construit folosind (chi-pătrat) - testul lui Pearson. Punctele critice pentru acest criteriu sunt date într-un tabel special. La folosirea criteriului un nivel de semnificație cu două laturi este utilizat pentru a construi un interval de încredere. Pentru limita inferioară, nivelul de semnificație este calculat prin formulă
, pentru partea superioară
. De exemplu, pentru un nivel de încredere = 0,99= 0,010,= 0,990. În consecință, conform tabelului de distribuție a valorilor critice , cu nivelurile de încredere calculate și numărul de grade de libertate k= 100 – 1= 99, găsiți valorile
și
. Primim
este egal cu 135,80 și
este egal cu 70,06.

Pentru a găsi limitele de încredere ale varianței generale folosind folosim formulele: pentru limita inferioară
, pentru limita superioară
. Înlocuiți datele sarcinii cu valorile găsite în formule:
= 1,17;
= 2,26. Astfel, cu un nivel de încredere P= 0,99 sau 99%, varianța generală va fi în intervalul de la 1,17 la 2,26 mg% inclusiv.

Exemplul 3.3 . Dintre cele 1000 de semințe de grâu din lotul ajuns la lift au fost găsite 120 de semințe infectate cu ergot. Este necesar să se determine limitele probabile ale proporției totale de semințe infectate într-un anumit lot de grâu.

Limitele de încredere pentru cota generală pentru toate valorile sale posibile ar trebui determinate de formula:

,

Unde n este numărul de observații; m este numărul absolut al unuia dintre grupuri; t este abaterea normalizată.

Fracția eșantionului de semințe infectate este egală cu
sau 12%. Cu un nivel de încredere R= abatere normalizată de 95% ( t-Criteriul elevului pentru k =
)t = 1,960.

Înlocuim datele disponibile în formula:

Prin urmare, limitele intervalului de încredere sunt = 0,122–0,041 = 0,081 sau 8,1%; = 0,122 + 0,041 = 0,163 sau 16,3%.

Astfel, cu un nivel de încredere de 95%, se poate afirma că proporția totală a semințelor infectate este între 8,1 și 16,3%.

Exemplul 3.4 . Coeficientul de variație, care caracterizează variația calciului (mg%) în serul sanguin al maimuțelor, a fost egal cu 10,6%. Marime de mostra n= 100. Este necesar să se determine limitele intervalului de încredere de 95% pentru parametrul general CV.

Limite de încredere pentru coeficientul general de variație CV sunt determinate de următoarele formule:

și
, Unde K valoare intermediară calculată prin formula
.

Știind asta cu un nivel de încredere R= abatere normalizată de 95% (testul t al studentului pentru k =
)t = 1,960, precalculați valoarea LA:

.

sau 9,3%

sau 12,3%

Astfel, coeficientul general de variație cu o probabilitate de încredere de 95% se află în intervalul de la 9,3 la 12,3%. Cu probe repetate, coeficientul de variație nu va depăși 12,3% și nu va scădea sub 9,3% în 95 de cazuri din 100.

Întrebări pentru autocontrol:

Sarcini pentru soluție independentă.

1. Procentul mediu de grăsime din lapte pentru alăptarea vacilor din încrucișările Kholmogory a fost următorul: 3,4; 3,6; 3,2; 3.1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4.1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3.8. Setați intervale de încredere pentru media generală la un nivel de încredere de 95% (20 de puncte).

2. Pe 400 de plante de secară hibridă, primele flori au apărut în medie la 70,5 zile de la semănat. Abaterea standard a fost de 6,9 ​​zile. Determinați eroarea mediei și a intervalelor de încredere pentru media populației și varianța la un nivel de semnificație W= 0,05 și W= 0,01 (25 puncte).

3. La studierea lungimii frunzelor a 502 exemplare de căpșuni de grădină s-au obținut următoarele date: = 7,86 cm; σ = 1,32 cm, \u003d ± 0,06 cm. Determinați intervalele de încredere pentru media aritmetică a populației cu niveluri de semnificație de 0,01; 0,02; 0,05. (25 de puncte).

4. La examinarea a 150 de bărbați adulți, înălțimea medie a fost de 167 cm și σ \u003d 6 cm. Care sunt limitele mediei generale și ale variației generale cu o probabilitate de încredere de 0,99 și 0,95? (25 de puncte).

5. Distribuția calciului în serul sanguin al maimuțelor este caracterizată de următorii indicatori selectivi: = 11,94 mg%, σ = 1,27, n = 100. Grafic un interval de încredere de 95% pentru media populației acestei distribuții. Calculați coeficientul de variație (25 de puncte).

6. A fost studiat conținutul total de azot din plasma sanguină a șobolanilor albinoși la vârsta de 37 și 180 de zile. Rezultatele sunt exprimate în grame la 100 cm3 de plasmă. La vârsta de 37 de zile, 9 șobolani aveau: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. La vârsta de 180 de zile, 8 șobolani aveau: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1.12. Setați intervale de încredere pentru diferență cu un nivel de încredere de 0,95 (50 de puncte).

7. Determinați limitele intervalului de încredere de 95% pentru variația generală a distribuției calciului (mg%) în serul sanguin al maimuțelor, dacă pentru această distribuție dimensiunea eșantionului n = 100, eroarea statistică a varianței eșantionului s σ 2 = 1,60 (40 de puncte).

8. Determinați limitele intervalului de încredere de 95% pentru varianța generală a distribuției a 40 de spiculeți de grâu de-a lungul lungimii (σ 2 = 40,87 mm 2). (25 de puncte).

9. Fumatul este considerat principalul factor predispozitiv la boala pulmonară obstructivă. Fumatul pasiv nu este considerat un astfel de factor. Oamenii de știință au pus sub semnul întrebării siguranța fumatului pasiv și au examinat căile respiratorii la nefumătorii, fumătorii pasivi și activi. Pentru a caracteriza starea tractului respirator, am luat unul dintre indicatorii funcției respirației externe - viteza volumetrică maximă a mijlocului expirației. O scădere a acestui indicator este un semn al permeabilității afectate a căilor respiratorii. Datele sondajului sunt prezentate în tabel.

Numărul de examinați

Debitul maxim mediu expirator, l/s

Deviație standard

nefumători

lucrează într-o zonă de nefumători

lucrează într-o cameră plină de fum

fumători

fumând un număr mic de țigări

numărul mediu de fumători de țigări

fumând un număr mare de țigări

Din tabel, găsiți intervalele de încredere de 95% pentru media generală și varianța generală pentru fiecare dintre grupuri. Care sunt diferențele dintre grupuri? Prezentați rezultatele grafic (25 de puncte).

10. Determinați limitele intervalelor de încredere de 95% și 99% pentru varianța generală a numărului de purcei în 64 de fătări, dacă eroarea statistică a varianței eșantionului s σ 2 = 8,25 (30 puncte).

11. Se știe că greutatea medie a iepurilor este de 2,1 kg. Determinați limitele intervalelor de încredere de 95% și 99% pentru media generală și varianța atunci când n= 30, σ = 0,56 kg (25 puncte).

12. La 100 de spice s-a măsurat conținutul de boabe al spicului ( X), lungimea vârfului ( Y) și masa de cereale în spic ( Z). Găsiți intervale de încredere pentru media generală și varianța pentru P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 dacă = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29,153, σ y 2 = 2,111, σ z 2 = 0,064 (25 puncte).

13. În 100 de spice alese aleatoriu de grâu de iarnă s-a numărat numărul de spiculete. Setul de eșantion a fost caracterizat de următorii indicatori: = 15 spiculete și σ = 2,28 buc. Determinați acuratețea cu care se obține rezultatul mediu ( ) și reprezentați grafic intervalul de încredere pentru media generală și varianța la niveluri de semnificație de 95% și 99% (30 de puncte).

14. Numărul de coaste de pe cochiliile unei moluște fosile Orthambonites calligramma:

Se știe că n = 19, σ = 4,25. Determinați limitele intervalului de încredere pentru media generală și varianța generală la un nivel de semnificație W = 0,01 (25 puncte).

15. Pentru a determina producția de lapte într-o fermă comercială de lapte, s-a determinat zilnic productivitatea a 15 vaci. Conform datelor anului, fiecare vacă a dat în medie următoarea cantitate de lapte pe zi (l): 22; 19; 25; douăzeci; 27; 17; treizeci; 21; optsprezece; 24; 26; 23; 25; douăzeci; 24. Grafic intervalele de încredere pentru varianța generală și media aritmetică. Ne putem aștepta ca producția medie anuală de lapte per vaca să fie de 10.000 de litri? (50 de puncte).

16. Pentru determinarea randamentului mediu de grâu pentru fermă, s-a cosit pe parcele de probă de 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 și 2 ha. Randamentul (c/ha) din parcele a fost de 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 respectiv. Graficul intervalelor de încredere pentru varianța generală și media aritmetică. Este posibil să ne așteptăm ca randamentul mediu pentru întreprinderea agricolă să fie de 42 c/ha? (50 de puncte).

Interval de încredere pentru așteptările matematice - acesta este un astfel de interval calculat din date, care cu o probabilitate cunoscută conține așteptarea matematică a populației generale. Estimarea naturală pentru așteptarea matematică este media aritmetică a valorilor observate. Prin urmare, în continuare pe parcursul lecției vom folosi termenii „medie”, „valoare medie”. În problemele de calculare a intervalului de încredere, răspunsul cel mai adesea solicitat este „Intervalul de încredere al numărului mediu [valoarea unei anumite probleme] este de la [valoare mai mică] la [valoare mai mare]”. Cu ajutorul intervalului de încredere, este posibil să se evalueze nu numai valorile medii, ci și ponderea uneia sau alteia caracteristici a populației generale. Valorile medii, varianța, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt analizate în lecție Eșantionul și caracteristicile populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației generale este estimată printr-un număr (punct), atunci o medie specifică calculată dintr-un eșantion de observații este luată ca o estimare a mediei necunoscute a populației generale. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când se indică valoarea medie a eșantionului, este, de asemenea, necesar să se indice eroarea eșantionului în același timp. Eroarea standard este utilizată ca măsură a erorii de eșantionare, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei se cere să fie asociată cu o anumită probabilitate, atunci parametrul populației generale de interes trebuie estimat nu printr-un singur număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate, P se constată valoarea indicatorului estimat al populaţiei generale. Interval de încredere în care cu probabilitate P = 1 - α este o variabilă aleatorie, se calculează după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației generale;
  • sau abaterea standard a populației nu este cunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului este n ar trebui înlocuit cu n-1.

Exemplul 1 Informații sunt colectate de la 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din ele este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% din numărul de angajați ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a fost între 9,6 și 11,4.

Exemplul 2 Pentru un eșantion aleatoriu dintr-o populație generală de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru valoarea așteptată.

calculați abaterea standard:

,

calculați valoarea medie:

.

Înlocuiți valorile din expresie pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3 Pentru un eșantion aleatoriu dintr-o populație generală de 100 de observații, au fost calculate o valoare medie de 15,2 și o abatere standard de 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân aceleași, dar factorul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a fost de la 14,57 la 15,82.

Din nou, înlocuim aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a fost de la 14,37 la 16,02.

După cum puteți vedea, pe măsură ce factorul de încredere crește, crește și valoarea critică a distribuției normale standard și, prin urmare, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și, astfel, intervalul de încredere pentru așteptarea matematică. crește.

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unei anumite caracteristici a eșantionului poate fi interpretată ca o estimare punctuală a cotei p aceeași trăsătură în populația generală. Dacă această valoare trebuie să fie asociată cu o probabilitate, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populația generală cu o probabilitate P = 1 - α :

.

Exemplul 4 Sunt doi candidați într-un anumit oraș Ași B candideaza la functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că vor vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Din acest articol veți învăța:

    Ce interval de încredere?

    Care este scopul regulile 3 sigma?

    Cum pot fi puse în practică aceste cunoștințe?

În zilele noastre, datorită unei supraabundențe de informații asociate cu o gamă largă de produse, direcții de vânzare, angajați, activități etc., este greu să alegi principalul, care, în primul rând, merită să-i acordăm atenție și să depunem eforturi pentru a-l gestiona. Definiție interval de încredereși analiza depășirii limitelor valorilor reale - o tehnică care vă ajută să identificați situațiile, influențarea tendințelor. Veți putea dezvolta factori pozitivi și reduce influența celor negativi. Această tehnologie este utilizată în multe companii mondiale binecunoscute.

Există așa-zise alerte", care informează managerii afirmând că următoarea valoare într-o anumită direcție a trecut dincolo interval de încredere. Ce inseamna asta? Acesta este un semnal că a avut loc un eveniment nestandard, care poate schimba tendința existentă în această direcție. Acesta este semnalul la asta pentru a o rezolvaîn situație și înțelegeți ce a influențat-o.

De exemplu, luați în considerare mai multe situații. Am calculat prognoza vânzărilor cu limitele prognozate pentru 100 de articole de mărfuri pentru 2011 pe luni și vânzările reale în martie:

  1. Pentru „Uleiul de floarea soarelui” au depășit limita superioară a prognozei și nu au intrat în intervalul de încredere.
  2. Pentru „Drojdie uscată” a depășit limita inferioară a prognozei.
  3. Pe „Teci de ovăz” a depășit limita superioară.

Pentru restul mărfurilor, vânzările efective s-au încadrat în limitele prognozate specificate. Acestea. vânzările lor au fost în conformitate cu așteptările. Așadar, am identificat 3 produse care au depășit granițele și am început să ne dăm seama ce a influențat trecerea dincolo de granițe:

  1. Cu uleiul de floarea soarelui, am intrat într-o nouă rețea de tranzacționare, care ne-a oferit un volum suplimentar de vânzări, ceea ce a dus la depășirea limitei superioare. Pentru acest produs, merită să recalculăm prognoza până la sfârșitul anului, ținând cont de prognoza de vânzări către acest lanț.
  2. Pentru Dry Yeast, mașina s-a blocat la vamă și a existat un deficit în 5 zile, ceea ce a afectat scăderea vânzărilor și depășirea frontierei inferioare. Ar putea fi util să vă dați seama ce a cauzat cauza și să încercați să nu repetați această situație.
  3. Pentru Oatmeal a fost lansată o promoție de vânzări, care a avut ca rezultat o creștere semnificativă a vânzărilor și a dus la o depășire a prognozei.

Am identificat 3 factori care au influențat depășirea prognozei. Pot fi mult mai multe în viață.Pentru a îmbunătăți acuratețea prognozei și a planificării, factorii care duc la faptul că vânzările efective pot depăși previziunile, merită să evidențiem și să construiți previziuni și planuri pentru ele separat. Și apoi luați în considerare impactul lor asupra prognozei principale de vânzări. De asemenea, puteți evalua în mod regulat impactul acestor factori și puteți schimba situația în bine prin reducerea influenței factorilor negativi și creșterea influenței factorilor pozitivi.

Cu un interval de încredere, putem:

  1. Evidențiați destinațiile, cărora merită să le acordați atenție, pentru că în aceste zone au avut loc evenimente care pot afecta schimbare de tendință.
  2. Determinați factorii care chiar fac diferența.
  3. A accepta decizie ponderată(de exemplu, despre achiziții, când planificați etc.).

Acum să ne uităm la ce este un interval de încredere și cum să-l calculăm în Excel folosind un exemplu.

Ce este un interval de încredere?

Intervalul de încredere reprezintă limitele de prognoză (superioare și inferioare), în interiorul cărora cu o probabilitate dată (sigma) obțineți valorile reale.

Acestea. calculăm prognoza - acesta este principalul nostru reper, dar înțelegem că este puțin probabil ca valorile reale să fie 100% egale cu prognoza noastră. Și se pune întrebarea în ce măsură poate obține valori reale, dacă tendința actuală continuă? Și această întrebare ne va ajuta să răspundem calculul intervalului de încredere, adică - limitele superioare și inferioare ale prognozei.

Ce este o probabilitate sigma dată?

La calcul interval de încredere putem probabilitate stabilită lovituri valori reale în limitele de prognoză date. Cum să o facă? Pentru a face acest lucru, setăm valoarea lui sigma și, dacă sigma este egal cu:

    3 sigma- atunci, probabilitatea de a atinge următoarea valoare reală în intervalul de încredere va fi de 99,7%, sau 300 la 1, sau există o probabilitate de 0,3% de a depăși limitele.

    2 sigma- atunci, probabilitatea de a atinge următoarea valoare în limite este ≈ 95,5%, i.e. șansele sunt de aproximativ 20 la 1 sau există o șansă de 4,5% să ieși din limite.

    1 sigma- atunci, probabilitatea este ≈ 68,3%, i.e. șansele sunt de aproximativ 2 la 1 sau există o șansă de 31,7% ca următoarea valoare să cadă în afara intervalului de încredere.

Noi am formulat Regula 3 Sigma,care spune că probabilitatea de lovire o altă valoare aleatorie în intervalul de încredere cu o valoare dată trei sigma este 99,7%.

Marele matematician rus Cebyshev a demonstrat o teoremă conform căreia există o șansă de 10% de a depăși granițele unei prognoze cu o valoare dată de trei sigma. Acestea. probabilitatea de a cădea în intervalul de încredere de 3 sigma va fi de cel puțin 90%, în timp ce o încercare de a calcula prognoza și limitele acesteia „cu ochi” este plină de erori mult mai semnificative.

Cum se calculează independent intervalul de încredere în Excel?

Să luăm în considerare calculul intervalului de încredere în Excel (adică limitele superioare și inferioare ale prognozei) folosind un exemplu. Avem o serie de timp - vânzări pe luni timp de 5 ani. Vezi fisierul atasat.

Pentru a calcula limitele prognozei, calculăm:

  1. Prognoza de vânzări().
  2. Sigma - abatere standard modele de prognoză din valori reale.
  3. Trei sigma.
  4. Interval de încredere.

1. Prognoza vânzărilor.

=(RC[-14] (date în serii de timp)-RC[-1] (valoarea modelului))^2(pătrat)


3. Însumați pentru fiecare lună valorile abaterii de la etapa 8 Sum((Xi-Ximod)^2), adică Să însumăm ianuarie, februarie... pentru fiecare an.

Pentru a face acest lucru, utilizați formula =SUMIF()

SUMIF(matrice cu numere de perioade din interiorul ciclului (pentru luni de la 1 la 12); referință la numărul perioadei din ciclu; referință la o matrice cu pătrate ale diferenței dintre datele inițiale și valorile perioade)


4. Calculați abaterea standard pentru fiecare perioadă din ciclu de la 1 la 12 (etapa 10 in fisierul atasat).

Pentru a face acest lucru, din valoarea calculată la etapa 9, extragem rădăcina și împărțim la numărul de perioade din acest ciclu minus 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Să folosim formule în Excel =ROOT(R8 (referire la (Suma(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (referință la o matrice cu numere de ciclu); O8 (referință la un anumit număr de ciclu, pe care îl considerăm în matrice))-1))

Folosind formula Excel = COUNTIF numărăm numărul n


Prin calcularea abaterii standard a datelor reale de la modelul de prognoză, am obținut valoarea sigma pentru fiecare lună - etapa 10 in fisierul atasat.

3. Calculați 3 sigma.

La etapa 11, setăm numărul de sigma - în exemplul nostru, „3” (etapa 11 in fisierul atasat):

De asemenea, valori practice sigma:

1,64 sigma - 10% sanse de a depasi limita (1 sansa din 10);

1,96 sigma - 5% șanse de a ieși din limite (1 șansă din 20);

2,6 sigma - 1% șansă de a ieși din limite (1 șansă din 100).

5) Calculăm trei sigma, pentru aceasta înmulțim valorile „sigma” pentru fiecare lună cu „3”.

3. Determinați intervalul de încredere.

  1. Limită superioară de prognoză- previziunea vanzarilor tinand cont de crestere si sezonalitate + (plus) 3 sigma;
  2. Limită inferioară de prognoză- prognoza vânzărilor ținând cont de creștere și sezonalitate - (minus) 3 sigma;

Pentru comoditatea calculării intervalului de încredere pentru o perioadă lungă (vezi fișierul atașat), folosim formula Excel =Y8+CĂUTAREV(W8;8$U$:19$V$;2;0), Unde

Y8- Prognoza de vânzări;

W8- numarul lunii pentru care vom lua valoarea de 3 sigma;

Acestea. Limită superioară de prognoză= „prognoza vânzărilor” + „3 sigma” (în exemplu, CĂUTARE V (numărul lunii; tabel cu valori 3 sigma; coloană din care extragem valoarea sigma egală cu numărul lunii din rândul corespunzător; 0)).

Limită inferioară de prognoză= „prognoza vânzărilor” minus „3 sigma”.

Deci, am calculat intervalul de încredere în Excel.

Acum avem o prognoză și un interval cu limite în care valorile reale vor cădea cu o anumită probabilitate sigma.

În acest articol, ne-am uitat la ce sunt sigma și regula trei sigma, cum să determinați un interval de încredere și pentru ce puteți folosi această tehnică în practică.

Prognoze precise și succes pentru tine!

Cum Forecast4AC PRO vă poate ajutala calcularea intervalului de încredere?:

    Forecast4AC PRO va calcula automat limitele superioare sau inferioare de prognoză pentru mai mult de 1000 de serii temporale în același timp;

    Capacitatea de a analiza limitele prognozei în comparație cu prognoza, tendința și vânzările reale pe diagramă cu o singură apăsare de tastă;

În programul Forcast4AC PRO, este posibil să setați valoarea sigma de la 1 la 3.

Alăturaţi-ne!

Descărcați aplicații gratuite de prognoză și Business Intelligence:


  • Novo Forecast Lite- automată calculul prognozeiîn excela.
  • 4analitica- Analiza ABC-XYZși analiza emisiilor în Excela.
  • Qlik Sense Desktop și QlikViewPersonal Edition - sisteme BI pentru analiza și vizualizarea datelor.

Testați caracteristicile soluțiilor plătite:

  • Novo Forecast PRO- prognoza in Excel pentru matrice mari de date.
Interval de încredere sunt valorile limită ale mărimii statistice, care, cu o probabilitate de încredere dată γ, va fi în acest interval cu o dimensiune a eșantionului mai mare. Notat cu P(θ - ε . În practică, probabilitatea de încredere γ este aleasă dintre valorile γ = 0,9 , γ = 0,95 , γ = 0,99 suficient de aproape de unitate.

Atribuirea serviciului. Acest serviciu definește:

  • interval de încredere pentru media generală, interval de încredere pentru varianță;
  • interval de încredere pentru abaterea standard, interval de încredere pentru fracția generală;
Soluția rezultată este salvată într-un fișier Word (vezi exemplu). Mai jos este o instrucțiune video despre cum să completați datele inițiale.

Exemplul #1. Într-o fermă colectivă, dintr-un efectiv total de 1.000 de oi, 100 de oi au fost supuse tunderii cu control selectiv. Ca urmare, s-a stabilit o forfecare medie a lânii de 4,2 kg per oaie. Determinați cu o probabilitate de 0,99 eroarea standard a eșantionului în determinarea forfecării medii a lânii per oaie și limitele în care se află valoarea forfecării dacă varianța este 2,5. Eșantionul este nerepetitiv.
Exemplul #2. Din lotul de produse importate de la postul Vămii de Nord Moscova, au fost prelevate 20 de mostre de produs „A” în ordinea reeșantionării aleatorii. În urma verificării, a fost stabilit conținutul mediu de umiditate al produsului „A” din probă, care s-a dovedit a fi de 6% cu o abatere standard de 1%.
Determinați cu o probabilitate de 0,683 limitele conținutului mediu de umiditate al produsului în întregul lot de produse importate.
Exemplul #3. Un sondaj efectuat pe 36 de studenți a arătat că numărul mediu de manuale citite de aceștia pe an universitar s-a dovedit a fi 6. Presupunând că numărul de manuale citite de un student pe semestru are o lege de distribuție normală cu o abatere standard egală cu 6, găsiți : A) cu o fiabilitate de 0,99 estimare de interval pentru așteptarea matematică a acestei variabile aleatoare; B) cu ce probabilitate se poate argumenta că numărul mediu de manuale citite de un student pe semestru, calculat pentru acest eșantion, se abate de la așteptarea matematică în valoare absolută cu cel mult 2.

Clasificarea intervalelor de încredere

După tipul de parametru evaluat:

După tipul de eșantion:

  1. Interval de încredere pentru eșantionare infinită;
  2. Interval de încredere pentru eșantionul final;
Eșantionarea se numește reeșantionare, dacă obiectul selectat este returnat populației generale înainte de a-l alege pe următorul. Eșantionul se numește nerepetitiv. dacă obiectul selectat nu este returnat populației generale. În practică, se ocupă de obicei cu mostre care nu se repetă.

Calculul erorii medii de eșantionare pentru selecția aleatorie

Discrepanța dintre valorile indicatorilor obținuți din eșantion și parametrii corespunzători ai populației generale se numește eroare de reprezentativitate.
Desemnări ale parametrilor principali ai populației generale și eșantionului.
Exemple de formule de eroare medie
reselectareselecție nerepetitivă
pentru mijlocpentru împărțirepentru mijlocpentru împărțire
Raportul dintre limita erorii de eșantionare (Δ) garantat cu o oarecare probabilitate P(t), iar eroarea medie de eșantionare are forma: sau Δ = t μ, unde t– coeficient de încredere, determinat în funcție de nivelul de probabilitate P(t) conform tabelului funcției Laplace integrale.

Formule pentru calcularea mărimii eșantionului cu o metodă adecvată de selecție aleatorie

Una dintre metodele de rezolvare a problemelor statistice este calculul intervalului de încredere. Este utilizat ca alternativă preferată la estimarea punctuală atunci când dimensiunea eșantionului este mică. Trebuie remarcat faptul că procesul de calcul al intervalului de încredere este destul de complicat. Dar instrumentele programului Excel vă permit să îl simplificați oarecum. Să aflăm cum se face acest lucru în practică.

Această metodă este utilizată în estimarea pe intervale a diferitelor mărimi statistice. Sarcina principală a acestui calcul este de a scăpa de incertitudinile estimării punctuale.

În Excel, există două opțiuni principale pentru a calcula folosind această metodă: când varianța este cunoscută și când este necunoscută. În primul caz, funcția este utilizată pentru calcule NORMA DE ÎNCREDERE, iar în al doilea ÎNCREDERE.STUDENT.

Metoda 1: Funcția NORM DE ÎNCREDERE

Operator NORMA DE ÎNCREDERE, care se referă la grupul statistic de funcții, a apărut pentru prima dată în Excel 2010. Versiunile anterioare ale acestui program folosesc omologul său ÎNCREDERE. Sarcina acestui operator este de a calcula un interval de încredere cu o distribuție normală pentru media populației.

Sintaxa sa este următoarea:

NORMĂ DE ÎNCREDERE(alpha, standard_dev, size)

"Alfa" este un argument care indică nivelul de semnificație care este utilizat pentru a calcula nivelul de încredere. Nivelul de încredere este egal cu următoarea expresie:

(1-"Alfa")*100

"Deviație standard" este un argument, a cărui esență este clară din nume. Aceasta este abaterea standard a eșantionului propus.

"Marimea" este un argument care determină mărimea eșantionului.

Toate argumentele acestui operator sunt necesare.

Funcţie ÎNCREDERE are exact aceleași argumente și posibilități ca și precedentul. Sintaxa sa este:

TRUST(alpha, standard_dev, size)

După cum puteți vedea, diferențele sunt doar în numele operatorului. Această caracteristică a fost păstrată în Excel 2010 și versiunile mai noi într-o categorie specială din motive de compatibilitate. "Compatibilitate". În versiunile Excel 2007 și anterioare, acesta este prezent în grupul principal de operatori statistici.

Limita intervalului de încredere este determinată folosind formula următoarei forme:

X+(-)INCREDEREA NORMA

Unde X este media eșantionului, care se află la mijlocul intervalului selectat.

Acum să ne uităm la cum să calculăm intervalul de încredere folosind un exemplu specific. Au fost efectuate 12 teste, rezultând rezultate diferite, care sunt enumerate în tabel. Aceasta este totalitatea noastră. Abaterea standard este 8. Trebuie să calculăm intervalul de încredere la nivelul de încredere de 97%.

  1. Selectați celula în care va fi afișat rezultatul prelucrării datelor. Făcând clic pe butonul „Inserare funcție”.
  2. Apare Expertul de funcții. Mergi la categorie "Statistic"și evidențiați numele „ÎNCREDERE.NORMĂ”. După aceea faceți clic pe butonul O.K.
  3. Se deschide fereastra de argumente. Câmpurile sale corespund în mod firesc cu numele argumentelor.
    Setați cursorul pe primul câmp - "Alfa". Aici ar trebui să precizăm nivelul de semnificație. După cum ne amintim, nivelul nostru de încredere este de 97%. În același timp, am spus că se calculează astfel:

    (1-nivel de încredere)/100

    Adică, înlocuind valoarea, obținem:

    Prin calcule simple, aflăm că argumentul "Alfa" egală 0,03 . Introduceți această valoare în câmp.

    După cum știți, abaterea standard este egală cu 8 . Prin urmare, pe teren "Deviație standard" notează doar acel număr.

    În câmp "Marimea" trebuie să introduceți numărul de elemente ale testelor efectuate. După cum ne amintim, ei 12 . Dar pentru a automatiza formula și a nu o edita de fiecare dată când se efectuează un nou test, să setăm această valoare nu la un număr obișnuit, ci folosind operatorul VERIFICA. Deci, punem cursorul în câmp "Marimea", apoi faceți clic pe triunghi, care se află în stânga barei de formule.

    Apare o listă cu funcțiile utilizate recent. Dacă operatorul VERIFICA folosit recent de tine, ar trebui să fie pe această listă. În acest caz, trebuie doar să faceți clic pe numele acestuia. În caz contrar, dacă nu îl găsești, atunci mergi la subiect "Mai multe trăsături...".

  4. Ne pare deja familiar Expertul de funcții. Înapoi la grup "Statistic". Selectăm numele acolo "VERIFICA". Faceți clic pe butonul O.K.
  5. Apare fereastra de argumente pentru operatorul de mai sus. Această funcție este concepută pentru a calcula numărul de celule din intervalul specificat care conțin valori numerice. Sintaxa sa este următoarea:

    COUNT(valoare1, valoare2,...)

    Grupul de argumentare "Valori" este o referință la intervalul în care doriți să calculați numărul de celule umplute cu date numerice. În total, pot exista până la 255 de astfel de argumente, dar în cazul nostru avem nevoie doar de unul.

    Setați cursorul în câmp „Valoare 1”și, ținând apăsat butonul stâng al mouse-ului, selectați intervalul de pe foaia care conține populația noastră. Apoi adresa sa va fi afișată în câmp. Faceți clic pe butonul O.K.

  6. După aceea, aplicația va efectua calculul și va afișa rezultatul în celula în care se află ea însăși. În cazul nostru particular, formula s-a dovedit astfel:

    NORMĂ DE ÎNCREDERE(0,03,8,NUMĂRĂ(B2:B13))

    Rezultatul general al calculelor a fost 5,011609 .

  7. Dar asta nu este tot. După cum ne amintim, limita intervalului de încredere este calculată prin adăugarea și scăderea din valoarea medie a eșantionului a rezultatului calculului NORMA DE ÎNCREDERE. În acest fel, se calculează limitele din dreapta și respectiv din stânga intervalului de încredere. Media eșantionului în sine poate fi calculată folosind operatorul IN MEDIE.

    Acest operator este conceput pentru a calcula media aritmetică a intervalului de numere selectat. Are următoarea sintaxă destul de simplă:

    MEDIE (număr1, număr2,...)

    Argument "Număr" poate fi fie o singură valoare numerică, fie o referință la celule sau chiar intervale întregi care le conțin.

    Deci, selectați celula în care va fi afișat calculul valorii medii și faceți clic pe butonul „Inserare funcție”.

  8. se deschide Expertul de funcții. Înapoi la categorie "Statistic"și selectați un nume din listă "IN MEDIE". Ca întotdeauna, faceți clic pe butonul O.K.
  9. Fereastra de argumente este lansată. Setați cursorul în câmp "Numărul 1"și cu butonul stâng al mouse-ului apăsat, selectați întregul interval de valori. După ce coordonatele sunt afișate în câmp, faceți clic pe butonul O.K.
  10. După aceea IN MEDIE redă rezultatul calculului către un element de foaie.
  11. Calculăm limita dreaptă a intervalului de încredere. Pentru a face acest lucru, selectați o celulă separată, puneți semnul «=» si se adauga continutul elementelor fisei in care se afla rezultatele calculului functiilor IN MEDIEși NORMA DE ÎNCREDERE. Pentru a efectua calculul, apăsați butonul introduce. În cazul nostru, avem următoarea formulă:

    Rezultatul calculului: 6,953276

  12. În același mod, calculăm limita din stânga a intervalului de încredere, doar că de această dată din rezultatul calculului IN MEDIE scade rezultatul calculului operatorului NORMA DE ÎNCREDERE. Rezultă formula pentru exemplul nostru de următorul tip:

    Rezultatul calculului: -3,06994

  13. Am încercat să descriem în detaliu toți pașii pentru calcularea intervalului de încredere, așa că am descris în detaliu fiecare formulă. Dar puteți combina toate acțiunile într-o singură formulă. Calculul limitei drepte a intervalului de încredere poate fi scris după cum urmează:

    MEDIE(B2:B13)+INCREDERE(0,03,8,NUMĂRĂ(B2:B13))

  14. Un calcul similar al marginii din stânga ar arăta astfel:

    MEDIE(B2:B13)-CONFIDENCE.NORM(0,03,8,NUMĂR (B2:B13))

Metoda 2: Funcția TRUST.STUDENT

În plus, există o altă funcție în Excel care este legată de calcularea intervalului de încredere - ÎNCREDERE.STUDENT. A apărut abia din Excel 2010. Acest operator efectuează calculul intervalului de încredere al populației folosind distribuția t a lui Student. Este foarte convenabil să îl utilizați în cazul în care varianța și, în consecință, abaterea standard sunt necunoscute. Sintaxa operatorului este:

TRUST.STUDENT(alpha,standard_dev,size)

După cum puteți vedea, numele operatorilor în acest caz au rămas neschimbate.

Să vedem cum se calculează limitele intervalului de încredere cu o abatere standard necunoscută folosind exemplul aceleiași populații pe care am considerat-o în metoda anterioară. Nivelul de încredere, ca și data trecută, vom lua 97%.

  1. Selectați celula în care se va face calculul. Faceți clic pe butonul „Inserare funcție”.
  2. În deschis Expertul de funcții mergi la categorie "Statistic". Alegeți un nume „ÎNCREDERE.STUDENT”. Faceți clic pe butonul O.K.
  3. Fereastra de argumente pentru operatorul specificat este lansată.

    În câmp "Alfa", având în vedere că nivelul de încredere este de 97%, notăm numărul 0,03 . A doua oară nu ne vom opri asupra principiilor calculării acestui parametru.

    După aceea, setați cursorul în câmp "Deviație standard". De data aceasta, acest indicator ne este necunoscut și trebuie calculat. Acest lucru se face folosind o funcție specială - STDEV.V. Pentru a apela fereastra acestui operator, faceți clic pe triunghiul din stânga barei de formule. Dacă nu găsim numele dorit în lista care se deschide, atunci mergeți la articol "Mai multe trăsături...".

  4. rulează Expertul de funcții. Trecerea la categorie "Statistic"și marcați numele „STDEV.B”. Apoi faceți clic pe butonul O.K.
  5. Se deschide fereastra de argumente. sarcina operatorului STDEV.V este definiția abaterii standard în eșantionare. Sintaxa sa arată astfel:

    STDEV.V(număr1,număr2,…)

    Este ușor de ghicit că argumentul "Număr" este adresa elementului de selecție. Dacă selecția este plasată într-o singură matrice, atunci folosind un singur argument, puteți da un link către acest interval.

    Setați cursorul în câmp "Numărul 1"și, ca întotdeauna, ținând apăsat butonul stâng al mouse-ului, selectați setul. După ce coordonatele sunt în câmp, nu vă grăbiți să apăsați butonul O.K deoarece rezultatul va fi incorect. Mai întâi trebuie să revenim la fereastra de argumente operator ÎNCREDERE.STUDENT pentru a face argumentul final. Pentru a face acest lucru, faceți clic pe numele corespunzător din bara de formule.

  6. Fereastra de argumente a funcției deja familiare se deschide din nou. Setați cursorul în câmp "Marimea". Din nou, faceți clic pe triunghiul deja familiar pentru a merge la alegerea operatorilor. După cum înțelegeți, avem nevoie de un nume "VERIFICA". Deoarece am folosit această funcție în calculele din metoda anterioară, este prezentă în această listă, așa că faceți clic pe ea. Dacă nu îl găsiți, atunci urmați algoritmul descris în prima metodă.
  7. Intrarea în fereastra de argumente VERIFICA, plasați cursorul în câmp "Numărul 1"și cu butonul mouse-ului ținut apăsat, selectați colecția. Apoi faceți clic pe butonul O.K.
  8. După aceea, programul calculează și afișează valoarea intervalului de încredere.
  9. Pentru a determina limitele, va trebui din nou să calculăm media eșantionului. Dar, având în vedere că algoritmul de calcul folosind formula IN MEDIE la fel ca în metoda anterioară și chiar și rezultatul nu s-a schimbat, nu ne vom opri asupra acestui lucru în detaliu a doua oară.
  10. Însumarea rezultatelor calculului IN MEDIEși ÎNCREDERE.STUDENT, obținem limita dreaptă a intervalului de încredere.
  11. Scăzând din rezultatele de calcul ale operatorului IN MEDIE rezultatul calculului ÎNCREDERE.STUDENT, avem limita stângă a intervalului de încredere.
  12. Dacă calculul este scris într-o singură formulă, atunci calculul marginii din dreapta în cazul nostru va arăta astfel:

    MEDIE(B2:B13)+ÎNCREDEREA STUDENTULUI(0,03,STDV(B2:B13),NUMĂR (B2:B13))

  13. În consecință, formula pentru calcularea marginii din stânga va arăta astfel:

    MEDIE(B2:B13)-INCREDEREA STUDENTULUI(0,03,STDV(B2:B13),NUMĂR (B2:B13))

După cum puteți vedea, instrumentele programului Excel fac posibilă facilitarea semnificativă a calculului intervalului de încredere și a limitelor acestuia. În aceste scopuri, se folosesc operatori separați pentru eșantioanele a căror varianță este cunoscută și necunoscută.

CATEGORII

ARTICOLE POPULARE

2022 "kingad.ru" - examinarea cu ultrasunete a organelor umane