De ce sunt necesare calcule ale intervalului de încredere? Interval de încredere pentru așteptările matematice

Ţintă– predarea elevilor algoritmi pentru calcularea intervalelor de încredere ale parametrilor statistici.

La prelucrarea statistică a datelor, media aritmetică calculată, coeficientul de variație, coeficientul de corelație, criteriile de diferență și alte statistici punctuale ar trebui să primească limite cantitative de încredere, care indică posibile fluctuații ale indicatorului în direcții din ce în ce mai mari în intervalul de încredere.

Exemplul 3.1 . Distribuția calciului în serul sanguin al maimuțelor, așa cum a fost stabilită anterior, se caracterizează prin următorii indicatori de probă: = 11,94 mg%; = 0,127 mg%; n= 100. Este necesar să se determine intervalul de încredere pentru media generală ( ) cu probabilitate de încredere P = 0,95.

Media generală este situată cu o anumită probabilitate în intervalul:

, Unde – medie aritmetică eșantionului; t– testul elevului; – eroarea mediei aritmetice.

Folosind tabelul „Valorile testului t ale elevului” găsim valoarea cu o probabilitate de încredere de 0,95 și numărul de grade de libertate k= 100-1 = 99. Este egal cu 1,982. Împreună cu valorile mediei aritmetice și ale erorii statistice, o înlocuim în formula:

sau 11,69
12,19

Astfel, cu o probabilitate de 95%, se poate afirma că media generală a acestei distribuții normale este cuprinsă între 11,69 și 12,19 mg%.

Exemplul 3.2 . Determinați limitele intervalului de încredere de 95% pentru varianța generală ( ) distribuția calciului în sângele maimuțelor, dacă se știe că
= 1,60, at n = 100.

Pentru a rezolva problema puteți folosi următoarea formulă:

Unde – eroarea statistică de dispersie.

Găsim eroarea varianței de eșantionare folosind formula:
. Este egal cu 0,11. Sens t- criteriu cu probabilitatea de încredere de 0,95 și numărul de grade de libertate k= 100–1 = 99 este cunoscut din exemplul anterior.

Să folosim formula și să obținem:

sau 1,38
1,82

Mai precis, intervalul de încredere al varianței generale poate fi construit folosind (chi-pătrat) - testul Pearson. Punctele critice pentru acest criteriu sunt date într-un tabel special. La folosirea criteriului Pentru a construi un interval de încredere, se utilizează un nivel de semnificație cu două fețe. Pentru limita inferioară, nivelul de semnificație este calculat folosind formula
, pentru partea de sus -
. De exemplu, pentru nivelul de încredere = 0,99= 0,010,= 0,990. În consecință, conform tabelului de distribuție a valorilor critice , cu niveluri de încredere calculate și numărul de grade de libertate k= 100 – 1= 99, găsiți valorile
Și
. Primim
este egal cu 135,80 și
este egal cu 70,06.

Pentru a găsi limitele de încredere pentru varianța generală folosind Să folosim formulele: pentru limita inferioară
, pentru limita superioară
. Să înlocuim valorile găsite cu datele problemei în formule:
= 1,17;
= 2,26. Astfel, cu o probabilitate de încredere P= 0,99 sau 99% varianță generală va fi în intervalul de la 1,17 la 2,26 mg% inclusiv.

Exemplul 3.3 . Dintre 1000 de semințe de grâu din lotul primit la lift, 120 de semințe au fost găsite infectate cu ergot. Este necesar să se determine limitele probabile ale proporției generale de semințe infectate într-un anumit lot de grâu.

Este recomandabil să se determine limitele de încredere pentru cota generală pentru toate valorile sale posibile folosind formula:

,

Unde n – numărul de observații; m– dimensiunea absolută a unuia dintre grupuri; t– abatere normalizată.

Proporția eșantionului de semințe infectate este
sau 12%. Cu probabilitate de încredere R= abatere normalizată de 95% ( t-Testul elevului la k =
)t = 1,960.

Înlocuim datele disponibile în formula:

Prin urmare, limitele intervalului de încredere sunt egale cu = 0,122–0,041 = 0,081 sau 8,1%; = 0,122 + 0,041 = 0,163 sau 16,3%.

Astfel, cu o probabilitate de încredere de 95% se poate afirma că proporția generală a semințelor infectate este între 8,1 și 16,3%.

Exemplul 3.4 . Coeficientul de variație care caracterizează variația calciului (mg%) în serul sanguin al maimuțelor a fost egal cu 10,6%. Marime de mostra n= 100. Este necesar să se determine limitele intervalului de încredere de 95% pentru parametrul general CV.

Limitele intervalului de încredere pentru coeficientul general de variație CV sunt determinate de următoarele formule:

Și
, Unde K valoare intermediară calculată prin formula
.

Știind asta cu probabilitate de încredere R= 95% abatere normalizată (testul studentului la k =
)t = 1,960, să calculăm mai întâi valoarea LA:

.

sau 9,3%

sau 12,3%

Astfel, coeficientul general de variație cu un nivel de încredere de 95% se află în intervalul de la 9,3 la 12,3%. La probe repetate, coeficientul de variație nu va depăși 12,3% și nu va fi sub 9,3% în 95 de cazuri din 100.

Întrebări pentru autocontrol:

Probleme pentru rezolvare independentă.

1. Procentul mediu de grăsime din lapte în timpul lactației la vacile încrucișate Kholmogory a fost următorul: 3,4; 3,6; 3,2; 3.1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4.1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3.8. Stabiliți intervale de încredere pentru media generală la un nivel de încredere de 95% (20 de puncte).

2. La 400 de plante hibride de secară, primele flori au apărut în medie la 70,5 zile de la semănat. Abaterea standard a fost de 6,9 ​​zile. Determinați eroarea mediei și a intervalelor de încredere pentru media generală și varianța la nivelul de semnificație W= 0,05 și W= 0,01 (25 puncte).

3. La studierea lungimii frunzelor a 502 exemplare de căpșuni de grădină s-au obținut următoarele date: = 7,86 cm; σ = 1,32 cm, =± 0,06 cm Determinați intervalele de încredere pentru media aritmetică a populației cu niveluri de semnificație de 0,01; 0,02; 0,05. (25 de puncte).

4. Într-un studiu pe 150 de bărbați adulți, înălțimea medie a fost de 167 cm și σ = 6 cm Care sunt limitele mediei generale și ale varianței generale cu o probabilitate de încredere de 0,99 și 0,95? (25 de puncte).

5. Distribuția calciului în serul sanguin al maimuțelor este caracterizată de următorii indicatori selectivi: = 11,94 mg%, σ = 1,27, n = 100. Construiți un interval de încredere de 95% pentru media generală a acestei distribuții. Calculați coeficientul de variație (25 de puncte).

6. A fost studiat conținutul total de azot din plasma sanguină a șobolanilor albinoși la vârsta de 37 și 180 de zile. Rezultatele sunt exprimate în grame la 100 cm3 de plasmă. La vârsta de 37 de zile, 9 șobolani aveau: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. La vârsta de 180 de zile, 8 șobolani aveau: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1.12. Setați intervale de încredere pentru diferență la un nivel de încredere de 0,95 (50 de puncte).

7. Determinați limitele intervalului de încredere de 95% pentru varianța generală a distribuției calciului (mg%) în serul sanguin al maimuțelor, dacă pentru această distribuție dimensiunea eșantionului este n = 100, eroarea statistică a varianței eșantionului s σ 2 = 1,60 (40 puncte).

8. Determinați limitele intervalului de încredere de 95% pentru varianța generală a distribuției a 40 de spiculeți de grâu de-a lungul lungimii (σ 2 = 40,87 mm 2). (25 de puncte).

9. Fumatul este considerat principalul factor predispozitiv la bolile pulmonare obstructive. Fumatul pasiv nu este considerat un astfel de factor. Oamenii de știință s-au îndoit de inofensivitatea fumatului pasiv și au examinat permeabilitatea căilor respiratorii a nefumătorilor, fumătorilor pasivi și activi. Pentru a caracteriza starea tractului respirator, am luat unul dintre indicatorii funcției de respirație externă - debitul volumetric maxim de la mijlocul expirării. O scădere a acestui indicator este un semn de obstrucție a căilor respiratorii. Datele sondajului sunt prezentate în tabel.

Numărul de persoane examinate

Debitul maxim mediu expirator, l/s

Deviație standard

nefumători

lucrează într-o zonă de nefumători

lucrând într-o cameră plină de fum

Fumat

fumează un număr mic de țigări

numărul mediu de fumători de țigări

fumează un număr mare de țigări

Folosind datele din tabel, găsiți intervale de încredere de 95% pentru media generală și varianța generală pentru fiecare grup. Care sunt diferențele dintre grupuri? Prezentați rezultatele grafic (25 de puncte).

10. Determinați limitele intervalelor de încredere de 95% și 99% pentru variația generală a numărului de purcei din 64 de fătări, dacă eroarea statistică a varianței eșantionului s σ 2 = 8,25 (30 puncte).

11. Se știe că greutatea medie a iepurilor este de 2,1 kg. Determinați limitele intervalelor de încredere de 95% și 99% pentru media generală și varianța la n= 30, σ = 0,56 kg (25 puncte).

12. Conținutul de boabe al spicului a fost măsurat pentru 100 de spice ( X), lungimea urechii ( Y) și masa de cereale în spic ( Z). Găsiți intervalele de încredere pentru media generală și varianța la P 1 = 0,95, P 2 = 0,99, P 3 = 0,999 dacă = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29.153, σ y 2 = 2. 111, σ z 2 = 0. 064. (25 puncte).

13. În 100 de spice alese aleatoriu de grâu de iarnă a fost numărat numărul de spiculete. Populația eșantionului a fost caracterizată de următorii indicatori: = 15 spiculete și σ = 2,28 buc. Determinați cu ce precizie a fost obținut rezultatul mediu ( ) și construiți un interval de încredere pentru media generală și varianța la niveluri de semnificație de 95% și 99% (30 de puncte).

14. Numărul de coaste pe cochilii de moluște fosile Orthambonites calligramma:

Se știe că n = 19, σ = 4,25. Determinați limitele intervalului de încredere pentru media generală și varianța generală la nivelul de semnificație W = 0,01 (25 puncte).

15. Pentru determinarea randamentului de lapte într-o fermă de lapte s-a determinat zilnic productivitatea a 15 vaci. Conform datelor pe an, fiecare vacă a dat în medie următoarea cantitate de lapte pe zi (l): 22; 19; 25; 20; 27; 17; treizeci; 21; 18; 24; 26; 23; 25; 20; 24. Construiți intervale de încredere pentru varianța generală și media aritmetică. Ne putem aștepta ca producția medie anuală de lapte per vaca să fie de 10.000 de litri? (50 de puncte).

16. Pentru determinarea randamentului mediu de grâu pentru întreprinderea agricolă s-a efectuat cosirea pe parcele de probă de 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 și 2 hectare. Productivitatea (c/ha) de pe parcele a fost de 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 respectiv. Construiți intervale de încredere pentru varianța generală și media aritmetică. Ne putem aștepta ca randamentul agricol mediu să fie de 42 c/ha? (50 de puncte).

Interval de încredere pentru așteptările matematice - acesta este un interval calculat din date care, cu o probabilitate cunoscuta, contine asteptarea matematica a populatiei generale. O estimare naturală pentru așteptarea matematică este media aritmetică a valorilor observate. Prin urmare, pe parcursul lecției vom folosi termenii „medie” și „valoare medie”. În problemele de calculare a unui interval de încredere, un răspuns solicitat cel mai adesea este ceva de genul „Intervalul de încredere al mediei [valoarea unei anumite probleme] este de la [valoarea mai mică] la [valoarea mai mare]”. Folosind un interval de încredere, puteți evalua nu numai valorile medii, ci și proporția unei anumite caracteristici a populației generale. Valorile medii, dispersia, abaterea standard și eroarea, prin care vom ajunge la noi definiții și formule, sunt discutate în lecție Caracteristicile eșantionului și populației .

Estimări punctuale și pe intervale ale mediei

Dacă valoarea medie a populației este estimată printr-un număr (punct), atunci o medie specifică, care este calculată dintr-un eșantion de observații, este luată ca o estimare a valorii medii necunoscute a populației. În acest caz, valoarea mediei eșantionului - o variabilă aleatorie - nu coincide cu valoarea medie a populației generale. Prin urmare, atunci când indicați media eșantionului, trebuie să indicați simultan eroarea de eșantionare. Măsura erorii de eșantionare este eroarea standard, care este exprimată în aceleași unități ca și media. Prin urmare, se folosește adesea următoarea notație: .

Dacă estimarea mediei trebuie să fie asociată cu o anumită probabilitate, atunci parametrul de interes în populație trebuie evaluat nu printr-un număr, ci printr-un interval. Un interval de încredere este un interval în care, cu o anumită probabilitate P se constată valoarea indicatorului populaţiei estimate. Interval de încredere în care este probabil P = 1 - α se găsește variabila aleatoare, calculată după cum urmează:

,

α = 1 - P, care poate fi găsit în anexa la aproape orice carte de statistică.

În practică, media și varianța populației nu sunt cunoscute, astfel încât varianța populației este înlocuită cu varianța eșantionului, iar media populației cu media eșantionului. Astfel, intervalul de încredere în majoritatea cazurilor se calculează după cum urmează:

.

Formula intervalului de încredere poate fi utilizată pentru a estima media populației dacă

  • se cunoaște abaterea standard a populației;
  • sau abaterea standard a populației este necunoscută, dar dimensiunea eșantionului este mai mare de 30.

Media eșantionului este o estimare imparțială a mediei populației. La rândul său, varianța eșantionului nu este o estimare imparțială a varianței populației. Pentru a obține o estimare imparțială a varianței populației în formula variației eșantionului, dimensiunea eșantionului n ar trebui înlocuit cu n-1.

Exemplul 1. S-au colectat informații de la 100 de cafenele selectate aleatoriu dintr-un anumit oraș că numărul mediu de angajați din acestea este de 10,5 cu o abatere standard de 4,6. Determinați intervalul de încredere de 95% pentru numărul de angajați ai cafenelei.

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Astfel, intervalul de încredere de 95% pentru numărul mediu de angajați ai cafenelei a variat între 9,6 și 11,4.

Exemplul 2. Pentru un eșantion aleatoriu dintr-o populație de 64 de observații, au fost calculate următoarele valori totale:

suma valorilor din observații,

suma abaterilor pătrate ale valorilor de la medie .

Calculați intervalul de încredere de 95% pentru așteptările matematice.

Să calculăm abaterea standard:

,

Să calculăm valoarea medie:

.

Înlocuim valorile în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

Astfel, intervalul de încredere de 95% pentru așteptarea matematică a acestui eșantion a variat între 7,484 și 11,266.

Exemplul 3. Pentru un eșantion de populație aleatoriu de 100 de observații, media calculată este 15,2 și abaterea standard este 3,2. Calculați intervalul de încredere de 95% pentru valoarea așteptată, apoi intervalul de încredere de 99%. Dacă puterea eșantionului și variația acesteia rămân neschimbate și coeficientul de încredere crește, intervalul de încredere se va îngusta sau se va lărgi?

Inlocuim aceste valori in expresia pentru intervalul de incredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,05 .

Primim:

.

Astfel, intervalul de încredere de 95% pentru media acestui eșantion a variat între 14,57 și 15,82.

Substituim din nou aceste valori în expresia pentru intervalul de încredere:

unde este valoarea critică a distribuției normale standard pentru nivelul de semnificație α = 0,01 .

Primim:

.

Astfel, intervalul de încredere de 99% pentru media acestui eșantion a variat între 14,37 și 16,02.

După cum vedem, pe măsură ce coeficientul de încredere crește, crește și valoarea critică a distribuției normale standard și, în consecință, punctele de început și de sfârșit ale intervalului sunt situate mai departe de medie și astfel intervalul de încredere pentru așteptarea matematică crește. .

Estimări punctiforme și pe intervale ale greutății specifice

Ponderea unui atribut al eșantionului poate fi interpretată ca o estimare punctuală a cotei p de aceeaşi caracteristică în populaţia generală. Dacă această valoare trebuie să fie asociată cu probabilitatea, atunci intervalul de încredere al greutății specifice trebuie calculat p caracteristică în populaţie cu probabilitate P = 1 - α :

.

Exemplul 4.Într-un oraș sunt doi candidați AȘi B candideaza pentru functia de primar. 200 de locuitori ai orașului au fost chestionați aleatoriu, dintre care 46% au răspuns că vor vota pentru candidat A, 26% - pentru candidat B iar 28% nu știu pe cine vor vota. Determinați intervalul de încredere de 95% pentru proporția de locuitori ai orașului care susțin candidatul A.

Din acest articol veți învăța:

    Ce s-a întâmplat interval de încredere?

    Care e ideea regulile 3 sigma?

    Cum poți aplica aceste cunoștințe în practică?

În prezent, datorită unei supraabundențe de informații asociate cu o gamă largă de produse, direcții de vânzare, angajați, domenii de activitate etc., poate fi dificil să evidențiezi principalul lucru, care, în primul rând, merită să-i acordăm atenție și să depunem eforturi pentru a-l gestiona. Definiție interval de încredereși analiza valorilor reale care depășesc limitele sale - o tehnică care vă va ajuta să evidențiați situațiile, influențând tendințele în schimbare. Veți putea dezvolta factori pozitivi și reduce influența celor negativi. Această tehnologie este utilizată în multe companii mondiale bine-cunoscute.

Există așa-numitele " alerte", care informează managerii că următoarea valoare este într-o anumită direcție a trecut dincolo interval de încredere. Ce înseamnă acest lucru? Acesta este un semnal că a avut loc un eveniment neobișnuit, care poate schimba tendința existentă în această direcție. Acesta este un semnal la asta pentru a-l da seamaîn situație și înțelegeți ce a influențat-o.

De exemplu, luați în considerare mai multe situații. Am calculat prognoza vânzărilor cu limite estimate pentru 100 de articole de produs pentru 2011 pe lună și vânzările reale în martie:

  1. Pentru „Uleiul de floarea soarelui” au depășit limita superioară a prognozei și nu au intrat în intervalul de încredere.
  2. Pentru „Drojdie uscată” am depășit limita inferioară a prognozei.
  3. „Teci de ovăz” a depășit limita superioară.

Pentru alte produse, vânzările efective s-au încadrat în limitele prognozate date. Acestea. vânzările lor au fost în limitele așteptărilor. Așadar, am identificat 3 produse care au depășit granițele și am început să ne dăm seama ce le-a influențat să treacă dincolo de granițe:

  1. Pentru uleiul de floarea soarelui am intrat într-o nouă rețea de distribuție, care ne-a oferit un volum suplimentar de vânzări, ceea ce ne-a determinat să depășim limita superioară. Pentru acest produs, merită să recalculăm prognoza până la sfârșitul anului, ținând cont de prognoza de vânzări pentru această rețea.
  2. Pentru „Dry Yeast”, mașina s-a blocat la vamă și a existat un deficit în 5 zile, ceea ce a afectat scăderea vânzărilor și a depășit limita inferioară. Ar putea fi util să vă dați seama ce a cauzat-o și să încercați să nu repetați această situație.
  3. A fost lansat un eveniment de promovare a vânzărilor pentru Terci de ovăz, care a dat o creștere semnificativă a vânzărilor și a făcut ca compania să depășească prognoza.

Am identificat 3 factori care au influențat depășirea limitelor prognozate. Pot exista mult mai multe în viață Pentru a crește acuratețea prognozei și a planificării, factori care duc la faptul că vânzările reale pot depăși limitele prognozate, merită evidențiate și construirea de previziuni și planuri pentru ele separat. Și apoi luați în considerare impactul lor asupra prognozei principale de vânzări. De asemenea, puteți evalua în mod regulat impactul acestor factori și puteți schimba situația în bine. prin reducerea influenței factorilor negativi și creșterea influenței factorilor pozitivi.

Cu un interval de încredere putem:

  1. Selectați direcțiile, cărora merită să le acordați atenție, pentru că s-au produs evenimente în aceste direcţii care pot afecta schimbare de tendință.
  2. Identificați factorii, care influențează cu adevărat schimbarea situației.
  3. Accept decizie informată(de exemplu, despre cumpărare, planificare etc.).

Acum să ne uităm la ce este un interval de încredere și cum să-l calculăm în Excel folosind un exemplu.

Ce este un interval de încredere?

Intervalul de încredere reprezintă limitele de prognoză (superioare și inferioare), în interiorul cărora cu o probabilitate dată (sigma) vor apărea valorile reale.

Acestea. Calculăm prognoza - acesta este ghidul nostru principal, dar înțelegem că este puțin probabil ca valorile reale să fie 100% egale cu prognoza noastră. Și se pune întrebarea, în ce limite valorile reale pot scădea, dacă tendința actuală continuă? Și această întrebare ne va ajuta să răspundem calculul intervalului de încredere, adică - limitele superioare și inferioare ale prognozei.

Ce este o probabilitate sigma dată?

La calcul interval de încredere putem probabilitate stabilită lovituri valori reale în limitele de prognoză date. Cum să o facă? Pentru a face acest lucru, setăm valoarea lui sigma și, dacă sigma este egal cu:

    3 sigma- atunci, probabilitatea ca următoarea valoare reală să cadă în intervalul de încredere va fi de 99,7%, sau 300 la 1, sau există o probabilitate de 0,3% de a depăși limitele.

    2 sigma- atunci, probabilitatea ca următoarea valoare să se încadreze în limite este ≈ 95,5%, i.e. șansele sunt de aproximativ 20 la 1, sau există o șansă de 4,5% să treci peste bord.

    1 sigma- atunci probabilitatea este ≈ 68,3%, i.e. șansele sunt de aproximativ 2 la 1 sau există o șansă de 31,7% ca următoarea valoare să cadă în afara intervalului de încredere.

Noi am formulat regula 3 sigma,care spune că probabilitatea de lovire o altă valoare aleatorie în intervalul de încredere cu o valoare dată trei sigma este 99,7%.

Marele matematician rus Cebyshev a demonstrat teorema că există o probabilitate de 10% de a depăși limitele prognozate cu o valoare dată de trei sigma. Acestea. probabilitatea de a se încadra în intervalul de încredere de 3 sigma va fi de cel puțin 90%, în timp ce o încercare de a calcula prognoza și limitele acesteia „cu ochi” este plină de erori mult mai semnificative.

Cum să calculezi singur un interval de încredere în Excel?

Să ne uităm la calculul intervalului de încredere în Excel (adică, limitele superioare și inferioare ale prognozei) folosind un exemplu. Avem o serie de timp - vânzări pe lună timp de 5 ani. Vezi fisierul atasat.

Pentru a calcula limitele de prognoză, calculăm:

  1. Prognoza de vânzări().
  2. Sigma - abatere standard modele de prognoză din valori reale.
  3. Trei sigma.
  4. Interval de încredere.

1. Prognoza vânzărilor.

=(RC[-14] (date de serie temporală)- RC[-1] (valoarea modelului))^2(pătrat)


3. Pentru fiecare lună, să însumăm valorile abaterii de la etapa 8 Sum((Xi-Ximod)^2), adică Să rezumam ianuarie, februarie... pentru fiecare an.

Pentru a face acest lucru, utilizați formula =SUMIF()

SUMIF(matrice cu numerele perioadei din interiorul ciclului (pentru luni de la 1 la 12); link la numărul perioadei din ciclu; link la o matrice cu pătrate ale diferenței dintre datele sursă și valorile perioadei)


4. Calculați abaterea standard pentru fiecare perioadă din ciclu de la 1 la 12 (etapa 10 in fisierul atasat).

Pentru a face acest lucru, extragem rădăcina din valoarea calculată la etapa 9 și împărțim la numărul de perioade din acest ciclu minus 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Să folosim formulele din Excel =ROOT(R8 (link către (Sum(Xi-Ximod)^2)/(COUNTIF($O$8:$O$67 (link la matrice cu numere de ciclu); O8 (link la un anumit număr de ciclu pe care îl numărăm în matrice))-1))

Folosind formula Excel = COUNTIF numărăm numărul n


După ce am calculat abaterea standard a datelor reale de la modelul de prognoză, am obținut valoarea sigma pentru fiecare lună - etapa 10 in fisierul atasat.

3. Să calculăm 3 sigma.

La etapa 11 setăm numărul de sigma - în exemplul nostru „3” (etapa 11 in fisierul atasat):

De asemenea, convenabil pentru exersarea valorilor sigma:

1,64 sigma - 10% sanse de depasire a limitei (1 sansa din 10);

1,96 sigma - 5% șansă de a depăși limitele (1 șansă din 20);

2,6 sigma - 1% șansă de a depăși limitele (1 șansă la 100).

5) Calcularea trei sigma, pentru aceasta înmulțim valorile „sigma” pentru fiecare lună cu „3”.

3. Determinați intervalul de încredere.

  1. Limită superioară de prognoză- previziunea vanzarilor tinand cont de crestere si sezonalitate + (plus) 3 sigma;
  2. Limită inferioară de prognoză- prognoza vânzărilor ținând cont de creștere și sezonalitate – (minus) 3 sigma;

Pentru comoditatea calculării intervalului de încredere pentru o perioadă lungă (vezi fișierul atașat), vom folosi formula Excel =Y8+CĂUTARE V(W8, 8 USD: 19 USD, 2,0 USD), Unde

Y8- Prognoza de vânzări;

W8- numarul lunii pentru care vom lua valoarea 3-sigma;

Acestea. Limită superioară de prognoză= „prognoza vânzărilor” + „3 sigma” (în exemplu, CĂUTARE V (numărul lunii; tabel cu valori 3 sigma; coloană din care extragem valoarea sigma egală cu numărul lunii din rândul corespunzător; 0)).

Limită inferioară de prognoză= „prognoza vânzărilor” minus „3 sigma”.

Deci, am calculat intervalul de încredere în Excel.

Acum avem o prognoză și un interval cu limite în care valorile reale vor cădea cu o probabilitate sigma dată.

În acest articol, am analizat ce sunt sigma și regula trei sigma, cum să determinați un interval de încredere și de ce puteți utiliza această tehnică în practică.

Vă dorim prognoze corecte și succes!

Cum Forecast4AC PRO vă poate ajutala calcularea intervalului de încredere?:

    Forecast4AC PRO va calcula automat limitele superioare sau inferioare ale prognozei pentru mai mult de 1000 de serii temporale simultan;

    Capacitatea de a analiza limitele prognozei în comparație cu prognoza, tendința și vânzările reale pe diagramă cu o singură apăsare de tastă;

În programul Forcast4AC PRO este posibil să setați valoarea sigma de la 1 la 3.

Alăturaţi-ne!

Descărcați aplicații gratuite de prognoză și analiză de afaceri:


  • Novo Forecast Lite- automată calculul prognozei V excela.
  • 4analitica - Analiza ABC-XYZși analiza emisiilor Excela.
  • Qlik Sense Desktop și QlikViewPersonal Edition - Sisteme BI pentru analiza și vizualizarea datelor.

Testați capacitățile soluțiilor plătite:

  • Novo Forecast PRO- prognoza in Excel pentru seturi mari de date.
Interval de încredere– valorile limită ale unei mărimi statistice care, cu o probabilitate de încredere dată γ, se vor afla în acest interval la eșantionarea unui volum mai mare. Notat cu P(θ - ε. În practică, probabilitatea de încredere γ este aleasă dintre valori destul de apropiate de unitate: γ = 0,9, γ = 0,95, γ = 0,99.

Scopul serviciului. Folosind acest serviciu, puteți determina:

  • interval de încredere pentru media generală, interval de încredere pentru varianță;
  • interval de încredere pentru abaterea standard, interval de încredere pentru cota generală;
Soluția rezultată este salvată într-un fișier Word (vezi exemplu). Mai jos este o instrucțiune video despre cum să completați datele inițiale.

Exemplul nr. 1. Într-o fermă colectivă, dintr-un efectiv total de 1000 de oi, 100 de oi au fost tunse cu control selectiv. Ca urmare, s-a stabilit o tăiere medie a lânii de 4,2 kg per oaie. Determinați cu o probabilitate de 0,99 eroarea pătratică medie a eșantionului atunci când se determină forfecarea medie a lânii per oaie și limitele în care este conținută valoarea de forfecare dacă varianța este 2,5. Eșantionul este nerepetitiv.
Exemplul nr. 2. Dintr-un lot de produse importate la postul Vămii de Nord din Moscova, 20 de mostre de produs „A” au fost prelevate prin prelevare aleatorie repetată. În urma testului, a fost stabilit conținutul mediu de umiditate al produsului „A” din probă, care s-a dovedit a fi egal cu 6% cu o abatere standard de 1%.
Determinați cu o probabilitate de 0,683 limitele conținutului mediu de umiditate al produsului în întregul lot de produse importate.
Exemplul nr. 3. Un sondaj efectuat pe 36 de studenți a arătat că numărul mediu de manuale citite de aceștia în cursul anului universitar a fost egal cu 6. Presupunând că numărul de manuale citite de un student pe semestru are o lege de distribuție normală cu o abatere standard egală cu 6, găsiți : A) cu o fiabilitate de 0,99 estimare de interval pentru așteptarea matematică a acestei variabile aleatoare; B) cu ce probabilitate putem spune că numărul mediu de manuale citite de un student pe semestru, calculat din acest eșantion, se va abate de la așteptarea matematică în valoare absolută cu cel mult 2.

Clasificarea intervalelor de încredere

După tipul de parametru evaluat:

După tipul de eșantion:

  1. Interval de încredere pentru un eșantion infinit;
  2. Interval de încredere pentru eșantionul final;
Eșantionul se numește reeșantionare, dacă obiectul selectat este returnat populației înainte de a-l selecta pe următorul. Eșantionul se numește non-repeat, dacă obiectul selectat nu este returnat populației. În practică, de obicei avem de-a face cu mostre nerepetitive.

Calculul erorii medii de eșantionare pentru eșantionarea aleatorie

Discrepanța dintre valorile indicatorilor obținuți din eșantion și parametrii corespunzători ai populației generale se numește eroare de reprezentativitate.
Desemnări ale parametrilor principali ai populațiilor generale și eșantionului.
Formule de eroare medie de eșantionare
re-selectareselecție nerepetitivă
pentru mediepentru împărțirepentru mediepentru împărțire
Relația dintre limita erorii de eșantionare (Δ) este garantată cu o oarecare probabilitate Р(t), iar eroarea medie de eșantionare are forma: sau Δ = t·μ, unde t– coeficient de încredere, determinat în funcție de nivelul de probabilitate P(t) conform tabelului funcției integrale Laplace.

Formule pentru calcularea dimensiunii eșantionului folosind o metodă de eșantionare pur aleatorie

Una dintre metodele de rezolvare a problemelor statistice este calcularea intervalului de încredere. Este utilizat ca o alternativă preferată la estimarea punctuală atunci când dimensiunea eșantionului este mică. Trebuie remarcat faptul că procesul de calcul al intervalului de încredere în sine este destul de complex. Dar instrumentele programului Excel vă permit să o simplificați oarecum. Să aflăm cum se face acest lucru în practică.

Această metodă este utilizată pentru estimarea pe intervale a diferitelor mărimi statistice. Sarcina principală a acestui calcul este de a scăpa de incertitudinile estimării punctuale.

În Excel, există două opțiuni principale pentru efectuarea calculelor folosind această metodă: când varianța este cunoscută și când este necunoscută. În primul caz, funcția este utilizată pentru calcule ÎNCREDERE.NORMĂ, iar în al doilea - ADMINISTRATOR.STUDENT.

Metoda 1: Funcția NORM DE ÎNCREDERE

Operator ÎNCREDERE.NORMĂ, care aparține grupului statistic de funcții, a apărut pentru prima dată în Excel 2010. Versiunile anterioare ale acestui program folosesc analogul său ÎNCREDERE. Scopul acestui operator este de a calcula un interval de încredere distribuit normal pentru media populației.

Sintaxa sa este următoarea:

CONFIDENCE.NORM(alpha;standard_off;size)

"Alfa"— un argument care indică nivelul de semnificație care este utilizat pentru a calcula nivelul de încredere. Nivelul de încredere este egal cu următoarea expresie:

(1-"Alfa")*100

"Deviație standard"- Acesta este un argument, a cărui esență este clară din nume. Aceasta este abaterea standard a eșantionului propus.

"Mărimea"— argument care definește dimensiunea eșantionului.

Toate argumentele aduse acestui operator sunt necesare.

Funcţie ÎNCREDERE are exact aceleași argumente și posibilități ca și precedentul. Sintaxa sa este:

TRUST(alpha, standard_off, dimensiune)

După cum puteți vedea, diferențele sunt doar în numele operatorului. Din motive de compatibilitate, această funcție este lăsată în Excel 2010 și versiunile mai noi într-o categorie specială "Compatibilitate". În versiunile Excel 2007 și anterioare, acesta este prezent în grupul principal de operatori statistici.

Limita intervalului de încredere este determinată folosind următoarea formulă:

X+(-)INCREDEREA NORM

Unde X este valoarea medie a eșantionului, care se află la mijlocul intervalului selectat.

Acum să ne uităm la cum să calculăm un interval de încredere folosind un exemplu specific. Au fost efectuate 12 teste, rezultând rezultate diferite, enumerate în tabel. Aceasta este totalitatea noastră. Abaterea standard este 8. Trebuie să calculăm intervalul de încredere la nivelul de încredere de 97%.

  1. Selectați celula în care va fi afișat rezultatul prelucrării datelor. Faceți clic pe butonul „Inserare funcție”.
  2. Apare Expertul de funcții. Mergi la categorie "Statistic"și evidențiați numele „TRUST.NORM”. După aceea, faceți clic pe butonul "BINE".
  3. Se deschide fereastra de argumente. Câmpurile sale corespund în mod firesc cu numele argumentelor.
    Plasați cursorul în primul câmp - "Alfa". Aici ar trebui să indicăm nivelul de semnificație. După cum ne amintim, nivelul nostru de încredere este de 97%. În același timp, am spus că se calculează astfel:

    (1-nivel de încredere)/100

    Adică, înlocuind valoarea, obținem:

    Prin calcule simple aflăm că argumentul "Alfa" egală 0,03 . Introduceți această valoare în câmp.

    După cum se știe, prin condiție abaterea standard este egală cu 8 . Prin urmare, pe teren "Deviație standard" doar notează acest număr.

    În câmp "Mărimea" trebuie să introduceți numărul de elemente de testare efectuate. După cum ne amintim, lor 12 . Dar pentru a automatiza formula și a nu o edita de fiecare dată când efectuăm un nou test, să setăm această valoare nu cu un număr obișnuit, ci folosind operatorul VERIFICA. Deci, să plasăm cursorul în câmp "Mărimea", apoi faceți clic pe triunghi, care se află în stânga barei de formule.

    Apare o listă cu funcțiile utilizate recent. Dacă operatorul VERIFICA a fost folosit recent de dvs., ar trebui să fie pe această listă. În acest caz, trebuie doar să faceți clic pe numele acestuia. În caz contrar, dacă nu îl găsești, mergi la subiect „Alte funcții...”.

  4. Apare unul deja familiar Expertul de funcții. Să ne întoarcem din nou la grup "Statistic". Evidențiem numele acolo "VERIFICA". Faceți clic pe butonul "BINE".
  5. Apare fereastra de argumente pentru afirmația de mai sus. Această funcție este concepută pentru a calcula numărul de celule dintr-un interval specificat care conțin valori numerice. Sintaxa sa este următoarea:

    COUNT(valoare1,valoare2,...)

    Grupul de argumentare "Valori" este o referință la intervalul în care doriți să calculați numărul de celule umplute cu date numerice. Pot exista până la 255 de astfel de argumente în total, dar în cazul nostru avem nevoie doar de unul.

    Plasați cursorul în câmp „Valoarea 1”și, ținând apăsat butonul stâng al mouse-ului, selectați pe foaie gama care conține colecția noastră. Apoi adresa lui va fi afișată în câmp. Faceți clic pe butonul "BINE".

  6. După aceasta, aplicația va efectua calculul și va afișa rezultatul în celula în care se află. În cazul nostru particular, formula arăta astfel:

    NORMĂ DE ÎNCREDERE(0,03,8,NUMĂRĂ(B2:B13))

    Rezultatul general al calculelor a fost 5,011609 .

  7. Dar asta nu este tot. După cum ne amintim, limita intervalului de încredere este calculată prin adăugarea și scăderea rezultatului calculului din media eșantionului ÎNCREDERE.NORMĂ. În acest fel, se calculează limitele din dreapta și respectiv din stânga intervalului de încredere. Media eșantionului în sine poate fi calculată folosind operatorul IN MEDIE.

    Acest operator este conceput pentru a calcula media aritmetică a unui interval selectat de numere. Are următoarea sintaxă destul de simplă:

    MEDIE(numărul1,numărul2,...)

    Argument "Număr" poate fi fie o singură valoare numerică, fie o referință la celule sau chiar intervale întregi care le conțin.

    Deci, selectați celula în care va fi afișat calculul valorii medii și faceți clic pe butonul „Inserare funcție”.

  8. Se deschide Expertul de funcții. Revenind la categorie "Statistic"și selectați un nume din listă "IN MEDIE". Ca întotdeauna, faceți clic pe butonul "BINE".
  9. Se deschide fereastra de argumente. Plasați cursorul în câmp "Numărul 1"și ținând apăsat butonul stâng al mouse-ului, selectați întregul interval de valori. După ce coordonatele sunt afișate în câmp, faceți clic pe butonul "BINE".
  10. După care IN MEDIE afișează rezultatul calculului într-un element de foaie.
  11. Calculăm limita dreaptă a intervalului de încredere. Pentru a face acest lucru, selectați o celulă separată și puneți semnul «=» și se adună conținutul elementelor fișei în care se află rezultatele calculelor funcției IN MEDIEȘi ÎNCREDERE.NORMĂ. Pentru a efectua calculul, apăsați butonul introduce. În cazul nostru, avem următoarea formulă:

    Rezultatul calculului: 6,953276

  12. La fel se calculează limita din stânga a intervalului de încredere, doar de data aceasta din rezultatul calculului IN MEDIE scade rezultatul calculului operatorului ÎNCREDERE.NORMĂ. Formula rezultată pentru exemplul nostru este de următorul tip:

    Rezultatul calculului: -3,06994

  13. Am încercat să descriem în detaliu toți pașii pentru calcularea intervalului de încredere, așa că am descris fiecare formulă în detaliu. Dar puteți combina toate acțiunile într-o singură formulă. Calculul limitei drepte a intervalului de încredere poate fi scris după cum urmează:

    MEDIE(B2:B13)+ÎNCREDERE.NORMĂ(0,03,8,NUMĂRĂ(B2:B13))

  14. Un calcul similar pentru marginea din stânga ar arăta astfel:

    MEDIE(B2:B13)-CONFIDENCE.NORM(0,03,8,NUMĂR (B2:B13))

Metoda 2: Funcția TRUST.STUDENT

În plus, Excel are o altă funcție care este asociată cu calcularea intervalului de încredere - ADMINISTRATOR.STUDENT. A apărut doar în Excel 2010. Acest operator calculează intervalul de încredere al populației folosind distribuția Student. Este foarte convenabil de utilizat atunci când varianța și, în consecință, abaterea standard sunt necunoscute. Sintaxa operatorului este:

CONFIDENCE.STUDENT(alpha,standard_off,size)

După cum puteți vedea, numele operatorilor au rămas neschimbate în acest caz.

Să vedem cum se calculează limitele unui interval de încredere cu o abatere standard necunoscută folosind exemplul aceleiași populații pe care am considerat-o în metoda anterioară. Să luăm nivelul de încredere ca ultima dată la 97%.

  1. Selectați celula în care va fi efectuat calculul. Faceți clic pe butonul „Inserare funcție”.
  2. În deschis Expertul de funcții mergi la categorie "Statistic". Selectați un nume „ELEV DE ÎNCREDERE”. Faceți clic pe butonul "BINE".
  3. Se lansează fereastra de argumente pentru operatorul specificat.

    În câmp "Alfa", având în vedere că nivelul de încredere este de 97%, notăm numărul 0,03 . Pentru a doua oară nu ne vom opri asupra principiilor calculării acestui parametru.

    După aceasta, plasați cursorul în câmp "Deviație standard". De data aceasta, acest indicator ne este necunoscut și trebuie calculat. Acest lucru se face folosind o funcție specială - STDEV.V. Pentru a deschide fereastra acestui operator, faceți clic pe triunghiul din stânga barei de formule. Dacă nu găsim numele dorit în lista care se deschide, atunci mergeți la articol „Alte funcții...”.

  4. Începe Expertul de funcții. Trecerea la categorie "Statistic"și marcați numele în el „STDEV.B”. Apoi faceți clic pe butonul "BINE".
  5. Se deschide fereastra de argumente. Sarcina operatorului STDEV.V este de a determina abaterea standard a unei probe. Sintaxa sa arată astfel:

    DEVIARE STANDARD.B(număr1;număr2;…)

    Nu este greu de ghicit că argumentul "Număr" este adresa elementului de selecție. Dacă selecția este plasată într-o singură matrice, atunci puteți utiliza un singur argument pentru a furniza o legătură către acest interval.

    Plasați cursorul în câmp "Numărul 1"și, ca întotdeauna, ținând apăsat butonul stâng al mouse-ului, selectați colecția. După ce coordonatele sunt în câmp, nu vă grăbiți să apăsați butonul "BINE", deoarece rezultatul va fi incorect. Mai întâi trebuie să revenim la fereastra de argumente operator ADMINISTRATOR.STUDENT pentru a adăuga argumentul final. Pentru a face acest lucru, faceți clic pe numele corespunzător din bara de formule.

  6. Fereastra de argumente pentru funcția deja familiară se deschide din nou. Plasați cursorul în câmp "Mărimea". Din nou, faceți clic pe triunghiul cu care suntem deja familiarizați pentru a merge la selecția operatorilor. După cum înțelegeți, avem nevoie de un nume "VERIFICA". Deoarece am folosit această funcție în calculele din metoda anterioară, este prezentă în această listă, așa că faceți clic pe ea. Dacă nu îl găsiți, atunci urmați algoritmul descris în prima metodă.
  7. Odată ajuns în fereastra de argumente VERIFICA, plasați cursorul în câmp "Numărul 1"și cu butonul mouse-ului ținut apăsat, selectați colecția. Apoi faceți clic pe butonul "BINE".
  8. După aceasta, programul efectuează un calcul și afișează valoarea intervalului de încredere.
  9. Pentru a determina limitele, va trebui din nou să calculăm media eșantionului. Dar, având în vedere că algoritmul de calcul folosind formula IN MEDIE la fel ca în metoda anterioară și chiar și rezultatul nu s-a schimbat, nu ne vom opri asupra acestui lucru în detaliu a doua oară.
  10. Însumarea rezultatelor calculului IN MEDIEȘi ADMINISTRATOR.STUDENT, obținem limita dreaptă a intervalului de încredere.
  11. Scăzând din rezultatele de calcul ale operatorului IN MEDIE rezultatul calculului ADMINISTRATOR.STUDENT, avem limita din stânga a intervalului de încredere.
  12. Dacă calculul este scris într-o singură formulă, atunci calculul limitei drepte în cazul nostru va arăta astfel:

    MEDIE(B2:B13)+ÎNCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

  13. În consecință, formula pentru calcularea marginii din stânga va arăta astfel:

    MEDIE(B2:B13)-INCREDERE.STUDENT(0,03,STDEV.B(B2:B13),NUMĂR(B2:B13))

După cum puteți vedea, instrumentele Excel facilitează calcularea intervalului de încredere și a limitelor acestuia. În aceste scopuri, se folosesc operatori separați pentru eșantioanele a căror varianță este cunoscută și necunoscută.

CATEGORII

ARTICOLE POPULARE

2024 „kingad.ru” - examinarea cu ultrasunete a organelor umane