Stima dell'aspettativa matematica di una variabile casuale. Stime puntuali dell'aspettativa matematica

Sia presente una variabile casuale X con aspettativa matematica M e varianza D, mentre entrambi questi parametri sono sconosciuti. Sopra il valore X prodotto N esperimenti indipendenti, a seguito dei quali una serie di N risultati numerici x1, x2,..., xN. Come stima dell'aspettativa matematica è naturale proporre la media aritmetica dei valori osservati

(1)

Ecco come x io vengono considerati valori specifici (numeri) ottenuti come risultato N esperimenti. Se ne prendiamo altri (indipendenti dai precedenti) N esperimenti, ovviamente otterremo un valore diverso. Se ne prendi di più N esperimenti, otterremo un altro nuovo valore. Indichiamo con X i variabile casuale risultante da io esperimento, quindi le implementazioni X i saranno i numeri ottenuti da questi esperimenti. Ovviamente la variabile casuale X i avrà la stessa funzione di densità di probabilità della variabile casuale originale X. Riteniamo inoltre che le variabili casuali X i E Xj sono indipendenti quando io, non uguale J(vari esperimenti indipendenti l'uno dall'altro). Pertanto, riscriviamo la formula (1) in una forma diversa (statistica):

(2)

Mostriamo che la stima non è distorta:

Pertanto, l'aspettativa matematica della media campionaria è uguale alla vera aspettativa matematica della variabile casuale M. Questo è un fatto abbastanza prevedibile e comprensibile. Di conseguenza, la media campionaria (2) può essere considerata come una stima dell'aspettativa matematica di una variabile casuale. Ora sorge la domanda: cosa succede alla varianza della stima dell’aspettativa matematica all’aumentare del numero di esperimenti? I calcoli analitici lo dimostrano

dove è la varianza della stima dell'aspettativa matematica (2), e D- varianza vera della variabile casuale X.

Da quanto sopra segue che con l'aumento N(numero di esperimenti) la varianza della stima diminuisce, cioè Più sommiamo le realizzazioni indipendenti, più otteniamo una stima che si avvicina alle aspettative matematiche.


Stime della varianza matematica

A prima vista, la valutazione più naturale sembra essere

(3)

dove viene calcolato utilizzando la formula (2). Controlliamo se la stima è imparziale. La formula (3) può essere scritta come segue:

Sostituiamo l'espressione (2) in questa formula:

Troviamo l'aspettativa matematica della stima della varianza:

(4)

Poiché la varianza di una variabile casuale non dipende da quale sia l'aspettativa matematica della variabile casuale, prendiamo l'aspettativa matematica uguale a 0, cioè M = 0.

(5)
A .(6)

Sia presente una variabile casuale X, i cui parametri siano l'aspettativa matematica UN e la varianza sono sconosciute. Sono stati condotti N esperimenti indipendenti sul valore X, che hanno dato i risultati x 1, x 2, x n.

Senza ridurre la generalità del ragionamento, considereremo diversi questi valori della variabile casuale. Considereremo i valori x 1, x 2, x n come variabili casuali indipendenti, identicamente distribuite X 1, X 2, X n.

Il metodo più semplice di stima statistica - il metodo di sostituzione e analogia - consiste nel prendere la caratteristica corrispondente della distribuzione campionaria - la caratteristica del campione - come una stima dell'una o dell'altra caratteristica numerica (media, varianza, ecc.) della popolazione generale .

Utilizzo del metodo di sostituzione come stima dell'aspettativa matematica UN dobbiamo prendere l'aspettativa matematica della distribuzione campionaria: la media campionaria. Quindi, otteniamo

Verificare l’imparzialità e la coerenza della media campionaria come stima UN, consideriamo questa statistica in funzione del vettore scelto (X 1, X 2, X n). Tenendo conto che ciascuna delle quantità X 1, X 2, X n ha la stessa legge di distribuzione del valore X, concludiamo che le caratteristiche numeriche di queste quantità e del valore X sono le stesse: M(X io) = M(X) = UN, D(X io) = D(X) = , io = 1, 2, n , dove X i sono variabili casuali collettivamente indipendenti.

Quindi,

Da qui, per definizione, si ottiene che si tratta di una stima imparziale UN, e poiché D()®0 per n®¥, allora per il teorema del paragrafo precedente è una stima coerente dell'aspettativa matematica UN popolazione generale.

L'efficacia o l'inefficacia della stima dipende dal tipo di legge di distribuzione della variabile casuale X. Si può dimostrare che se il valore X è distribuito secondo una legge normale, allora la stima è efficace. Per altre leggi sulla distribuzione ciò potrebbe non essere il caso.

Una stima imparziale della varianza generale funge da varianza campionaria corretta

,

Perché , dove è la varianza generale. Veramente,

Anche la stima s – 2 per la varianza generale è valida, ma non è efficiente. Tuttavia, nel caso di una distribuzione normale, essa è “asintoticamente efficiente”, cioè all'aumentare di n, il rapporto tra la sua varianza e quella minima possibile si avvicina indefinitamente all'unità.

Quindi, se viene fornito un campione dalla distribuzione F( X) variabile casuale X con aspettativa matematica sconosciuta UN e dispersione, quindi per calcolare i valori di questi parametri abbiamo il diritto di utilizzare le seguenti formule approssimative:

UN ,

.

Qui x-i- - opzione di campionamento, n- i - - opzioni di frequenza x i, - - misura di prova.
Per calcolare la varianza campionaria corretta, la formula è più conveniente


.

Per semplificare il calcolo, è consigliabile passare alle opzioni condizionali (poiché è vantaggioso prendere la versione originale, situata al centro della serie di variazioni di intervallo). Poi

, .

Stima dell'intervallo

Sopra abbiamo considerato il problema della stima di un parametro sconosciuto UN un numero. Chiamiamo tali stime stime puntuali. Hanno lo svantaggio che con un campione di piccole dimensioni possono differire significativamente dai parametri stimati. Pertanto, per avere un'idea della vicinanza tra un parametro e la sua stima, nella statistica matematica vengono introdotte le cosiddette stime intervallari.

Sia trovata una stima puntuale q * nel campione per il parametro q. Di solito, ai ricercatori viene data in anticipo una probabilità g sufficientemente grande (ad esempio, 0,95, 0,99 o 0,999) tale che un evento con probabilità g possa essere considerato praticamente affidabile, e sollevano la questione di trovare un tale valore e > 0 per il quale

.

Modificando questa uguaglianza, otteniamo:

ed in questo caso diremo che l'intervallo ]q * - e; q * + e[ copre il parametro stimato q con probabilità g.

Intervallo ]q * -e; q * +e [ si chiama intervallo di confidenza .

Si chiama la probabilità g affidabilità (probabilità di confidenza) della stima intervallare.

Le estremità dell'intervallo di confidenza, ad es. si chiamano i punti q * -e e q * +e confini della fiducia .

Viene chiamato il numero e accuratezza della valutazione .

Come esempio del problema della determinazione dei limiti di confidenza, si consideri la questione della stima dell'aspettativa matematica di una variabile casuale X, che ha una legge di distribuzione normale con parametri UN e s, cioè X = N( UN, S). L'aspettativa matematica in questo caso è uguale a UN. Sulla base delle osservazioni X 1, X 2, X n, calcoliamo la media e valutazione dispersione 2.

Risulta che dai dati del campione è possibile costruire una variabile casuale

che ha una distribuzione di Student (o distribuzione t) con n = n -1 gradi di libertà.

Usiamo la Tabella A.1.3 e troviamo per una data probabilità g e un numero n il numero t g tale che la probabilità

P(|t(n)|< t g) = g,

.

Dopo aver apportato evidenti trasformazioni otteniamo,

La procedura per applicare il test F è la seguente:

1. Si presuppone che la distribuzione della popolazione sia normale. Ad un dato livello di significatività a, l'ipotesi nulla H 0: s x 2 = s y 2 è formulata sull'uguaglianza delle varianze generali delle popolazioni normali sotto l'ipotesi concorrente H 1: s x 2 > s y 2.

2. Si ottengono due campioni indipendenti dalle popolazioni X e Y di volume n x e n y, rispettivamente.

3. Calcolare i valori delle varianze campionarie corrette s x 2 e s y 2 (i metodi di calcolo sono discussi nel §13.4). La maggiore delle varianze (s x 2 o s y 2) è denominata s 1 2, la minore - s 2 2.

4. Il valore del criterio F viene calcolato utilizzando la formula F obs = s 1 2 / s 2 2.

5. Utilizzando la tabella dei punti critici della distribuzione di Fisher-Snedecor, a un dato livello di significatività a e il numero di gradi di libertà n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 è il numero di gradi di libertà della varianza corretta più grande), il punto critico si trova F cr (a, n 1, n 2).

Si noti che la Tabella A.1.7 mostra i valori critici del test F unilaterale. Pertanto, se si applica un criterio bilaterale (H 1: s x 2 ¹ s y 2), allora il punto critico di destra F cr (a/2, n 1, n 2) viene ricercato dal livello di significatività a/ 2 (metà del valore specificato) e il numero di potenze di libertà n 1 en 2 (n 1 è il numero di gradi di libertà di maggiore dispersione). Il punto critico di sinistra potrebbe non essere trovato.

6. Si giunge alla conclusione: se il valore calcolato del criterio F è maggiore o uguale al valore critico (F obs ³ F cr), allora le varianze differiscono significativamente a un dato livello di significatività. Altrimenti (F oss.< F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Problema 15.1. Il consumo di materie prime per unità di produzione utilizzando la vecchia tecnologia era:

Utilizzando la nuova tecnologia:

Assumendo che le corrispondenti popolazioni generali X e Y abbiano distribuzioni normali, verificare che in termini di variabilità, il consumo di materie prime per le nuove e vecchie tecnologie non differisce, se prendiamo il livello di significatività a = 0,1.

Soluzione. Procediamo nell'ordine sopra indicato.

1. Giudicheremo la variabilità del consumo di materie prime da parte di nuove e vecchie tecnologie in base ai valori di dispersione. Pertanto, l'ipotesi nulla ha la forma H 0: s x 2 = s y 2. Come ipotesi concorrente, accettiamo l'ipotesi H 1: s x 2 ¹ s y 2, poiché non siamo sicuri in anticipo che una delle varianze generali sia maggiore dell'altra.

2-3. Troviamo le varianze campionarie. Per semplificare i calcoli passiamo alle opzioni condizionali:

u io = x io - 307, v io = y io - 304.

Organizzeremo tutti i calcoli sotto forma delle seguenti tabelle:

tu io io e io io, io, io io io io 2 m io (u io +1) 2 v i no io n i v i n i v i 2 n io (v i +1) 2
-3 -3 -1 -2
å -
å -

Controllo: å m i u i 2 + 2å m i u i + m i = Controllo: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Troviamo le varianze campionarie corrette:

4. Confrontiamo le varianze. Troviamo il rapporto tra la varianza corretta maggiore e quella minore:

.

5. Per condizione, l'ipotesi concorrente ha la forma s x 2 ¹ s y 2, quindi la regione critica è bilaterale e quando si trova il punto critico, dovrebbero essere presi livelli di significatività pari alla metà del valore specificato.

Secondo la Tabella A.1.7, utilizzando il livello di significatività a/2 = 0,1/2 = 0,05 e il numero di gradi di libertà n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8, troviamo il punto critico F cr (0,05; 12; 8) = 3,28.

6. Dal F oss.< F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Sopra, durante il test delle ipotesi, abbiamo assunto la distribuzione normale delle variabili casuali in studio. Tuttavia, studi specifici hanno dimostrato che gli algoritmi proposti sono molto stabili (specialmente con campioni di grandi dimensioni) rispetto alle deviazioni dalla distribuzione normale.

Parametri e statistiche di distribuzione

Tutti i parametri della distribuzione di una variabile casuale, ad esempio, come l'aspettativa matematica o la varianza, sono quantità teoriche che non possono essere misurate direttamente, sebbene possano essere stimate. Rappresentano una caratteristica quantitativa popolazione e possono essere determinati solo durante la modellazione teorica come valori ipotetici, poiché descrivono le caratteristiche della distribuzione di una variabile casuale nella popolazione generale stessa. Per determinarli nella pratica, il ricercatore che conduce l'esperimento ne effettua una valutazione selettiva. Questa valutazione comporta un calcolo statistico.

Statistiche è una caratteristica quantitativa dei parametri studiati che caratterizzano la distribuzione di una variabile casuale ottenuta sulla base di uno studio dei valori campionari. Le statistiche vengono utilizzate per descrivere il campione stesso o, cosa di fondamentale importanza nella ricerca sperimentale fondamentale, per stimare i parametri della distribuzione di una variabile casuale nella popolazione studiata.

Separazione dei concetti "parametro" E "statistiche" è molto importante, poiché consente di evitare una serie di errori associati all'errata interpretazione dei dati ottenuti nell'esperimento. Il fatto è che quando stimiamo i parametri di distribuzione utilizzando dati statistici, otteniamo valori che sono solo fino a un certo punto vicini ai parametri stimati. C’è quasi sempre una certa differenza tra parametri e statistiche, e di solito non possiamo dire quanto sia grande questa differenza. Teoricamente, più grande è il campione, più i parametri stimati si avvicinano alle caratteristiche del campione. Tuttavia, ciò non significa che aumentando la dimensione del campione ci avvicineremo inevitabilmente al parametro stimato e ridurremo la differenza tra esso e le statistiche calcolate. In pratica, tutto può rivelarsi molto più complicato.

Se, in teoria, il valore atteso della statistica coincide con il parametro stimato, viene chiamata tale stima non spostato. Viene chiamata una stima in cui il valore atteso del parametro stimato differisce dal parametro stesso di un certo importo spostato.

È inoltre necessario distinguere tra stime puntuali e stime intervallari dei parametri di distribuzione. Macchiare ha chiamato una valutazione utilizzando un numero. Ad esempio, se diciamo che il valore della soglia spaziale della sensibilità tattile per un dato soggetto in determinate condizioni e su una data area della pelle è 21,8 mm, allora tale stima sarà esatta. Allo stesso modo, una stima puntuale avviene quando il bollettino meteorologico ci dice che fuori dalla finestra ci sono 25°C. Stima dell'intervallo implica l'uso di un insieme o di un intervallo di numeri in una valutazione. Valutando la soglia spaziale della sensibilità tattile, possiamo dire che era compresa tra 20 e 25 mm. Allo stesso modo, i meteorologi potrebbero riferire che, secondo le loro previsioni, la temperatura dell’aria nelle prossime 24 ore raggiungerà i 22–24°C. La stima intervallare di una variabile casuale ci consente non solo di determinare il valore desiderato di questa quantità, ma anche di impostare la possibile precisione di tale stima.

Aspettativa matematica e sua valutazione

Torniamo al nostro esperimento del lancio della moneta.

Proviamo a rispondere alla domanda: quante volte dovrebbe apparire "testa" se lanciamo una moneta dieci volte? La risposta sembra ovvia. Se le probabilità di ciascuno dei due risultati sono uguali, allora i risultati stessi devono essere equamente distribuiti. In altre parole, lanciando una moneta ordinaria dieci volte, possiamo aspettarci che uno dei suoi lati, ad esempio “testa”, cada esattamente cinque volte. Allo stesso modo, lanciando una moneta 100 volte, la "testa" dovrebbe apparire esattamente 50 volte, e se la moneta viene lanciata 4236 volte, il lato che ci interessa dovrebbe apparire 2118 volte, né più né meno.

Quindi, viene solitamente chiamato il significato teorico di un evento casuale aspettativa matematica. Il valore atteso può essere trovato moltiplicando la probabilità teorica della variabile casuale per il numero di prove. Più formalmente, però, si definisce momento centrale del primo ordine. Pertanto, l'aspettativa matematica è il valore di una variabile casuale a cui tende teoricamente durante test ripetuti, attorno alla quale varia.

È chiaro che il valore teorico dell'aspettativa matematica come parametro di distribuzione non è sempre uguale al valore empirico della variabile casuale di nostro interesse, espresso in statistica. Se facciamo un esperimento lanciando una moneta, allora è molto probabile che su dieci risultati "testa" esca solo quattro o tre volte, o forse, al contrario, uscirà otto volte, o forse non verrà mai fuori. È chiaro che alcuni di questi risultati risultano essere più probabili, altri meno probabili. Se usiamo la legge della distribuzione normale, possiamo giungere alla conclusione che quanto più il risultato si discosta dal valore teorico previsto specificato dal valore atteso matematico, tanto meno probabile è nella pratica.

Supponiamo inoltre di aver eseguito più volte una procedura simile e di non aver mai osservato il valore teoricamente atteso. Allora potremmo avere dei dubbi sull'autenticità della moneta. Possiamo supporre che per la nostra moneta la probabilità che esca testa non sia effettivamente del 50%. In questo caso, potrebbe essere necessario stimare la probabilità di questo evento e, di conseguenza, il valore dell'aspettativa matematica. Questa esigenza nasce ogni volta che in un esperimento studiamo la distribuzione di una variabile casuale continua, come il tempo di reazione, senza disporre di alcun modello teorico in anticipo. Di norma, questo è il primo passaggio obbligatorio nell'elaborazione quantitativa dei risultati sperimentali.

L'aspettativa matematica può essere stimata in tre modi, che in pratica possono dare risultati leggermente diversi, ma in teoria dovrebbero sicuramente condurci al valore dell'aspettativa matematica.

La logica di tale valutazione è illustrata in Fig. 1.2. Il valore atteso può essere considerato come la tendenza centrale nella distribuzione di una variabile casuale X, come valore più probabile e quindi più frequente e come punto che divide la distribuzione in due parti uguali.

Riso. 1.2.

Continuiamo i nostri esperimenti immaginari con una moneta e conduciamo tre esperimenti lanciandola dieci volte. Supponiamo che nel primo esperimento le "teste" siano apparse quattro volte, la stessa cosa è accaduta nel secondo esperimento, nel terzo esperimento le "teste" sono apparse più di una volta e mezza più spesso - sette volte. È logico supporre che l'aspettativa matematica dell'evento che ci interessa si trovi effettivamente da qualche parte tra questi valori.

Primo, più semplice metodo di valutazione l'aspettativa matematica sarà quella di trovare significato aritmetico. Quindi la stima del valore atteso basata sulle tre misurazioni precedenti sarà (4 + 4 + 7)/3 = 5. Allo stesso modo, negli esperimenti sul tempo di reazione, il valore atteso può essere stimato prendendo la media aritmetica di tutti i valori ottenuti X. Quindi, se spendessimo P misurazioni dei tempi di reazione X, allora possiamo usare la seguente formula, che ci mostra come calcolare la media aritmetica X è necessario sommare tutti i valori ottenuti empiricamente e dividerli per il numero di osservazioni:

Nella formula (1.2), la misura dell'aspettativa matematica è solitamente indicata come ̅ X (letto come "X con una barra"), anche se a volte può essere scritto come M (dall'inglese Significare - media).

La media aritmetica è la stima più comunemente utilizzata delle aspettative matematiche. In questi casi si presuppone che la variabile casuale venga misurata metrico scala. È chiaro che il risultato ottenuto può coincidere o meno con il vero valore dell'aspettativa matematica, cosa che non sappiamo mai. È importante, tuttavia, che questo metodo lo sia imparziale stima delle aspettative matematiche. Ciò significa che il valore atteso del valore stimato è pari alla sua aspettativa matematica: .

Secondo metodo di valutazione L'aspettativa matematica consiste nel prendere come valore il valore che ricorre più frequentemente della variabile di nostro interesse. Questo valore è chiamato modalità di distribuzione. Ad esempio, nel caso del lancio di una moneta appena considerato, si può assumere “quattro” come valore della speranza matematica, poiché nelle tre prove effettuate tale valore è comparso due volte; Ecco perché la modalità di distribuzione in questo caso si è rivelata pari a quattro. La stima modale viene utilizzata principalmente quando lo sperimentatore ha a che fare con variabili che assumono valori discreti specificati in non metrico scala.

Ad esempio, descrivendo la distribuzione dei voti degli studenti in un esame, è possibile costruire una distribuzione di frequenza dei voti ricevuti dagli studenti. Questa distribuzione di frequenza è chiamata istogramma. In questo caso, la stima più comune può essere presa come valore della tendenza centrale (aspettativa matematica). Quando si studiano variabili caratterizzate da valori continui, questa misura non viene praticamente utilizzata o viene utilizzata raramente. Se la distribuzione di frequenza dei risultati ottenuti viene comunque costruita, di norma non riguarda i valori ottenuti sperimentalmente della caratteristica studiata, ma alcuni intervalli della sua manifestazione. Ad esempio, studiando l'altezza delle persone, puoi vedere quante persone rientrano nell'intervallo fino a 150 cm di altezza, quante rientrano nell'intervallo tra 150 e 155 cm, ecc. In questo caso la modalità sarà correlata ai valori di intervallo della caratteristica studiata, in questo caso l'altezza.

È chiaro che la moda, come la media aritmetica, può coincidere o meno con il valore effettivo dell'aspettativa matematica. Ma proprio come la media aritmetica, la moda è una stima imparziale dell’aspettativa matematica.

Aggiungiamo che se due valori nel campione si verificano con la stessa frequenza, viene chiamata tale distribuzione bimodale. Se tre o più valori in un campione si verificano con la stessa frequenza, si dice che tale campione non ha moda. Tali casi, con un numero sufficientemente elevato di osservazioni, di norma indicano che i dati sono estratti da una popolazione generale, la cui natura della distribuzione differisce da quella normale.

Finalmente, terzo metodo di valutazione L'aspettativa matematica è quella di dividere il campione di soggetti secondo il parametro che ci interessa esattamente a metà. Viene chiamata la quantità che caratterizza questo confine mediano distribuzioni.

Supponiamo di essere presenti ad una gara di sci e al termine della stessa vogliamo valutare quale degli atleti ha mostrato risultati superiori alla media e quali inferiori. Se la composizione dei partecipanti è più o meno uniforme, quando si valuta il risultato medio è logico calcolare la media aritmetica. Supponiamo però che tra i partecipanti professionisti ci siano diversi dilettanti. Ce ne sono pochi, ma mostrano risultati significativamente inferiori agli altri. In questo caso può darsi che su 100 partecipanti al concorso, ad esempio, 87 abbiano mostrato risultati superiori alla media ed è chiaro che una tale valutazione della tendenza media non sempre può soddisfarci. In questo caso, è logico presumere che il risultato medio sia stato mostrato dai partecipanti che si sono piazzati al 50° o 51° posto. Questa sarà la mediana della distribuzione. Prima del 50esimo finalista sono finiti 49 partecipanti, dopo il 51esimo anche 49. Non è chiaro però quale risultato tra loro debba essere preso come media. Naturalmente, potrebbe risultare che abbiano finito nello stesso tempo. Allora non ci sono problemi. Il problema non si pone quando il numero di osservazioni è dispari. In altri casi, invece, è possibile utilizzare la media dei risultati di due partecipanti.

La mediana è un caso speciale del quantile di una distribuzione. Quantile fa parte della distribuzione. Formalmente può essere definito come il valore integrale della distribuzione tra due valori di una variabile X. Quindi, il valore X sarà la mediana della distribuzione se il valore integrale della distribuzione (densità di probabilità) è compreso tra -∞ e X uguale al valore integrale della distribuzione da X a +∞. Allo stesso modo, la distribuzione può essere divisa in quattro, dieci o cento parti. Tali quantili vengono chiamati di conseguenza quartili, decili E percentili. Esistono altri tipi di quantili.

Proprio come i due metodi precedenti per stimare l’aspettativa matematica, la mediana è una stima imparziale dell’aspettativa matematica.

In teoria, si presuppone che se abbiamo realmente a che fare con una distribuzione normale di una variabile casuale, allora tutte e tre le stime dell'aspettativa matematica dovrebbero dare lo stesso risultato, poiché rappresentano tutte una variante imparziale stime dello stesso parametro di distribuzione della variabile casuale stimata (vedi Fig. 1.2). In pratica, tuttavia, ciò accade raramente. Ciò può essere dovuto, in particolare, al fatto che la distribuzione analizzata differisce da quella normale. Ma la ragione principale di tali discrepanze, di regola, è che stimando il valore dell'aspettativa matematica, si può ottenere un valore che differisce in modo molto significativo dal suo valore reale. Tuttavia, come notato sopra, è stato dimostrato nella statistica matematica che più test indipendenti vengono eseguiti sulla variabile in esame, più il valore stimato dovrebbe essere vicino a quello vero.

Pertanto, in pratica, la scelta del metodo per stimare l'aspettativa matematica è determinata non dal desiderio di ottenere una stima più accurata e affidabile di questo parametro, ma solo da considerazioni di convenienza. Inoltre, un certo ruolo nella scelta del metodo per stimare l'aspettativa matematica è giocato dalla scala di misurazione, che riflette le osservazioni della variabile casuale valutata.

Si supponga che vengano condotti esperimenti indipendenti su una variabile casuale con aspettativa matematica e varianza sconosciute, che abbiano dato i risultati: . Calcoliamo stime coerenti e imparziali per i parametri e .

Come stima dell'aspettativa matematica, prendiamo la media aritmetica dei valori sperimentali

. (2.9.1)

Secondo la legge dei grandi numeri, questa stima è ricco , con valore per probabilità. La stessa stima è imparziale , perché il

. (2.9.2)

La varianza di questa stima è

. (2.9.3)

Si può dimostrare che per la legge di distribuzione normale questa stima è efficace . Per altre leggi questo potrebbe non essere il caso.

Stimiamo ora la varianza. Scegliamo innanzitutto per la stima la formula per varianza statistica

. (2.9.4)

Verifichiamo la coerenza della stima della varianza. Apriamo le parentesi nella formula (2.9.4)

.

Quando il primo termine converge in probabilità al valore , nel secondo - a. Pertanto, la nostra stima converge in probabilità alla varianza

,

quindi lo è ricco .

Controlliamo non spostato stime per quantità. Per fare ciò, sostituiamo l'espressione (2.9.1) nella formula (2.9.4) e teniamo conto che le variabili casuali indipendente

,

. (2.9.5)

Passiamo alla formula (2.9.5) alle fluttuazioni di variabili casuali

Aprendo le parentesi, otteniamo

,

. (2.9.6)

Calcoliamo l'aspettativa matematica di valore (2.9.6), tenendo conto di ciò

. (2.9.7)

La relazione (2.9.7) mostra che il valore calcolato utilizzando la formula (2.9.4) non è una stima imparziale per dispersione. La sua aspettativa matematica non è uguale, ma leggermente inferiore. Una tale valutazione porta ad un errore sistematico al ribasso. Per eliminare tale distorsione, è necessario introdurre una correzione moltiplicando il valore . Questa varianza statistica corretta può quindi fungere da stimatore imparziale della varianza

. (2.9.8)

Questa stima è valida quanto la stima, da quando il valore è .

In pratica, invece della stima (2.9.8), a volte è più conveniente utilizzare una stima equivalente associata al secondo momento statistico iniziale

. (2.9.9)

Le stime (2.9.8), (2.9.9) non sono efficaci. Si può dimostrare che nel caso di una legge di distribuzione normale lo saranno asintoticamente efficiente (a piacere tenderà al valore minimo possibile).

Pertanto, è possibile formulare le seguenti regole per l'elaborazione di materiale statistico di volume limitato. Se in esperimenti indipendenti la variabile casuale assume i valori con aspettativa matematica e dispersione sconosciute, per determinare questi parametri si dovrebbero utilizzare stime approssimative

(2.9.10)

Fine del lavoro -

Questo argomento appartiene alla sezione:

Dispense di matematica teoria della probabilità statistica matematica

Dipartimento di Matematica Superiore e Informatica.. Dispense delle lezioni.. in Matematica..

Se hai bisogno di materiale aggiuntivo su questo argomento, oppure non hai trovato quello che cercavi, ti consigliamo di utilizzare la ricerca nel nostro database delle opere:

Cosa faremo con il materiale ricevuto:

Se questo materiale ti è stato utile puoi salvarlo sulla tua pagina sui social network:

Tutti gli argomenti in questa sezione:

Teoria della probabilità
La teoria della probabilità è una branca della matematica in cui vengono studiati i modelli dei fenomeni di massa casuali. Un fenomeno che è casuale si chiama

Definizione statistica di probabilità
Un evento è un fenomeno casuale che può apparire o meno come risultato dell'esperienza (fenomeno ambiguo). Indicare gli eventi in lettere latine maiuscole

Spazio degli eventi elementari
Lascia che ci siano molti eventi associati a una certa esperienza e: 1) come risultato dell'esperienza appare una e una sola cosa

Azioni sugli eventi
La somma di due eventi e

Riarrangiamenti
Il numero di diverse permutazioni di elementi è indicato con

Posizionamenti
Posizionando gli elementi secondo

Combinazioni
Una combinazione di elementi

Formula per aggiungere probabilità per eventi incompatibili
Teorema. La probabilità della somma di due eventi incompatibili è uguale alla somma delle probabilità di questi eventi. (1

Formula per aggiungere probabilità per eventi arbitrari
Teorema. La probabilità della somma di due eventi è uguale alla somma delle probabilità di questi eventi senza la probabilità del loro prodotto.

Formula di moltiplicazione delle probabilità
Lascia che due eventi siano dati. Considera l'evento

Formula della probabilità totale
Sia un gruppo completo di eventi incompatibili; si chiamano ipotesi. Considera qualche evento

Formula della probabilità dell'ipotesi (Bayes)
Consideriamo ancora una volta l'insieme completo delle ipotesi incompatibili e dell'evento

Formula di Poisson asintotica
Nei casi in cui il numero di test è elevato e la probabilità che si verifichi un evento

Quantità discrete casuali
Una quantità casuale è una quantità che, quando si ripete l'esperimento, può assumere valori numerici disuguali. La variabile casuale è detta discreta,

Variabili casuali continue
Se, a seguito di un esperimento, una variabile casuale può assumere qualsiasi valore da un certo segmento o dall'intero asse reale, allora si dice continua. Legge

Funzione di densità di probabilità di una variabile casuale continua
Lascia stare. Consideriamo un punto e diamogli degli incrementi

Caratteristiche numeriche delle variabili casuali
Le variabili casuali discrete o continue sono considerate completamente specificate se le loro leggi di distribuzione sono note. Infatti, conoscendo le leggi della distribuzione, puoi sempre calcolare la probabilità di colpire

Quantili di variabili casuali
Quantile dell'ordine di una variabile casuale continua

Aspettativa matematica delle variabili casuali
L'aspettativa matematica di una variabile casuale caratterizza il suo valore medio. Tutti i valori della variabile casuale sono raggruppati attorno a questo valore. Consideriamo innanzitutto la variabile casuale discreta

Deviazione standard e dispersione di variabili aleatorie
Consideriamo innanzitutto una variabile casuale discreta. Modalità delle caratteristiche numeriche, mediana, quantili e aspettativa matematica

Momenti di variabili aleatorie
Oltre alle aspettative matematiche e alla dispersione, la teoria della probabilità utilizza caratteristiche numeriche di ordine superiore, chiamate momenti delle variabili casuali.

Teoremi sulle caratteristiche numeriche delle variabili aleatorie
Teorema 1. L'aspettativa matematica di un valore non casuale è uguale a questo valore stesso. Dimostrazione: Let

Legge di distribuzione binomiale

Legge di distribuzione di Poisson
Lascia che una variabile casuale discreta assuma i valori

Legge di distribuzione uniforme
La legge uniforme della distribuzione di una variabile continua casuale è la legge della funzione di densità di probabilità, che

Legge della distribuzione normale
La legge della distribuzione normale di una variabile casuale continua è la legge della funzione di densità

Legge di distribuzione esponenziale
La distribuzione esponenziale o esponenziale di una variabile casuale viene utilizzata in applicazioni della teoria della probabilità come la teoria delle code, la teoria dell'affidabilità

Sistemi di variabili casuali
In pratica, nelle applicazioni della teoria della probabilità, si incontrano spesso problemi in cui i risultati di un esperimento sono descritti non da una variabile casuale, ma da più variabili casuali contemporaneamente.

Sistema di due variabili casuali discrete
Due variabili casuali discrete formino un sistema. Valore casuale

Sistema di due variabili casuali continue
Sia ora il sistema formato da due variabili casuali continue. La legge di distribuzione di questo sistema è chiamata probabilmente

Leggi condizionali della distribuzione
Siano quantità continue casuali dipendenti

Caratteristiche numeriche di un sistema di due variabili aleatorie
Momento d'ordine iniziale di un sistema di variabili aleatorie

Sistema di più variabili casuali
I risultati ottenuti per un sistema di due variabili casuali possono essere generalizzati al caso di sistemi costituiti da un numero arbitrario di variabili casuali. Sia il sistema formato da un insieme

Legge della distribuzione normale per un sistema di due variabili aleatorie
Consideriamo un sistema di due variabili casuali continue. La legge di distribuzione di questo sistema è la legge di distribuzione normale

Teoremi limite della teoria della probabilità
L'obiettivo principale della teoria della probabilità è studiare i modelli dei fenomeni di massa casuali. La pratica mostra che l'osservazione di una massa di fenomeni casuali omogenei rivela

La disuguaglianza di Chebyshev
Consideriamo una variabile casuale con aspettativa matematica

Il teorema di Chebyshev
Se le variabili casuali sono indipendenti a coppie e hanno varianze finite e limitate collettivamente

Il teorema di Bernoulli
Con un aumento illimitato del numero di esperimenti, la frequenza con cui si verifica un evento converge in probabilità alla probabilità dell'evento

Teorema del limite centrale
Quando si aggiungono variabili casuali con qualsiasi legge di distribuzione, ma con varianze congiuntamente limitate, la legge di distribuzione

Principali problemi della statistica matematica
Le leggi della teoria della probabilità discusse sopra rappresentano un'espressione matematica di modelli reali che effettivamente esistono in vari fenomeni di massa casuale. Studiando

Una semplice popolazione statistica. Funzione di distribuzione statistica
Consideriamo una variabile casuale la cui legge di distribuzione è sconosciuta. Richiesto in base all'esperienza

Serie statistiche. grafico a barre
Con un gran numero di osservazioni (nell'ordine delle centinaia), la popolazione diventa scomoda e scomoda per la registrazione di materiale statistico. Per chiarezza e compattezza, materiale statistico

Caratteristiche numeriche della distribuzione statistica
Nella teoria della probabilità sono state considerate varie caratteristiche numeriche delle variabili casuali: aspettativa matematica, dispersione, momenti iniziali e centrali di vario ordine. Numeri simili

Scelta della distribuzione teorica mediante il metodo dei momenti
Qualsiasi distribuzione statistica contiene inevitabilmente elementi di casualità legati al numero limitato di osservazioni. Con un gran numero di osservazioni, questi elementi di casualità vengono attenuati,

Verifica della plausibilità dell'ipotesi sulla forma della legge di distribuzione
Supponiamo che una data distribuzione statistica sia approssimata da una curva teorica o

Criteri di consenso
Consideriamo uno dei criteri di bontà di adattamento più comunemente utilizzati: il cosiddetto criterio di Pearson. Indovinare

Stime puntuali per parametri di distribuzione sconosciuti
Alle pagg. 2.1. – 2.7 abbiamo esaminato in dettaglio come risolvere il primo e il secondo problema principale della statistica matematica. Questi sono i problemi legati alla determinazione delle leggi di distribuzione delle variabili casuali sulla base di dati sperimentali

Intervallo di confidenza. Probabilità di fiducia
In pratica, con un piccolo numero di esperimenti su una variabile casuale, si ottiene una sostituzione approssimata del parametro incognito

Lasciamo che il campione casuale sia generato dalla variabile casuale osservata ξ, dall'aspettativa matematica e dalla varianza che sono sconosciuti. È stato proposto di utilizzare la media campionaria come stima per queste caratteristiche

e la varianza del campione

. (3.14)

Consideriamo alcune proprietà delle stime delle aspettative matematiche e della dispersione.

1. Calcolare l'aspettativa matematica della media campionaria:

Pertanto, la media campionaria è uno stimatore imparziale per .

2. Ricordiamo che i risultati le osservazioni sono variabili casuali indipendenti, ciascuna delle quali ha la stessa legge di distribuzione del valore, il che significa , , . Supponiamo che la varianza sia finita. Allora, secondo il teorema di Chebyshev sulla legge dei grandi numeri, per ogni ε > 0 vale l’uguaglianza ,

che può essere scritto così: . (3.16) Confrontando la (3.16) con la definizione della proprietà di consistenza (3.11), vediamo che la stima è una stima coerente dell'aspettativa matematica.

3. Trova la varianza della media campionaria:

. (3.17)

Pertanto, la varianza della stima dell’aspettativa matematica diminuisce in proporzione inversa alla dimensione del campione.

Si può dimostrare che se la variabile casuale ξ è distribuita normalmente, allora la media campionaria è una stima efficace dell'aspettativa matematica, cioè la varianza assume il valore più piccolo rispetto a qualsiasi altra stima dell'aspettativa matematica. Per altre leggi di distribuzione ξ questo potrebbe non essere il caso.

La varianza campionaria è una stima distorta della varianza perché . (3.18)

Infatti, utilizzando le proprietà dell'aspettativa matematica e della formula (3.17), troviamo

.

Per ottenere una stima imparziale della varianza, la stima (3.14) deve essere corretta, cioè moltiplicata per . Quindi otteniamo la varianza campionaria imparziale

. (3.19)

Si noti che le formule (3.14) e (3.19) differiscono solo nel denominatore, e per valori grandi la varianza campionaria e quella imparziale differiscono poco. Tuttavia, con un campione di piccole dimensioni, è opportuno utilizzare la relazione (3.19).

Per stimare la deviazione standard di una variabile casuale si utilizza la cosiddetta deviazione standard “corretta”, che è pari alla radice quadrata della varianza imparziale: .

Stime di intervallo

In statistica esistono due approcci per stimare i parametri sconosciuti delle distribuzioni: punto e intervallo. In conformità con la stima puntuale, discussa nella sezione precedente, viene indicato solo il punto attorno al quale si trova il parametro stimato. È auspicabile, però, sapere quanto effettivamente questo parametro possa discostarsi dalle possibili realizzazioni delle stime in diverse serie di osservazioni.

La risposta a questa domanda, anch'essa approssimativa, è data da un altro metodo di stima dei parametri: l'intervallo. Secondo questo metodo di stima si trova un intervallo che, con probabilità prossima a uno, copre il valore numerico incognito del parametro.

Il concetto di stima intervallare

Stima del punto è una variabile casuale e per possibili implementazioni esemplificative assume valori solo approssimativamente uguali al valore vero del parametro. Minore è la differenza, più accurata sarà la stima. Quindi, un numero positivo per il quale , caratterizza l'accuratezza della stima e si chiama errore di stima (o errore marginale).

Probabilità di fiducia(o affidabilità) si chiama probabilità β , con cui si realizza la disuguaglianza , cioè.

. (3.20)

Sostituzione della disuguaglianza doppia disuguaglianza equivalente , O , noi abbiamo

Intervallo , coprendo con probabilità β viene chiamato , , parametro sconosciuto intervallo di confidenza (o stima intervallare), corrispondente probabilità di confidenza β .

Una variabile casuale non è solo una stima, ma anche un errore: il suo valore dipende dalla probabilità β e, di regola, dal campione. Pertanto, l’intervallo di confidenza è casuale e l’espressione (3.21) dovrebbe essere letta come segue: “L’intervallo coprirà il parametro con probabilità β ”, e non così: “Il parametro rientrerà nell'intervallo con probabilità β ”.

Il significato dell'intervallo di confidenza è quello quando si ripete un volume campione molte volte in una proporzione relativa di casi pari a β , intervallo di confidenza corrispondente alla probabilità di confidenza β , copre il valore reale del parametro stimato. Quindi, la probabilità di confidenza β caratterizza affidabilità valutazione della fiducia: di più β , tanto più è probabile che l'implementazione dell'intervallo di confidenza contenga un parametro sconosciuto.

CATEGORIE

ARTICOLI POPOLARI

2023 “kingad.ru” - esame ecografico di organi umani