Mediana dei dati del campione. Funzione mediana in Excel per eseguire analisi statistiche

Insieme ai valori medi, le medie strutturali vengono calcolate come caratteristiche statistiche delle serie di variazioni delle distribuzioni - moda E mediano.
Moda(Mo) rappresenta il valore della caratteristica oggetto di studio, ripetuta con la maggiore frequenza, cioè modalità – il valore di una caratteristica che si verifica più spesso.
Mediano(Me) è il valore dell'attributo che rientra nel mezzo della popolazione classificata (ordinata), ovvero la mediana è il valore centrale di una serie di variazioni.
La proprietà principale della mediana è che la somma delle deviazioni assolute dei valori degli attributi dalla mediana è inferiore a quella di qualsiasi altro valore ∑|x i - Me|=min.

Determinazione della modalità e della mediana da dati non raggruppati

Consideriamo determinazione della moda e della mediana da dati non raggruppati. Supponiamo che un gruppo di lavoro composto da 9 persone abbia le seguenti categorie tariffarie: 4 3 4 5 3 3 6 2 6. Poiché questa brigata ha il maggior numero di lavoratori della 3a categoria, questa categoria tariffaria sarà modale. Mo = 3.
Per determinare la mediana è necessario effettuare una classifica: 2 3 3 3 4 4 5 6 6 . Il lavoratore centrale di questa serie è un lavoratore della 4a categoria, quindi questa categoria sarà la mediana. Se la serie classificata comprende un numero pari di unità, la mediana è definita come la media dei due valori centrali.
Se la moda riflette la variante più comune del valore dell'attributo, allora la mediana svolge praticamente le funzioni della media per una popolazione eterogenea che non obbedisce alla normale legge di distribuzione. Illustriamo il suo significato cognitivo con il seguente esempio.
Diciamo che dobbiamo caratterizzare il reddito medio di un gruppo di persone composto da 100 persone, 99 delle quali hanno un reddito compreso tra 100 e 200 dollari al mese, e il reddito mensile di questi ultimi è di 50.000 dollari (Tabella 1).
Tabella 1 - Reddito mensile del gruppo di persone studiato. Se usiamo la media aritmetica, otteniamo un reddito medio di circa 600-700 dollari, che ha poco in comune con il reddito della maggior parte del gruppo. La mediana, pari in questo caso a Me = 163 dollari, ci permetterà di dare una descrizione oggettiva del livello di reddito del 99% di questo gruppo di persone.
Consideriamo di determinare la moda e la mediana utilizzando dati raggruppati (serie di distribuzione).
Supponiamo che la distribuzione dei lavoratori dell'intera impresa per categoria tariffaria abbia la seguente forma (Tabella 2).
Tabella 2 - Distribuzione dei lavoratori dell'impresa per categoria tariffaria

Calcolo della moda e della mediana per una serie discreta

Calcolo della moda e della mediana per una serie di intervalli

Calcolo della moda e della mediana per una serie di variazioni

Determinazione della moda da una serie di variazioni discrete

Viene utilizzata una serie di valori di attributo precedentemente costruita, ordinati per valore. Se la dimensione del campione è dispari, prendiamo il valore centrale; se la dimensione del campione è pari, prendiamo la media aritmetica dei due valori centrali.
Determinazione della moda da una serie di variazioni discrete: la 5° categoria tariffaria ha la frequenza più alta (60 persone), quindi è modale. Mo = 5.
Per determinare il valore mediano di una caratteristica, il numero dell'unità mediana della serie (N Me) si trova utilizzando la seguente formula: , dove n è il volume della popolazione.
Nel nostro caso: .
Il valore frazionario risultante, che si verifica sempre quando il numero di unità della popolazione è pari, indica che il punto medio esatto si trova tra 95 e 96 lavoratori. È necessario determinare a quale gruppo appartengono i lavoratori con questi numeri di serie. Questo può essere fatto calcolando le frequenze accumulate. Non ci sono lavoratori con questi numeri nel primo gruppo, dove ci sono solo 12 persone, e non ce ne sono nel secondo gruppo (12+48=60). I lavoratori 95° e 96° appartengono al terzo gruppo (12+48+56=116), quindi la mediana è la 4° categoria tariffaria.

Calcolo della moda e della mediana nelle serie di intervalli

A differenza delle serie a variazioni discrete, la determinazione della moda e della mediana dalle serie di intervalli richiede determinati calcoli basati sulle seguenti formule:
, (5.6)
Dove x0– il limite inferiore dell’intervallo modale (l’intervallo con la frequenza più alta è detto modale);
ioè il valore dell'intervallo modale;
f Moè la frequenza dell'intervallo modale;
f Mo -1è la frequenza dell'intervallo che precede il modale;
f Mo +1è la frequenza dell'intervallo successivo al modale.
(5.7)
Dove x0– il limite inferiore dell'intervallo mediano (la mediana è il primo intervallo la cui frequenza cumulata supera la metà della somma totale delle frequenze);
ioè il valore dell'intervallo mediano;
S Io -1- intervallo accumulato precedente la mediana;
f Io– frequenza dell'intervallo mediano.
Illustriamo l'applicazione di queste formule utilizzando i dati della tabella. 3.
L'intervallo con i limiti 60 – 80 in questa distribuzione sarà modale, perché ha la frequenza più alta. Utilizzando la formula (5.6), definiamo la modalità:

Per stabilire l'intervallo mediano è necessario determinare la frequenza accumulata di ogni intervallo successivo fino a quando non supera la metà della somma delle frequenze accumulate (nel nostro caso il 50%) (Tabella 5.11).
È stato stabilito che la mediana è l'intervallo con limiti di 100-120 mila rubli. Definiamo ora la mediana:

Tabella 3 - Distribuzione della popolazione della Federazione Russa per livello di reddito monetario nominale medio pro capite nel marzo 1994.
Gruppi per livello di reddito mensile medio pro capite, migliaia di rubli.Quota della popolazione,%
Fino a 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Oltre 3007,7
Totale100,0

Tabella 4 – Determinazione dell'intervallo mediano
Pertanto, la media aritmetica, la modalità e la mediana possono essere utilizzate come caratteristica generalizzata dei valori di un determinato attributo per unità di una popolazione classificata.
La caratteristica principale del centro di distribuzione è la media aritmetica, che è caratterizzata dal fatto che tutte le deviazioni da essa (positive e negative) si sommano a zero. La mediana è caratterizzata dal fatto che la somma delle deviazioni da essa in modulo è minima e la moda è il valore dell'attributo che si verifica più frequentemente.
Il rapporto tra moda, mediana e media aritmetica indica la natura della distribuzione della caratteristica nell'aggregato e ci consente di valutarne l'asimmetria. Nelle distribuzioni simmetriche, tutte e tre le caratteristiche coincidono. Quanto maggiore è la discrepanza tra la moda e la media aritmetica, tanto più asimmetrica è la serie. Per le serie moderatamente asimmetriche, la differenza tra la moda e la media aritmetica è circa tre volte maggiore della differenza tra mediana e media, ovvero:
|Mo –`x| = 3 |Io –`x|.

Determinazione della moda e della mediana mediante metodo grafico

La moda e la mediana in una serie di intervalli possono essere determinate graficamente. La modalità è determinata dall'istogramma di distribuzione. Per fare ciò, seleziona il rettangolo più alto, che in questo caso è modale. Quindi colleghiamo il vertice destro del rettangolo modale all'angolo in alto a destra del rettangolo precedente. E il vertice sinistro del rettangolo modale - con l'angolo superiore sinistro del rettangolo successivo. Dal punto della loro intersezione abbassiamo la perpendicolare all'asse delle ascisse. L'ascissa del punto di intersezione di queste linee sarà la modalità di distribuzione (Fig. 5.3).


Riso. 5.3. Determinazione grafica della modalità mediante un istogramma.


Riso. 5.4. Determinazione grafica della mediana mediante cumulo
Per determinare la mediana a partire da un punto della scala delle frequenze accumulate (frequenze) corrispondente al 50%, si traccia una linea retta parallela all'asse delle ascisse fino ad intersecare il cumulato. Quindi, dal punto di intersezione, si abbassa una perpendicolare all'asse x. L'ascissa del punto di intersezione è la mediana.

Quartili, decili, percentili

Allo stesso modo, trovando la mediana nelle serie di variazioni della distribuzione, puoi trovare il valore dell'attributo per qualsiasi unità della serie classificata. Quindi, ad esempio, puoi trovare il valore dell'attributo per le unità che dividono una serie in quattro parti uguali, in 10 o 100 parti. Questi valori sono chiamati “quartili”, “decili”, “percentili”.
I quartili rappresentano il valore di una caratteristica che divide la popolazione classificata in 4 parti uguali.
Esiste un quartile inferiore (Q 1), che separa ¼ della popolazione con i valori più bassi dell'attributo, e un quartile superiore (Q 3), che separa ¼ della parte con i valori più alti dell'attributo. Ciò significa che il 25% delle unità della popolazione avrà un valore Q 1 inferiore; Il 25% delle unità sarà contenuto tra Q 1 e Q 2 ; Il 25% è compreso tra Q 2 e Q 3 e il restante 25% supera Q 3. Il quartile medio di Q2 è la mediana.
Per calcolare i quartili utilizzando una serie di variazioni di intervalli, vengono utilizzate le seguenti formule:
, ,
Dove xQ1– il limite inferiore dell'intervallo contenente il quartile inferiore (l'intervallo è determinato dalla frequenza accumulata, la prima superiore al 25%);
xQ3– il limite inferiore dell'intervallo contenente il quartile superiore (l'intervallo è determinato dalla frequenza accumulata, la prima superiore al 75%);
io– dimensione dell'intervallo;
SQ 1-1– frequenza cumulativa dell'intervallo che precede l'intervallo contenente il quartile inferiore;
SQ 3-1– frequenza cumulativa dell'intervallo che precede l'intervallo contenente il quartile superiore;
fQ1– frequenza dell'intervallo contenente il quartile inferiore;
fQ3– frequenza dell'intervallo contenente il quartile superiore.
Consideriamo il calcolo dei quartili inferiore e superiore secondo i dati in tabella. 5.10. Il quartile inferiore è compreso tra 60 e 80, la cui frequenza cumulativa è del 33,5%. Il quartile superiore si trova nell'intervallo 160 – 180 con una frequenza cumulativa del 75,8%. Tenendo conto di ciò otteniamo:
,
.
Oltre ai quartili, è possibile determinare i decili negli intervalli di variazione della distribuzione, opzioni che dividono la serie di variazioni classificate in dieci parti uguali. Il primo decile (d 1) divide la popolazione nel rapporto da 1/10 a 9/10, il secondo decile (d 1) - nel rapporto da 2/10 a 8/10, ecc.
Si calcolano utilizzando le formule:
, .
I valori caratteristici che dividono la serie in cento parti sono detti percentili. I rapporti tra mediane, quartili, decili e percentili sono presentati in Fig. 5.5.

Salari in vari settori dell'economia, temperatura e livelli di precipitazione nello stesso territorio per periodi di tempo comparabili, resa dei raccolti coltivati ​​in diverse regioni geografiche, ecc. Tuttavia, la media non è affatto l'unico indicatore generalizzante - in alcuni casi per una valutazione più accurata un valore adeguato è la mediana. Nelle statistiche, è ampiamente utilizzato come caratteristica descrittiva ausiliaria della distribuzione di una caratteristica in una particolare popolazione. Scopriamo in cosa differisce da quello medio e anche perché è necessario utilizzarlo.

Mediana in statistica: definizione e proprietà

Immagina la seguente situazione: 10 persone lavorano in un'azienda insieme al direttore. I lavoratori ordinari ricevono 1.000 UAH e il loro manager, che è anche il proprietario, riceve 10.000 UAH. Se calcoliamo la media aritmetica, risulta che lo stipendio medio in questa impresa è di 1900 UAH. Questa affermazione sarà vera? Oppure prendiamo questo esempio: nello stesso reparto ospedaliero ci sono nove persone con una temperatura di 36,6 °C e una persona con una temperatura di 41 °C. La media aritmetica in questo caso è pari a: (36,6*9+41)/10 = 37,04 °C. Ma questo non significa che tutti i presenti siano malati. Tutto ciò suggerisce che la media da sola spesso non è sufficiente, ed è per questo che ad essa viene utilizzata in aggiunta la mediana. In statistica, questo indicatore è chiamato l'opzione che si trova esattamente al centro della serie di variazioni ordinate. Se lo calcoliamo per i nostri esempi, otteniamo rispettivamente 1000 UAH. e 36,6 °C. In altre parole, una mediana in statistica è un valore che divide una serie a metà in modo tale che su entrambi i lati di essa (verso il basso o verso l'alto) ci sia lo stesso numero di unità in una data popolazione. A causa di questa proprietà, questo indicatore ha molti altri nomi: 50° percentile o 0,5 quantile.

Come trovare la mediana nelle statistiche

Il metodo per calcolare questo valore dipende in gran parte dal tipo di serie di variazioni che abbiamo: discrete o intervallate. Nel primo caso la mediana si trova semplicemente nelle statistiche. Tutto quello che devi fare è trovare la somma delle frequenze, dividerla per 2 e poi aggiungere ½ al risultato. Sarebbe meglio spiegare il principio di calcolo utilizzando il seguente esempio. Diciamo che abbiamo raggruppato i dati sulla fertilità e vogliamo scoprire qual è la mediana.

Numero del gruppo familiare per numero di figli

Numero di famiglie

Dopo alcuni semplici calcoli, troviamo che l'indicatore richiesto è: 195/2 + ½ = opzione. Per scoprire cosa significa, dovresti accumulare in sequenza le frequenze, iniziando con le opzioni più piccole. Quindi, la somma delle prime due righe ci dà 30. È chiaro che qui non ci sono 98 opzioni. Ma se al risultato aggiungiamo la frequenza della terza opzione (70), otteniamo una somma pari a 100. Contiene esattamente la 98a opzione, il che significa che la mediana sarà una famiglia con due figli.

Per quanto riguarda le serie di intervalli, solitamente viene utilizzata la seguente formula:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me, in cui:

  • X Me - il primo valore dell'intervallo mediano;
  • ∑f - numero di serie (somma delle sue frequenze);
  • i Ме - il valore dell'intervallo mediano;
  • f Me - frequenza dell'intervallo mediano;
  • S Ме-1 è la somma delle frequenze cumulative negli intervalli che precedono la mediana.

Ancora una volta, è abbastanza difficile da capire senza un esempio. Supponiamo che ci siano dati sul valore

Stipendio, mille rubli.

Frequenze accumulate

Per utilizzare la formula sopra, dobbiamo prima determinare l'intervallo mediano. Come intervallo, scegliere quello la cui frequenza accumulata supera la metà della somma totale delle frequenze o è uguale ad essa. Quindi, dividendo 510 per 2, troviamo che questo criterio corrisponde all'intervallo con un valore salariale di 250.000 rubli. fino a 300.000 rubli. Ora puoi sostituire tutti i dati nella formula:

M e = X Me + i Me * (∑f/2 - S Me-1)/f Me = 250 + 50 * (510/2 - 170) / 115 = 286,96 mila rubli.

Ci auguriamo che il nostro articolo ti sia stato utile e che ora tu abbia una chiara comprensione di cosa sia una mediana nelle statistiche e di come dovrebbe essere calcolata.

Per calcolare la mediana in MS EXCEL esiste una funzione speciale MEDIANA(). In questo articolo definiremo la mediana e impareremo come calcolarla per un campione e per una data legge di distribuzione di una variabile casuale.

Iniziamo con mediane Per campioni(cioè per un insieme fisso di valori).

Mediana del campione

Mediano(mediana) è un numero che si trova al centro di un insieme di numeri: la metà dei numeri dell'insieme è maggiore di mediano e metà dei numeri sono inferiori a mediano.

Calcolare mediane necessario prima (valori in campione). Per esempio, mediano per il campione (2; 3; 3; 4 ; 5; 7; 10) sarà 4. Perché appena dentro campione 7 valori, tre dei quali sono inferiori a 4 (ovvero 2; 3; 3) e tre valori sono maggiori (ovvero 5; 7; 10).

Se l'insieme contiene un numero pari di numeri, viene calcolato per i due numeri al centro dell'insieme. Per esempio, mediano per il campione (2; 3; 3 ; 6 ; 7; 10) sarà 4,5, perché (3+6)/2=4,5.

Per determinare mediane in MS EXCEL esiste una funzione con lo stesso nome MEDIAN() , la versione inglese di MEDIAN().

Mediano non corrisponde necessariamente. Una corrispondenza si verifica solo se i valori presenti nel campione sono distribuiti simmetricamente rispetto a media. Ad esempio, per campioni (1; 2; 3 ; 4 ; 5; 6) mediano E media pari a 3,5.

Se noto Funzione di distribuzione F(x) o densità di probabilità P(X), Quello mediano si può ricavare dall'equazione:

Ad esempio, avendo risolto analiticamente questa equazione per la distribuzione lognormale lnN(μ; σ 2), otteniamo che medianoè calcolato dalla formula =EXP(μ). Quando μ=0, la mediana è 1.

Presta attenzione al punto Funzioni di distribuzione, per cui F(x)=0,5(vedi foto sopra) . L'ascissa di questo punto è uguale a 1. Questo è il valore della mediana, che naturalmente coincide con il valore precedentemente calcolato utilizzando la formula em.

In MS EXCEL mediano Per distribuzione lognormale LnN(0;1) può essere calcolato utilizzando la formula =LOGNORM.REV(0.5,0,1).

Nota: Ricordiamo che l'integrale di nell'intero dominio di specificazione della variabile casuale è uguale a uno.

Pertanto, la linea mediana (x=Mediana) divide l'area sotto il grafico funzioni di densità di probabilità in due parti uguali.

A causa del fatto che il ricercatore non dispone di dati sul volume delle vendite presso ciascun ufficio di cambio, non è pratico calcolare la media aritmetica per determinare il prezzo medio per dollaro.

Mediana di una serie di numeri

Tuttavia, è possibile determinare il valore dell'attributo, chiamato mediana (Me). Mediano

nel nostro esempio

Numero mediano: NoMe = ;

Moda

Tabella 3.6.

F— somma delle frequenze della serie;

S frequenze cumulative

12_

_

S: frequenze accumulate.

Nella fig. 3.2. Viene mostrato un istogramma della distribuzione delle banche in base al margine di profitto (secondo la Tabella 3.6.).

x - importo del profitto, milioni di rubli,

f è il numero di banche.

"MEDIANA DELLE SERIE ORDINATE"

Testo Versione HTML della pubblicazione


Appunti delle lezioni di algebra in seconda media

Argomento della lezione: “MEDIANA DI UNA SERIE ORDINATA”.

insegnante della scuola Ozyornaya, filiale della scuola secondaria MCOU Burkovskaya Eremenko Tatyana Alekseevna
Obiettivi:
il concetto di mediana come caratteristica statistica di una serie ordinata; sviluppare la capacità di trovare la mediana per serie ordinate con un numero pari e dispari di termini; sviluppare la capacità di interpretare i valori della mediana a seconda della situazione pratica, consolidare il concetto di media aritmetica di un insieme di numeri. Sviluppare capacità lavorative indipendenti. Sviluppare un interesse per la matematica.
Durante le lezioni

Lavoro orale.
Le righe sono date: 1) 4; 1; 8; 5; 1; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; 4; 6; 7.3; 6. Trova: a) i valori più grandi e più piccoli di ciascuna serie; b) l'ambito di ciascuna riga; c) la modalità di ciascuna riga.
II. Spiegazione del nuovo materiale.
Lavora secondo il libro di testo. 1. Consideriamo il problema dal paragrafo 10 del libro di testo. Cosa significa serie ordinata? Ci tengo a sottolineare che prima di trovare la mediana bisogna sempre ordinare le serie di dati. 2. Alla lavagna conosciamo le regole per trovare la mediana per le serie con un numero pari e dispari di termini:
Mediano

ordinato

riga
numeri
Con

strano

numero

membri

è il numero scritto al centro, e
mediano

serie ordinate
numeri
con un numero pari di membri
si chiama media aritmetica di due numeri scritti al centro.
Mediano

arbitrario

riga
è detta mediana 1 3 1 7 5 4 della corrispondente serie ordinata.
Faccio notare che gli indicatori sono la media aritmetica, la moda e la mediana secondo

diversamente

caratterizzare

dati,

ricevuto

risultato

osservazioni.

III. Formazione di competenze e abilità.
1° gruppo. Esercizi sull'applicazione di formule per trovare la mediana di una serie ordinata e non ordinata. 1.
№ 186.
Soluzione: a) Numero di membri della serie P= 9; mediano Mah= 41; B) P= 7, la riga è ordinata, Mah= 207; V) P= 6, la riga è ordinata, Mah= = 21; G) P= 8, la riga è ordinata, Mah= = 2,9. Risposta: a) 41; b) 207; alle 21; d) 2.9. Gli studenti commentano come trovare la mediana. 2. Trova la media aritmetica e la mediana di una serie di numeri: a) 27, 29, 23, 31, 21, 34; V); 1.b) 56, 58, 64, 66, 62, 74. Soluzione: Per trovare la mediana è necessario ordinare ciascuna riga: a) 21, 23, 27, 29, 31, 34. P = 6; X = = 27,5; Mah= = 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Come trovare la mediana nelle statistiche

P = 6; X = 63,3; Mah= = 63; V); 1. P = 5; X = : 5 = 3: 5 = 0,6; Mah = . 3.
№ 188
(per via orale). Risposta: sì; b) no; c) no; d) sì. 4. Sapere che la serie ordinata contiene T numeri, dove Tè un numero dispari, indicare il numero del termine che è la mediana se T equivale a: a) 5; b) 17; c) 47; d) 201. Risposta: a) 3; b) 9; c)24; d) 101. 2° gruppo. Attività pratiche sulla ricerca della mediana della serie corrispondente e sull'interpretazione del risultato ottenuto. 1.
№ 189.
Soluzione: Numero di membri della riga P= 12. Per trovare la mediana è necessario ordinare la serie: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Mediana della serie Mah= = 176. La produzione mensile era maggiore della mediana per i seguenti membri dell'artel: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125 ; ; ; 3636 1125 12456 18 1:5:5 6336 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 22 xx+ + = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rilov; 3) Antonov; 6) Astafiev. Risposta: 176. 2.
№ 192.
Soluzione: Ordiniamo le serie di dati: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; numero di membri della riga P= 20. Altalena UN = X massimo – X min = 42 – 30 = 12. Moda Mo= 32 (questo valore si verifica 6 volte, più spesso di altri). Mediano Mah= = 35. In questo caso l'intervallo mostra la variazione maggiore nel tempo di lavorazione del pezzo; la modalità mostra il valore del tempo di elaborazione più tipico; mediano – tempo di lavorazione, che non è stato superato dalla metà dei tornitori. Risposta: 12; 32; 35.
IV. Riepilogo della lezione.
– Come si chiama la mediana di una serie di numeri? – Può la mediana di una serie di numeri non coincidere con nessuno dei numeri della serie? – Quale numero è la mediana di una serie ordinata contenente 2 P numeri? 2 P– 1 numeri? – Come trovare la mediana di una serie non ordinata?
Compiti a casa:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

Alla sezione istruzione generale di base

Moda e mediana

I valori medi includono anche moda e mediana.

La mediana e la moda sono spesso utilizzate come caratteristiche medie in quelle popolazioni dove il calcolo della media (aritmetica, armonica, ecc.) è impossibile o poco pratico.

Ad esempio, un sondaggio campione condotto su 12 uffici di cambio valuta commerciali a Omsk ha permesso di registrare prezzi diversi per il dollaro al momento della vendita (dati al 10 ottobre 1995 al tasso di cambio del dollaro -4493 rubli).

A causa del fatto che il ricercatore non dispone di dati sul volume delle vendite presso ciascun ufficio di cambio, non è pratico calcolare la media aritmetica per determinare il prezzo medio per dollaro. Tuttavia, è possibile determinare il valore dell'attributo, chiamato mediana (Me). Mediano si trova al centro della riga classificata e la divide a metà.

Il calcolo della mediana per i dati non raggruppati è il seguente:

a) disporre i singoli valori della caratteristica in ordine crescente:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) determinare il numero ordinale della mediana utilizzando la formula:

nel nostro esempio ciò significa che la mediana in questo caso si trova tra il sesto e il settimo valore dell'attributo nella serie classificata, poiché la serie ha un numero pari di valori individuali. Quindi Me è uguale alla media aritmetica dei valori vicini: 4550, 4560.

c) considerare la procedura per il calcolo della mediana nel caso di un numero dispari di valori individuali.

Supponiamo di osservare non 12, ma 11 punti di cambio valuta, quindi la serie classificata sarà simile a questa (scartare il 12° punto):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Numero mediano: NoMe = ;

al sesto posto c'è = 4560, che è la mediana: Me = 4560. Su entrambi i lati ci sono lo stesso numero di punti.

Moda— questo è il valore più comune di una caratteristica tra le unità di una data popolazione. Corrisponde a un valore di attributo specifico.

Nel nostro caso, il prezzo modale per dollaro può essere chiamato 4560 rubli: questo valore viene ripetuto 4 volte, più spesso di tutti gli altri.

In pratica, la moda e la mediana vengono solitamente trovate utilizzando dati raggruppati. Come risultato del raggruppamento, è stata ottenuta una serie di distribuzioni delle banche in base all'importo dell'utile ricevuto per l'anno (Tabella 3.6.).

Tabella 3.6.

Raggruppamento di banche in base all'importo dell'utile ricevuto per l'anno

Per determinare la mediana, è necessario calcolare la somma delle frequenze cumulative. L'aumento totale continua fino a quando la somma cumulativa delle frequenze supera la metà della somma delle frequenze. Nel nostro esempio, la somma delle frequenze accumulate (12) supera la metà di tutti i valori (20:2). Questo valore corrisponde all'intervallo mediano, che contiene la mediana (5,5 - 6,4). Determiniamo il suo valore utilizzando la formula:

dove è il valore iniziale dell'intervallo contenente la mediana;

— il valore dell'intervallo mediano;

F— somma delle frequenze della serie;

— la somma delle frequenze cumulative che precedono l'intervallo mediano;

— frequenza dell'intervallo medio.

Pertanto, il 50% delle banche ha un utile di 6,1 milioni di rubli e il 50% delle banche ha un utile di oltre 6,1 milioni di rubli.

La frequenza più alta corrisponde anche all'intervallo 5,5 - 6,4, cioè la modalità deve essere in questo intervallo. Determiniamo il suo valore utilizzando la formula:

dove è il valore iniziale dell'intervallo contenente la modalità;

— il valore dell'intervallo modale;

— frequenza dell'intervallo modale;

— frequenza dell'intervallo che precede quello modale;

— frequenza dell'intervallo successivo a quello modale.

La formula della modalità data può essere utilizzata in serie di variazioni con intervalli uguali.

Pertanto, in questa popolazione, l'entità del profitto più comune è di 6,10 milioni di rubli.

Mediana e moda possono essere determinate graficamente. La mediana è determinata dal cumulo (Fig. 3.1.). Per costruirlo è necessario calcolare le frequenze e le frequenze cumulative. Le frequenze cumulative mostrano quante unità di popolazione hanno valori di attributo non superiori al valore in esame e sono determinate dalla somma sequenziale delle frequenze degli intervalli. Quando si costruisce una serie di distribuzioni di intervalli cumulativi, il limite inferiore del primo intervallo corrisponde a una frequenza pari a zero e il limite superiore corrisponde all'intera frequenza di un dato intervallo. Il limite superiore del secondo intervallo corrisponde ad una frequenza cumulativa pari alla somma delle frequenze dei primi due intervalli, ecc.

Costruiamo una curva cumulativa secondo la tabella. 6 sulla distribuzione degli utili delle banche.

S frequenze cumulative

12_

_

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 Х profitto

Riso. 3.1. La distribuzione cumulativa delle banche per profitto:

x - importo del profitto, milioni di rubli,

S: frequenze accumulate.

Per determinare la mediana, l'altezza dell'ordinata maggiore, che corrisponde alla dimensione totale della popolazione, viene divisa a metà. Attraverso il punto risultante viene tracciata una linea retta, parallela all'asse delle ascisse, fino ad intersecare il cumulo. L'ascissa del punto di intersezione è la mediana.

La modalità è determinata dall'istogramma di distribuzione. L'istogramma è costruito in questo modo:

Sull'asse delle ascisse sono tracciati segmenti uguali, che nella scala accettata corrispondono alla dimensione degli intervalli della serie di variazioni. Sui segmenti vengono costruiti rettangoli, le cui aree sono proporzionali alle frequenze (o frequenze) dell'intervallo.

Mediana nelle statistiche

3.2. Viene mostrato un istogramma della distribuzione delle banche in base al margine di profitto (secondo la Tabella 3.6.).

3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3 7,3-8,2 X

Riso. 3.2. Distribuzione delle banche commerciali per margine di profitto:

x - importo del profitto, milioni di rubli,

f è il numero di banche.

Per determinare la modalità, colleghiamo il vertice destro del rettangolo modale all'angolo superiore destro del rettangolo precedente e il vertice sinistro del rettangolo modale all'angolo superiore sinistro del rettangolo successivo. L'ascissa del punto di intersezione di queste linee sarà la modalità di distribuzione.

Mediana (statistica)

Mediana (statistica), nella statistica matematica, un numero che caratterizza un campione (ad esempio, un insieme di numeri). Se tutti gli elementi del campione sono diversi, la mediana è il numero del campione tale che esattamente la metà degli elementi del campione sono maggiori di esso e l'altra metà è inferiore. Più in generale, la mediana può essere trovata ordinando gli elementi di un campione in ordine crescente o decrescente e prendendo l'elemento centrale. Ad esempio, il campione (11, 9, 3, 5, 5) dopo l'ordinamento diventa (3, 5, 5, 9, 11) e la sua mediana è il numero 5. Se il campione ha un numero pari di elementi, il la mediana potrebbe non essere determinata in modo univoco: per i dati numerici, viene spesso utilizzata la semisomma di due valori adiacenti (ovvero, la mediana dell'insieme (1, 3, 5, 7) è considerata uguale a 4).

In altre parole, una mediana in statistica è un valore che divide una serie a metà in modo tale che su entrambi i lati di essa (verso il basso o verso l'alto) ci sia lo stesso numero di unità in una data popolazione.

Compito n. 1. Calcolo della media aritmetica, dei valori modali e mediani

A causa di questa proprietà, questo indicatore ha molti altri nomi: 50° percentile o 0,5 quantile.

  • Valore medio
  • Mediano
  • Moda

Mediana (statistica)

Mediana (statistica), nella statistica matematica, un numero che caratterizza un campione (ad esempio, un insieme di numeri). Se tutti gli elementi del campione sono diversi, la mediana è il numero del campione tale che esattamente la metà degli elementi del campione sono maggiori di esso e l'altra metà è inferiore. Più in generale, la mediana può essere trovata ordinando gli elementi di un campione in ordine crescente o decrescente e prendendo l'elemento centrale. Ad esempio, il campione (11, 9, 3, 5, 5) dopo l'ordinamento diventa (3, 5, 5, 9, 11) e la sua mediana è il numero 5.

5.5 Moda e mediana. Loro calcolo in serie a variazione discreta e intervallare

Se nel campione è presente un numero pari di elementi, la mediana potrebbe non essere determinata in modo univoco: per i dati numerici, viene spesso utilizzata la semisomma di due valori adiacenti (ovvero, la mediana dell'insieme (1, 3, 5, 7) è preso uguale a 4).

In altre parole, una mediana in statistica è un valore che divide una serie a metà in modo tale che su entrambi i lati di essa (verso il basso o verso l'alto) ci sia lo stesso numero di unità in una data popolazione. A causa di questa proprietà, questo indicatore ha molti altri nomi: 50° percentile o 0,5 quantile.

La mediana viene utilizzata al posto della media aritmetica quando le opzioni estreme della serie classificata (la più piccola e la più grande) rispetto al resto risultano essere eccessivamente grandi o eccessivamente piccole.

La funzione MEDIANA misura la tendenza centrale, che è il centro di un insieme di numeri in una distribuzione statistica. Esistono tre modi più comuni per determinare la tendenza centrale:

  • Valore medio- media aritmetica, che si calcola sommando una serie di numeri e poi dividendo la somma risultante per il loro numero.
    Ad esempio, la media dei numeri 2, 3, 3, 5, 7 e 10 è 5, che è il risultato della divisione della somma di 30 per la somma di 6.
  • Mediano- un numero che è il centro di un insieme di numeri: metà dei numeri hanno valori maggiori della mediana, e metà dei numeri hanno valori minori.
    Ad esempio, la mediana dei numeri 2, 3, 3, 5, 7 e 10 sarebbe 4.
  • Moda- il numero che si trova più spesso in un dato insieme di numeri.
    Ad esempio, la modalità per i numeri 2, 3, 3, 5, 7 e 10 sarebbe 3.

Lezione di algebra in 7a elementare.

Argomento: “La mediana come caratteristica statistica”.

Insegnante Egorova N.I.

Lo scopo della lezione: formare negli studenti un'idea della mediana di un insieme di numeri e la capacità di calcolarla per insiemi numerici semplici, consolidare il concetto di media aritmetica di un insieme di numeri.

Tipo di lezione: spiegazione di nuovo materiale.

Durante le lezioni

1. Momento organizzativo.

Informare sull'argomento della lezione e formularne gli obiettivi.

2. Attualizzazione delle conoscenze precedenti.

Domande per gli studenti:

Qual è la media aritmetica di un insieme di numeri?

Dove si trova la media aritmetica all’interno di un insieme di numeri?

Cosa caratterizza la media aritmetica di un insieme di numeri?

Dov'è spesso utilizzata la media aritmetica di un insieme di numeri?

Compiti orali:

Trova la media aritmetica di un insieme di numeri:

Controllo dei compiti.

Libro di testo: n. 169, n. 172.

3. Studio di nuovo materiale.

Nella lezione precedente abbiamo conosciuto una caratteristica statistica come la media aritmetica di un insieme di numeri. Oggi dedicheremo una lezione ad un'altra caratteristica statistica: la mediana.

Non solo la media aritmetica mostra dove si trovano sulla linea numerica i numeri di qualsiasi insieme e dove si trova il loro centro. Un altro indicatore è la mediana.

La mediana di un insieme di numeri è il numero che divide l'insieme in due parti uguali. Invece di “mediana”, potresti dire “medio”.

Per prima cosa, diamo un'occhiata agli esempi su come trovare la mediana, quindi diamo una definizione rigorosa.

Considera il seguente esempio verbale utilizzando un proiettore

Alla fine dell'anno scolastico, 11 studenti della 7a elementare hanno superato lo standard per correre i 100 metri. Sono stati registrati i seguenti risultati:

Dopo che i ragazzi hanno corso la distanza, Petya si è avvicinato all'insegnante e ha chiesto quale fosse il suo risultato.

"Risultato più medio: 16,9 secondi", ha risposto l'insegnante.

"Perché?" – Petya rimase sorpreso. – Dopotutto, la media aritmetica di tutti i risultati è di circa 18,3 secondi e ho corso più di un secondo meglio. E in generale, il risultato di Katya (18,4) è molto più vicino alla media del mio”.

“Il tuo risultato è nella media, poiché cinque persone hanno corso meglio di te e cinque peggio. Cioè, sei proprio nel mezzo”, ha detto l’insegnante.

Scrivi un algoritmo per trovare la mediana di un insieme di numeri:

Organizzare un set di numeri (creare una serie classificata).

Cancella contemporaneamente i numeri "più grandi" e "più piccoli" di un dato insieme di numeri finché rimangono uno o due numeri.

Se rimane un numero, allora è la mediana.

Se rimangono due numeri, la mediana sarà la media aritmetica dei due numeri rimanenti.

Invita gli studenti a formulare in modo indipendente la definizione della mediana di un insieme di numeri, quindi leggere la definizione della mediana nel libro di testo (p. 40), quindi risolvere il n. 186 (a, b), il n. 187 (a) di il libro di testo (p. 41).

Commento:

Attira l'attenzione degli studenti su un fatto importante: la mediana è praticamente insensibile a deviazioni significative dei valori estremi individuali degli insiemi di numeri. In statistica questa proprietà è chiamata stabilità. La stabilità di un indicatore statistico è una proprietà molto importante; ci assicura contro errori casuali e dati individuali inaffidabili.

4. Consolidamento del materiale studiato.

Risoluzione dei problemi.

Indichiamo la media aritmetica x, la mediana Me.

Serie di numeri: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Serie di numeri: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Serie di numeri: 3,4,11,17,21

b) Serie di numeri: 17,18,19,25,28

c) Serie di numeri: 25, 25, 27, 28, 29, 40, 50

Conclusione: la mediana di un insieme di numeri composto da un numero dispari di membri è uguale al numero al centro.

a) Una serie di numeri: 2, 4, 8, 9.

Io = (4+8):2=12:2=6

b) Una serie di numeri: 1,3,5,7,8,9.

Io = (5+7):2=12:2=6

La mediana di un insieme di numeri contenente un numero pari di termini è pari alla metà della somma dei due numeri al centro.

Lo studente ha conseguito nel trimestre i seguenti voti in algebra:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Trova il punteggio medio e la mediana di questo insieme.

Troviamo il punteggio medio, cioè la media aritmetica:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Trova la mediana di questo insieme di numeri:

Ordiniamo una serie di numeri: 2,4,4,4,5,5,5,5,5,5

Ci sono solo 10 numeri, per trovare la mediana devi prendere i due numeri centrali e trovare la loro metà somma.

Io = (5+5):2 = 5

Domanda per gli studenti: se fossi un insegnante, che voto daresti a questo studente per il trimestre? Giustifica la risposta.

Il presidente dell'azienda riceve uno stipendio di 300.000 rubli. tre dei suoi delegati ricevono 150.000 rubli ciascuno, quaranta dipendenti 50.000 rubli ciascuno. e lo stipendio di una donna delle pulizie è di 10.000 rubli. Trova la media aritmetica e la mediana degli stipendi dell'azienda. Quale di queste caratteristiche è più vantaggiosa per il presidente da utilizzare per scopi pubblicitari?

x \u003d (300000 + 3 150000 + 40 50000 + 10000): (1 + 3 + 40 + 1) \u003d 2760000: 45 \u003d 61333,33 (rubli)

N. 6. Oralmente.

A) Quanti numeri ci sono nell'insieme se la sua mediana è il nono termine?

B) Quanti numeri ci sono in un insieme se la sua mediana è la media aritmetica del 7° e dell'8° termine?

C) In un insieme di sette numeri, il numero più grande viene aumentato di 14. Ciò cambierà la media aritmetica e la mediana?

D) Ciascuno dei numeri dell'insieme viene aumentato di 3. Cosa succede alla media aritmetica e alla mediana?

I dolci nel negozio vengono venduti a peso. Per scoprire quante caramelle sono contenute in un chilogrammo, Masha ha deciso di trovare il peso di una caramella. Ha pesato diverse caramelle e ha ottenuto i seguenti risultati:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Entrambe le caratteristiche sono adatte per stimare il peso di una caramella, perché non sono molto diversi tra loro.

Pertanto, per caratterizzare le informazioni statistiche, vengono utilizzate la media aritmetica e la mediana. In molti casi, una delle caratteristiche potrebbe non avere alcun significato significativo (ad esempio, avendo informazioni sul momento degli incidenti stradali, difficilmente ha senso parlare della media aritmetica di questi dati).

Compiti a casa: paragrafo 10, n. 186 (c, d), n. 190.

5. Riepilogo della lezione. Riflessione.

  1. "Ricerca statistica: raccolta e raggruppamento di dati statistici"

    Lezione

    Temi, proposto per il settimo classe. PIANIFICAZIONE TEMATICA. § 1. Statisticocaratteristiche. P 1. Media aritmetica, intervallo e modalità 1h. P2. MedianoComestatisticocaratteristica

  2. Programma di lavoro del curriculum di algebra nella nota esplicativa del grado 7 (livello base).

    Programma di lavoro

    ... punto 10 MedianoComestatisticocaratteristica 23 p.9 Media aritmetica, intervallo e modalità 24 Esame n. 2 in poi argomento

  3. Programma di lavoro. Matematica. 5a elementare pag. Kanashi. 2011

    Programma di lavoro

    ...equazioni. Media aritmetica, intervallo e moda. MedianoComestatisticocaratteristica. L'obiettivo è sistematizzare e riassumere le informazioni su ... e le competenze acquisite in Lezioni secondo temi(BENE algebra 10 classe). 11 Classe(4 ore settimanali...

  4. Ordinanza n. 51 del “30” agosto 2012 Programma di lavoro per l'algebra 7° grado

    Programma di lavoro

    ...materiale didattico MedianoComestatisticocaratteristica Conoscere la definizione di media aritmetica, intervallo, moda e medianeComestatisticocaratteristiche Frontale e individuale...

  5. Programma di lavoro in matematica classe 7 II livello livello base (1)

    Programma di lavoro

    Come trovare la mediana di una serie

    Stesso, Come alle 6 classe. Studiando Temi termina con gli studenti che familiarizzano con il più semplice statisticocaratteristiche: media... M.: Casa editrice "Genzher", 2009. 3. Zhokhov, V.I. Lezionialgebra alle 7 classe: libro. per l'insegnante / V. I. Zhokhov ...

Altri documenti simili...

Nel 1906, il grande scienziato e famoso eugenetista Francis Galton visitò la mostra annuale dei risultati ottenuti nell'allevamento di bestiame e pollame nell'Inghilterra occidentale, dove, quasi per caso, condusse un interessante esperimento.

Come osserva James Surowiecki, autore di The Wisdom of Crowds, alla fiera Galton era interessato a una competizione in cui le persone dovevano indovinare il peso di un bue macellato. Chi nominava il numero più vicino a quello vero veniva dichiarato vincitore.

Galton era noto per il suo disprezzo per le capacità intellettuali della gente comune. Credeva che solo i veri esperti sarebbero stati in grado di fare dichiarazioni accurate sul peso di un bue. E 787 partecipanti al concorso non erano esperti.

Lo scienziato avrebbe dimostrato l'incompetenza della folla calcolando la media delle risposte dei partecipanti. Immaginate la sua sorpresa quando si scoprì che il risultato ottenuto corrispondeva quasi esattamente al peso reale del toro!

Media - Invenzione tardiva

Naturalmente, l'accuratezza della risposta ha stupito il ricercatore. Ma ancora più notevole è il fatto che Galton abbia addirittura pensato di utilizzare il valore medio.

Nel mondo di oggi, le medie e le cosiddette mediane si trovano ovunque: la temperatura media a New York ad aprile è di 52 gradi Fahrenheit; Stephen Curry ha una media di 30 punti a partita; Il reddito familiare medio negli Stati Uniti è di $ 51.939 all’anno.

Tuttavia, l’idea che molti risultati diversi possano essere rappresentati da un unico numero è abbastanza nuova. Fino al XVII secolo le medie non venivano affatto utilizzate.

Come è emerso e si è sviluppato il concetto di media e mediana? E come è riuscita a diventare la principale tecnica di misurazione dei nostri tempi?

Il predominio delle medie sulle mediane ha avuto conseguenze di vasta portata sulla nostra comprensione delle informazioni. E spesso ha portato le persone fuori strada.

Valori medi e mediani

Immagina di raccontare la storia di quattro persone che hanno cenato con te in un ristorante ieri sera. Daresti a uno di loro 20 anni, a un altro 30, a un terzo 40 e a un quarto 50. Cosa diresti della loro età nella tua storia?

Molto probabilmente li chiameresti mezza età.

Una media viene spesso utilizzata per trasmettere informazioni su qualcosa, nonché per descrivere una serie di misurazioni. Tecnicamente, la media è ciò che i matematici chiamano “media aritmetica”, ovvero la somma di tutte le misurazioni divisa per il numero di misurazioni.

Sebbene la parola media sia spesso usata come sinonimo di mediana, quest'ultima si riferisce più spesso alla metà di qualcosa. Questa parola deriva dal latino "medianus", che significa "mezzo".

Valore medio nell'antica Grecia

La storia del valore mediano inizia con gli insegnamenti dell'antico matematico greco Pitagora. Per Pitagora e la sua scuola, la mediana aveva una definizione chiara ed era molto diversa da come la intendiamo oggi. È stato utilizzato solo in matematica, non nell'analisi dei dati.

Nella scuola pitagorica, il valore mediano era il numero medio in una sequenza di tre termini, in relazione “uguale” ai termini vicini. Una relazione "uguale" potrebbe significare uguale distanza. Ad esempio, il numero 4 nella serie 2,4,6. Potrebbe però anche esprimere una progressione geometrica, come ad esempio 10 nella sequenza 1,10,100.

Lo statistico Churchill Eisenhart spiega che nell’antica Grecia il valore mediano non veniva utilizzato per rappresentare o sostituire alcun insieme di numeri. Indicava semplicemente il centro ed era spesso usato nelle dimostrazioni matematiche.

Eisenhart ha trascorso dieci anni a studiare la media e la mediana. Inizialmente cercò di trovare la funzione rappresentativa della mediana nelle prime costruzioni scientifiche. Invece, scoprì che la maggior parte dei primi fisici e astronomi si affidava a misurazioni singole e intelligenti e non disponeva di una metodologia per selezionare il risultato migliore tra molte osservazioni.

I ricercatori moderni basano le loro conclusioni sulla raccolta di grandi quantità di dati, come fanno i biologi che studiano il genoma umano. Gli antichi scienziati potevano effettuare numerose misurazioni, ma sceglievano solo le migliori per costruire le loro teorie.

Come ha scritto lo storico dell’astronomia Otto Neugebauer: “Ciò è coerente con il desiderio cosciente degli antichi di ridurre al minimo la quantità di dati empirici nella scienza, perché non credevano nell’accuratezza delle osservazioni dirette”.

Ad esempio, il matematico e astronomo greco Tolomeo calcolò il diametro angolare della Luna utilizzando metodi di osservazione e la teoria del movimento della terra. Il suo punteggio è stato 31'20. Oggi sappiamo che il diametro della Luna varia da 29'20 a 34'6 a seconda della sua distanza dalla Terra. Tolomeo utilizzava pochi dati nei suoi calcoli, ma aveva tutte le ragioni per credere che fossero accurati.

Eisenhart scrive: “Bisogna tenere presente che il rapporto tra osservazione e teoria era diverso nell’antichità rispetto a oggi. I risultati delle osservazioni sono stati intesi non come fatti ai quali la teoria dovrebbe essere adattata, ma come casi specifici che possono essere utili solo come esempi illustrativi della verità della teoria."

Gli scienziati alla fine si rivolgeranno a misure rappresentative dei dati, ma inizialmente in questo ruolo non venivano utilizzate né medie né mediane. Dall'antichità fino ai giorni nostri, come mezzo rappresentativo è stato utilizzato un altro concetto matematico: la metà della somma dei valori estremi.

Mezza somma dei valori estremi

I nuovi strumenti scientifici nascono quasi sempre dalla necessità di risolvere un problema specifico in qualche disciplina. La necessità di trovare il miglior valore tra più misurazioni è nata dalla necessità di determinare con precisione la posizione geografica.

Il gigante intellettuale dell'XI secolo Al-Biruni è noto come una delle prime persone a utilizzare la metodologia dei significati rappresentativi. Al-Biruni scrisse che quando aveva molte misurazioni a sua disposizione e voleva trovare la migliore tra queste, usava la seguente “regola”: bisogna trovare il numero corrispondente alla metà tra due valori estremi. Quando si calcola la semisomma dei valori estremi, non vengono presi in considerazione tutti i numeri compresi tra i valori massimo e minimo, ma viene trovata la media solo di questi due numeri.

Al-Biruni ha utilizzato questo metodo in vari campi, incluso il calcolo della longitudine della città di Ghazni, che si trova nell'attuale Afghanistan, nonché nei suoi studi sulle proprietà dei metalli.

Tuttavia, negli ultimi secoli, la mezza somma dei valori estremi è stata utilizzata sempre meno. In effetti, nella scienza moderna questo non è affatto rilevante. La metà somma è stata sostituita dal valore mediano.

Andiamo alle medie

All'inizio del XIX secolo, l'utilizzo del valore mediano/medio divenne un metodo comune per trovare il valore rappresentativo più accurato da un gruppo di dati. Friedrich von Gauss, un eminente matematico del suo tempo, scrisse nel 1809: “Si credeva che se un certo numero fosse stato determinato da diverse osservazioni dirette effettuate nelle stesse condizioni, allora la media aritmetica sarebbe il valore più vero. Se non è del tutto rigoroso, almeno è vicino alla realtà e quindi puoi sempre fare affidamento su di esso”.

Perché si è verificato questo cambiamento di metodologia?

A questa domanda è abbastanza difficile rispondere. Nel suo studio, Churchill Eisenhart suggerisce che il metodo per trovare la media aritmetica potrebbe aver avuto origine nel campo della misurazione della deviazione magnetica, cioè nel trovare la differenza tra la direzione dell'ago della bussola che punta verso nord e il nord reale. Questa dimensione era estremamente importante durante l’Era delle Grandi Scoperte Geografiche.

Eisenhart scoprì che fino alla fine del XVI secolo, la maggior parte degli scienziati che misuravano la deflessione magnetica utilizzavano il metodo ad hoc (dal latino "a questo, per questa occasione, per questo scopo") per scegliere la misurazione più accurata.

Ma nel 1580, lo scienziato William Borough affrontò il problema in modo diverso. Prese otto diverse misurazioni della deflessione e, dopo averle confrontate, concluse che il valore più accurato era compreso tra 11 ⅓ e 11 ¼ gradi. Probabilmente ha calcolato una media aritmetica che rientrava in questo intervallo. Tuttavia, lo stesso Boro non ha apertamente definito il suo approccio un nuovo metodo.

Prima del 1635 non esistevano casi chiari di utilizzo della media come numero rappresentativo. Tuttavia, fu allora che l'astronomo inglese Henry Gellibrand effettuò due diverse misurazioni della deflessione magnetica. Una è stata scattata al mattino (11 gradi), l'altra al pomeriggio (11 gradi e 32 minuti). Calcolando il valore più vero, scrisse:

"Se troviamo la media aritmetica, possiamo dire con alta probabilità che il risultato di una misurazione accurata dovrebbe essere di circa 11 gradi e 16 minuti."

È probabile che questa sia stata la prima volta che il valore medio è stato utilizzato come il più vicino al valore reale!

La parola "average" era usata in inglese all'inizio del XVI secolo per denotare una perdita finanziaria derivante dai danni subiti da una nave o dal suo carico durante un viaggio. Nel corso dei successivi cento anni designò proprio queste perdite, che furono calcolate come media aritmetica. Ad esempio, se una nave venisse danneggiata durante un viaggio e l'equipaggio dovesse gettare alcune merci in mare per sostenere il peso della nave, gli investitori subirebbero perdite finanziarie equivalenti all'importo del loro investimento: queste perdite venivano calcolate allo stesso modo di la media aritmetica. Quindi gradualmente i valori della media e della media aritmetica si sono avvicinati.

Valore medio

Al giorno d'oggi, la media o media aritmetica viene utilizzata come metodo principale per selezionare un valore rappresentativo per una serie di misurazioni. Come è successo? Perché questo ruolo non è stato assegnato al valore mediano?

Francis Galton era il campione della mediana

Il termine “mediana” – il termine medio in una serie di numeri che divide la serie a metà – è apparso più o meno nello stesso periodo della media aritmetica. Nel 1599, il matematico Edward Wright, lavorando sul problema della deviazione normale della bussola, propose per primo l'uso del valore mediano.

“...Supponiamo che molti arcieri stiano tirando verso un certo bersaglio. Il bersaglio viene successivamente rimosso. Come puoi scoprire dov'era l'obiettivo? Devi trovare il punto centrale tra tutte le frecce. Allo stesso modo, tra molti risultati osservativi, quello nel mezzo sarà il più vicino alla verità”.

La mediana fu ampiamente utilizzata nel diciannovesimo secolo, diventando a quel tempo una parte necessaria di qualsiasi analisi dei dati. Fu utilizzato anche da Francis Galton, un eminente analista del diciannovesimo secolo. Nella storia della pesatura del bue raccontata all'inizio di questo articolo, Galton inizialmente utilizzò il valore mediano per rappresentare l'opinione della folla.

Molti analisti, incluso Galton, hanno preferito la mediana perché è più semplice da calcolare per piccoli insiemi di dati.

Tuttavia, la mediana non è mai stata più popolare della media. Ciò era molto probabilmente dovuto alle speciali proprietà statistiche inerenti alla media, nonché alla sua relazione con la distribuzione normale.

Relazione tra la media e la distribuzione normale

Quando prendiamo molte misurazioni, i risultati sono, come dicono gli statistici, “distribuiti normalmente”. Ciò significa che se questi dati vengono tracciati su un grafico, i punti su di esso rappresenteranno qualcosa di simile a una campana. Se li colleghi, ottieni una curva “a campana”. Molte statistiche corrispondono a una distribuzione normale, come l'altezza, l'intelligenza e la temperatura annuale più alta delle persone.

Quando i dati sono distribuiti normalmente, la media sarà molto vicina al punto più alto della curva a campana e un numero molto elevato di misurazioni sarà vicino alla media. Esiste anche una formula che prevede quante misurazioni si discosteranno dalla media.

Pertanto, il calcolo della media fornisce ai ricercatori molte informazioni aggiuntive.

La connessione tra il valore medio e la deviazione standard offre un grande vantaggio, perché il valore mediano non ha tale connessione. Questa connessione è una parte importante dell'analisi dei dati sperimentali e dell'elaborazione statistica delle informazioni. Questo è il motivo per cui la media è diventata il fulcro della statistica e di tutte le scienze che si basano su più dati per trarre le proprie conclusioni.

Il vantaggio della media è dovuto anche al fatto che è facilmente calcolabile dai computer. Sebbene il valore mediano per un piccolo gruppo di dati sia abbastanza semplice da calcolare da soli, è molto più semplice scrivere un programma per computer che trovi la media. Se usi Microsoft Excel, probabilmente sai che la funzione mediana non è facile da calcolare come la funzione media.

Di conseguenza, grazie al suo grande significato scientifico e alla facilità d'uso, il valore medio è diventato il principale valore rappresentativo. Tuttavia, questa opzione non è sempre la migliore.

Vantaggi del valore mediano

In molti casi, quando vogliamo calcolare il valore centrale di una distribuzione, il valore mediano è una misura migliore. Questo perché il valore medio è in gran parte determinato dai risultati estremi della misurazione.

Molti analisti ritengono che l’uso sconsiderato delle medie abbia un impatto negativo sulla nostra comprensione delle informazioni quantitative. Le persone guardano la media e pensano che sia "la norma". Ma in realtà può essere determinato da qualunque membro che si distingua fortemente da una serie omogenea.

Immagina un analista che voglia conoscere un valore rappresentativo per cinque case. Quattro case valgono $ 100.000 e la quinta vale $ 900.000. La media sarebbe quindi $ 200.000 e la mediana sarebbe $ 100.000. In questo, come in molti altri casi, il valore mediano fornisce una migliore comprensione di ciò che può essere definito “standard”.

Riconoscendo quanto i valori estremi possano influenzare la media, la mediana viene utilizzata per riflettere i cambiamenti nel reddito delle famiglie statunitensi.

Le mediane sono anche meno sensibili ai dati sporchi con cui si confrontano oggi gli analisti. Molti statistici e analisti raccolgono informazioni intervistando le persone su Internet. Se l'utente aggiunge accidentalmente uno zero in più alla risposta, trasformando 100 in 1000, questo errore avrà un impatto molto più forte sulla media che sulla mediana.

Media o mediana?

La scelta tra la mediana e la media ha conseguenze di vasta portata, dalla nostra comprensione degli effetti dei farmaci sulla salute alla nostra conoscenza di come dovrebbe essere un budget familiare standard.

Poiché la raccolta e l’analisi dei dati modellano sempre più il modo in cui comprendiamo il mondo, lo stesso vale per il valore delle quantità che utilizziamo. In un mondo ideale, gli analisti utilizzerebbero sia la media che la mediana per esprimere graficamente i dati.

Ma viviamo in condizioni di tempo e attenzione limitati. A causa di queste limitazioni, spesso dobbiamo scegliere solo una cosa. E in molti casi è preferibile il valore mediano.

CATEGORIE

ARTICOLI POPOLARI

2023 “kingad.ru” - esame ecografico di organi umani