Mediana dei dati del campione. Funzione mediana in excel per eseguire analisi statistiche

Insieme ai valori medi, le medie strutturali sono calcolate come caratteristiche statistiche delle serie di distribuzione variazionale - moda e mediano.
Moda(Mo) rappresenta il valore della caratteristica studiata, ripetuto con la frequenza più alta, cioè mode è il valore della caratteristica che si verifica più spesso.
Mediano(Me) è il valore della caratteristica che rientra nel mezzo della popolazione classificata (ordinata), cioè mediana - il valore centrale della serie di variazioni.
La proprietà principale della mediana è che la somma delle deviazioni assolute dei valori degli attributi dalla mediana è inferiore a quella di qualsiasi altro valore ∑|x i - Me|=min.

Determinazione della modalità e della mediana dai dati non raggruppati

Ritenere determinazione della moda e della mediana da dati non raggruppati. Ipotizziamo che le squadre di lavoro, composte da 9 persone, abbiano le seguenti categorie salariali: 4 3 4 5 3 3 6 2 6 . Poiché questa squadra ha il maggior numero di lavoratori della 3a categoria, questa categoria tariffaria sarà modale. Mo = 3.
Per determinare la mediana è necessario classificare: 2 3 3 3 4 4 5 6 6 . Centrale in questa serie è il lavoratore della 4a categoria, quindi questa categoria sarà la mediana. Se la serie classificata comprende un numero pari di unità, la mediana è definita come la media dei due valori centrali.
Se la moda riflette la variante più comune del valore dell'attributo, allora la mediana svolge praticamente le funzioni di una media per una popolazione eterogenea che non obbedisce alla normale legge di distribuzione. Illustriamo il suo significato cognitivo con il seguente esempio.
Supponiamo di dover caratterizzare il reddito medio di un gruppo di persone che conta 100 persone, di cui 99 hanno un reddito compreso tra $ 100 e $ 200 al mese, e il reddito mensile di quest'ultimo è di $ 50.000 (Tabella 1).
Tabella 1 - Reddito mensile del gruppo di persone studiato. Se utilizziamo la media aritmetica, otteniamo un reddito medio di circa 600 - 700 dollari, che ha poco in comune con il reddito della parte principale del gruppo. La mediana, in questo caso pari a Me = 163 dollari, ci permetterà di dare una descrizione oggettiva del livello di reddito del 99% di questo gruppo di persone.
Considera la definizione di moda e mediana per dati raggruppati (serie di distribuzione).
Supponiamo che la distribuzione dei lavoratori dell'intera impresa nel suo insieme secondo la categoria tariffaria abbia la forma seguente (Tabella 2).
Tabella 2 - Ripartizione dei lavoratori dell'impresa per categoria tariffaria

Calcolo della moda e della mediana per una serie discreta

Calcolo della moda e della mediana per una serie di intervalli

Calcolo della moda e della mediana per una serie di variazioni

Determinazione della modalità da una serie di variazioni discrete

Viene utilizzata la serie di valori delle caratteristiche creata in precedenza, ordinati per valore. Se la dimensione del campione è dispari, prendi il valore centrale; se la dimensione del campione è pari, prendiamo la media aritmetica dei due valori centrali.
Determinazione della modalità da una serie di variazioni discrete: la 5a categoria tariffaria ha la frequenza più alta (60 persone), quindi è modale. Mo = 5.
Per determinare il valore mediano dell'attributo, il numero dell'unità mediana della serie (N Me) si trova utilizzando la seguente formula: , dove n è il volume della popolazione.
Nel nostro caso: .
Il valore frazionario risultante, che si verifica sempre con un numero pari di unità di popolazione, indica che la media esatta è compresa tra 95 e 96 lavoratori. È necessario determinare a quale gruppo appartengono i lavoratori con questi numeri di serie. Questo può essere fatto calcolando le frequenze accumulate. Non ci sono lavoratori con questi numeri nel primo gruppo, dove ci sono solo 12 persone, e non sono nel secondo gruppo (12+48=60). Il 95° e il 96° lavoratore sono nel terzo gruppo (12+48+56=116), quindi la 4a categoria salariale è la mediana.

Calcolo della moda e della mediana in una serie di intervalli

A differenza delle serie variazionali discrete, la determinazione della moda e della mediana dalle serie di intervalli richiede determinati calcoli basati sulle seguenti formule:
, (5.6)
dove x0- il limite inferiore dell'intervallo modale (si chiama modale l'intervallo con la frequenza più alta);
ioè il valore dell'intervallo modale;
fMoè la frequenza dell'intervallo modale;
f Mo-1è la frequenza dell'intervallo che precede il modale;
f Lu +1è la frequenza dell'intervallo che segue il modale.
(5.7)
dove x0– il limite inferiore dell'intervallo mediano (la mediana è il primo intervallo la cui frequenza accumulata supera la metà della somma totale delle frequenze);
ioè il valore dell'intervallo mediano;
S Me-1- intervallo accumulato che precede la mediana;
f Ioè la frequenza dell'intervallo mediano.
Illustriamo l'applicazione di queste formule utilizzando i dati in Tabella. 3.
L'intervallo con i limiti 60 - 80 in questa distribuzione sarà modale, perché ha la frequenza più alta. Usando la formula (5.6), determiniamo la modalità:

Per stabilire l'intervallo mediano, è necessario determinare la frequenza accumulata di ogni intervallo successivo fino a superare la metà della somma delle frequenze accumulate (nel nostro caso il 50%) (Tabella 5.11).
È stato riscontrato che la mediana è l'intervallo con i limiti di 100 - 120 mila rubli. Definiamo ora la mediana:

Tabella 3 - Distribuzione della popolazione della Federazione Russa per livello di reddito nominale medio pro capite in contanti nel marzo 1994
Gruppi per livello di reddito mensile medio pro capite, migliaia di rubliQuota della popolazione, %
fino a 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Oltre 3007,7
Totale100,0

Tabella 4 - Definizione dell'intervallo mediano
Pertanto, la media aritmetica, la moda e la mediana possono essere utilizzate come caratteristica generalizzata dei valori di un determinato attributo per le unità di una popolazione classificata.
La caratteristica principale del centro di distribuzione è la media aritmetica, caratterizzata dal fatto che tutte le deviazioni da essa (positive e negative) si sommano a zero. È tipico per la mediana che la somma delle deviazioni da essa nel modulo è minima e la moda è il valore della caratteristica che si verifica più spesso.
Il rapporto tra moda, mediana e media aritmetica indica la natura della distribuzione del tratto nell'aggregato, permette di valutarne l'asimmetria. Nelle distribuzioni simmetriche, tutte e tre le caratteristiche sono le stesse. Maggiore è la discrepanza tra il modo e la media aritmetica, più asimmetrica è la serie. Per le serie moderatamente asimmetriche, la differenza tra la moda e la media aritmetica è circa tre volte la differenza tra la mediana e la media, ovvero:
|Mo–`x| = 3 |Io –`x|.

Determinazione della moda e della mediana con un metodo grafico

La moda e la mediana in una serie di intervalli possono essere determinate graficamente. La modalità è determinata dall'istogramma della distribuzione. Per fare ciò, viene selezionato il rettangolo più alto, che in questo caso è modale. Quindi colleghiamo il vertice destro del rettangolo modale con l'angolo in alto a destra del rettangolo precedente. E il vertice sinistro del rettangolo modale è con l'angolo superiore sinistro del rettangolo successivo. Dal punto della loro intersezione, abbassiamo la perpendicolare all'asse delle ascisse. L'ascissa del punto di intersezione di queste linee sarà la modalità di distribuzione (Fig. 5.3).


Riso. 5.3. Definizione grafica della moda per istogramma.


Riso. 5.4. Determinazione grafica della mediana per cumulato
Per determinare la mediana da un punto sulla scala delle frequenze accumulate (frequenze) corrispondente al 50%, viene tracciata una linea retta parallela all'asse delle ascisse fino all'intersezione con il cumulato. Quindi, dal punto di intersezione, si abbassa una perpendicolare all'asse delle ascisse. L'ascissa del punto di intersezione è la mediana.

Quartili, decili, percentili

Allo stesso modo, trovando la mediana nella serie variazionale di distribuzione, puoi trovare il valore di una caratteristica per qualsiasi unità della serie classificata in ordine. Quindi, ad esempio, puoi trovare il valore di una caratteristica in unità che dividono la serie in quattro parti uguali, in 10 o 100 parti. Questi valori sono chiamati "quartili", "decili", "percentili".
I quartili sono il valore di una caratteristica che divide la popolazione a distanza in 4 parti uguali.
Distinguere tra il quartile inferiore (Q 1), che separa ¼ della popolazione con i valori più bassi dell'attributo, e il quartile superiore (Q 3), che taglia la parte ¼ con i valori più alti dell'attributo . Ciò significa che il 25% delle unità di popolazione sarà inferiore a Q 1 ; Il 25% di unità sarà racchiuso tra Q 1 e Q 2 ; 25% - tra Q 2 e Q 3 e il restante 25% è superiore a Q 3. Il quartile medio di Q 2 è la mediana.
Per calcolare i quartili in base alla serie di variazioni di intervallo, vengono utilizzate le seguenti formule:
, ,
dove x Q 1– il limite inferiore dell'intervallo contenente il quartile inferiore (l'intervallo è determinato dalla frequenza accumulata, la prima superiore al 25%);
x Q 3– il limite inferiore dell'intervallo contenente il quartile superiore (l'intervallo è determinato dalla frequenza accumulata, la prima superiore al 75%);
io– valore dell'intervallo;
S Q 1-1è la frequenza cumulativa dell'intervallo che precede l'intervallo contenente il quartile inferiore;
Q 3-1è la frequenza cumulativa dell'intervallo che precede l'intervallo contenente il quartile superiore;
f Q 1è la frequenza dell'intervallo contenente il quartile inferiore;
f Q 3è la frequenza dell'intervallo contenente il quartile superiore.
Considerare il calcolo dei quartili inferiore e superiore secondo la tabella. 5.10. Il quartile inferiore è compreso tra 60 e 80, la cui frequenza cumulativa è del 33,5%. Il quartile superiore si trova nell'intervallo 160 - 180 con una frequenza accumulata del 75,8%. Con questo in mente, otteniamo:
,
.
Oltre ai quartili, i decili possono essere determinati nei ranghi della distribuzione variazionale, opzioni che dividono la serie variazionale classificata in dieci parti uguali. Il primo decile (d 1) divide la popolazione da 1/10 a 9/10, il secondo decile (d 1) da 2/10 a 8/10 e così via.
Sono calcolati secondo le formule:
, .
I valori delle caratteristiche che dividono la serie in cento parti sono chiamati percentili. I rapporti tra mediana, quartili, decili e percentili sono mostrati in Fig. 5.5.

Salari in vari settori dell'economia, temperatura e precipitazioni nella stessa area per periodi di tempo comparabili, rese dei raccolti in diverse regioni geografiche, ecc. Tuttavia, la media non è affatto l'unico indicatore generalizzante - in alcuni casi per una più accurata valutazione un valore come la mediana è appropriato. In statistica, è ampiamente utilizzato come caratteristica descrittiva ausiliaria della distribuzione di una caratteristica in una singola popolazione. Vediamo come si discosta dalla media, e anche cosa ha causato la necessità di utilizzarlo.

Mediana in statistica: definizione e proprietà

Immagina la seguente situazione: 10 persone lavorano insieme al direttore in un'azienda. I dipendenti ordinari ricevono 1.000 grivna ciascuno e il loro manager, che, inoltre, è il proprietario, riceve 10.000 grivna. Se calcoliamo la media aritmetica, si scopre che lo stipendio medio in questa impresa è di 1900 UAH. Sarà vera questa affermazione? O per fare questo esempio, nella stessa stanza d'ospedale ci sono nove persone con una temperatura di 36,6°C e una persona con una temperatura di 41°C. La media aritmetica in questo caso è: (36,6 * 9 + 41) / 10 \u003d 37,04 ° C. Ma questo non significa che tutti i presenti siano malati. Tutto ciò suggerisce che la media da sola spesso non è sufficiente, ed è per questo che la mediana viene utilizzata in aggiunta ad essa. Nelle statistiche, questo indicatore è chiamato variante che si trova esattamente nel mezzo di una serie di variazioni ordinate. Se lo calcoli per i nostri esempi, ottieni, rispettivamente, 1000 UAH. e 36,6 °С. In altre parole, la mediana in statistica è il valore che divide a metà la serie in modo tale che su entrambi i lati (alto o basso) si trovi lo stesso numero di unità della popolazione data. A causa di questa proprietà, questo indicatore ha molti altri nomi: il 50° percentile o il quantile 0,5.

Come trovare la mediana nelle statistiche

Il metodo per calcolare questo valore dipende in gran parte dal tipo di serie variazionale che abbiamo: discreta o intervallo. Nel primo caso, la mediana nelle statistiche è abbastanza semplice. Tutto quello che devi fare è trovare la somma delle frequenze, dividere per 2 e quindi aggiungere ½ al risultato. Sarebbe meglio spiegare il principio di calcolo con il seguente esempio. Supponiamo di aver raggruppato i dati sulla fertilità e di voler scoprire qual è la mediana.

Numero del gruppo familiare per numero di bambini

Numero di famiglie

Dopo aver effettuato alcuni semplici calcoli, otteniamo che l'indicatore desiderato è pari a: 195/2 + ½ = opzione. Per scoprire cosa significa, dovresti accumulare in sequenza le frequenze, iniziando con le opzioni più piccole. Quindi, la somma delle prime due righe ci dà 30. Chiaramente, non ci sono 98 opzioni qui. Ma se aggiungiamo la frequenza della terza opzione (70) al risultato, otteniamo una somma pari a 100. Contiene solo la 98a opzione, il che significa che la mediana sarà una famiglia con due figli.

Per quanto riguarda le serie di intervalli, qui di solito viene utilizzata la seguente formula:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me, in cui:

  • X Me - il primo valore dell'intervallo mediano;
  • ∑f è il numero della serie (la somma delle sue frequenze);
  • i Me - il valore dell'intervallo mediano;
  • f Me - frequenza dell'intervallo mediano;
  • S Me-1 - la somma delle frequenze cumulative negli intervalli che precedono la mediana.

Ancora una volta, è difficile capirlo senza un esempio. Supponiamo che ci siano dati sul valore

Stipendio, mille rubli

Frequenze accumulate

Per utilizzare la formula sopra, dobbiamo prima determinare l'intervallo mediano. Come tale intervallo, se ne sceglie uno la cui frequenza accumulata supera o è uguale alla metà della somma totale delle frequenze. Quindi, dividendo 510 per 2, otteniamo che questo criterio corrisponde a un intervallo con un valore di stipendio di 250.000 rubli. fino a 300.000 rubli Ora puoi sostituire tutti i dati nella formula:

M e \u003d X Me + i Me * (∑f / 2 - S Me-1) / f Me \u003d 250 + 50 * (510/2 - 170) / 115 \u003d 286,96 mila rubli.

Speriamo che il nostro articolo sia stato utile e ora hai un'idea chiara di quale sia la mediana nelle statistiche e come dovrebbe essere calcolata.

Per calcolare la mediana in MS EXCEL c'è una funzione speciale MEDIAN() . In questo articolo definiremo la mediana e impareremo come calcolarla per un campione e per una data legge di distribuzione di una variabile casuale.

Iniziamo con mediani per campioni(cioè per un insieme fisso di valori).

Campione mediana

Mediano(mediana) è il numero che sta al centro dell'insieme di numeri: metà dei numeri nell'insieme sono maggiori di mediano, e metà dei numeri sono inferiori a mediano.

Calcolare mediani necessario prima (valori in campionamento). Per esempio, mediano per il campione (2; 3; 3; 4 ; 5; 7; 10) sarà 4. Dal momento che. solo in campionamento 7 valori, tre dei quali inferiori a 4 (cioè 2; 3; 3) e tre valori maggiori di (cioè 5; 7; 10).

Se l'insieme contiene un numero pari di numeri, viene calcolato per due numeri nel mezzo dell'insieme. Per esempio, mediano per campione (2; 3; 3 ; 6 ; 7; 10) sarà 4,5, perché (3+6)/2=4,5.

Per determinare mediani in MS EXCEL c'è una funzione con lo stesso nome MEDIAN() , la versione inglese di MEDIAN().

Mediano non necessariamente corrisponde. Una corrispondenza si verifica solo se i valori nel campione sono distribuiti simmetricamente mezzo. Ad esempio, per campioni (1; 2; 3 ; 4 ; 5; 6) mediano e media sono pari a 3,5.

Se noto funzione di distribuzione F(x) o densità di probabilità p(X), poi mediano si può trovare dall'equazione:

Ad esempio, risolvendo analiticamente questa equazione per la distribuzione lognormale lnN(μ; σ 2), otteniamo che medianoè calcolato con la formula =EXP(μ). Per μ=0, la mediana è 1.

Presta attenzione al punto Funzioni di distribuzione, per cui F(x)=0,5(vedi foto sopra) . L'ascissa di questo punto è 1. Questo è il valore della mediana, che naturalmente coincide con il valore precedentemente calcolato utilizzando la formula em.

in MS EXCEL mediano per distribuzione lognormale LnN(0;1) può essere calcolato utilizzando la formula =INV.LOGNORM(0,5,0,1).

Nota: Ricordiamo che l'integrale di sull'intera area di impostazione di una variabile casuale è uguale a uno.

Pertanto, la linea mediana (x=Mediana) divide l'area sotto il grafico funzioni di densità di probabilità in due parti uguali.

Poiché il ricercatore non dispone di dati sul volume delle vendite in ogni ufficio di cambio, il calcolo della media aritmetica per determinare il prezzo medio per dollaro è inappropriato.

Mediana di una serie di numeri

Tuttavia, è possibile determinare il valore dell'attributo, che è chiamato mediana (Me). Mediano

nel nostro esempio

Numero mediano: NoMe = ;

Moda

Tabella 3.6.

fè la somma delle frequenze della serie;

S frequenze cumulative

12_

_

S sono frequenze accumulate.

Sulla fig. 3.2. Viene mostrato un istogramma di una serie di distribuzione delle banche per profitto (secondo la tabella 3.6.).

x è l'importo del profitto, milioni di rubli,

f è il numero di banche.

"MEDIA DELLA SERIE ORDINATA"

Testo versione HTML della pubblicazione


Riassunto della lezione di algebra nella classe 7

Tema della lezione: "MEDIANA DELLA SERIE ORDINATA".

insegnante della filiale della scuola del lago della scuola secondaria MKOU Burkovskaya Eremenko Tatyana Alekseevna
Obiettivi:
il concetto di mediana come caratteristica statistica di una serie ordinata; formare la capacità di trovare la mediana per serie ordinate con un numero pari e dispari di membri; formare la capacità di interpretare i valori della mediana a seconda della situazione pratica, consolidare il concetto di media aritmetica insieme di numeri. Sviluppare capacità di lavoro indipendenti. Sviluppa un interesse per la matematica.
Durante le lezioni

lavoro orale.
Le righe sono: 1) 4; uno; otto; 5; uno; 2) ; 9; 3; 0,5; ; 3) 6; 0,2; ; quattro; 6; 7.3; 6. Trova: a) i valori più grandi e più piccoli di ogni riga; b) l'intervallo di ciascuna riga; c) la moda di ogni riga.
II. Spiegazione del nuovo materiale.
Lavoro da manuale. 1. Considera il problema del paragrafo 10 del libro di testo. Cosa significa riga ordinata? Sottolineo che prima di trovare la mediana, devi sempre ordinare le serie di dati. 2. Alla lavagna, conosciamo le regole per trovare la mediana per le serie con un numero pari e dispari di membri:
Mediano

ordinato

riga
numeri
Insieme a

strano

numero

membri

chiamato il numero scritto nel mezzo, e
mediano

riga ordinata
numeri
con un numero pari di membri
è chiamata media aritmetica di due numeri scritti nel mezzo.
Mediano

arbitrario

riga
è chiamata mediana 1 3 1 7 5 4 della corrispondente serie ordinata.
Noto che gli indicatori sono la media aritmetica, la moda e la mediana per

diversamente

caratterizzare

dati,

ricevuto

risultato

osservazioni.

III. Formazione di abilità e abilità.
1° gruppo. Esercizi sull'applicazione di formule per trovare la mediana di una serie ordinata e non ordinata. uno.
№ 186.
Soluzione: a) Numero dei membri della serie P= 9; mediano Me= 41; b) P= 7, la riga è ordinata, Me= 207; in) P= 6, la riga è ordinata, Me== 21; G) P= 8, la riga è ordinata, Me== 2.9. Risposta: a) 41; b) 207; alle 21; d) 2.9. Gli studenti commentano come si trova la mediana. 2. Trova la media aritmetica e la mediana di una serie di numeri: a) 27, 29, 23, 31, 21, 34; in) ; 1. b) 56, 58, 64, 66, 62, 74. Soluzione: Per trovare la mediana, è necessario ordinare ogni riga: a) 21, 23, 27, 29, 31, 34. P = 6; X = = 27,5; Me== 28; 20 22 2 + 2, 6 3, 2 2 + 1125 ; ; ; 3636 21 23 27 29 31 34 165 66 +++++ = 27 29 2 + b) 56, 58, 62, 64, 66, 74.

Come trovare la mediana nelle statistiche

P = 6; X = 63,3; Me== 63; in) ; uno. P = 5; X = : 5 = 3: 5 = 0,6; Me = . 3.
№ 188
(per via orale). Risposta: si; b) no; c) no; d) si. 4. Sapere che la serie ordinata contiene t numeri, dove tè un numero dispari, indicare il numero del termine che è la mediana se tè uguale a: a) 5; b) 17; c) 47; d) 201. Risposta: a) 3; b) 9; c) 24; d) 101. 2° gruppo. Compiti pratici per trovare la mediana della serie corrispondente e interpretare il risultato. uno.
№ 189.
Soluzione: Numero di membri di riga P= 12. Per trovare la mediana occorre ordinare la serie: 136, 149, 156, 158, 168, 174, 178, 179, 185, 185, 185, 194. Mediana della serie Me= = 176. La produzione mensile era superiore alla mediana per i seguenti membri dell'artel: 56 58 62 64 66 74 380 66 +++++ =≈ 62 64 2 + 1125; ; ; 3636 1125 12456 18 1:5:5 6336 6 6 ++++ ⎛⎞ ++++ = = ⎜⎟ ⎝⎠ 2 3 67 174 178 22 xx+ + = 1) Kvitko; 4) Bobkov; 2) Baranov; 5) Rilov; 3) Antonov; 6) Astafiev. Risposta: 176. 2.
№ 192.
Soluzione: Disponiamo le serie di dati: 30, 31, 32, 32, 32, 32, 32, 32, 33, 35, 35, 36, 36, 36, 38, 38, 38, 40, 40, 42; numero di membri di fila P= 20. Scorri UN = X max- X min = 42 - 30 = 12. Modalità Mo= 32 (questo valore si verifica 6 volte - più spesso di altri). Mediano Me= = 35. In questo caso, l'intervallo mostra il maggiore intervallo di tempo per la lavorazione del pezzo; la modalità mostra il valore più tipico del tempo di elaborazione; la mediana è il tempo di elaborazione che la metà dei tornitori non ha superato. Risposta: 12; 32; 35.
IV. Riassunto della lezione.
Qual è la mediana di una serie di numeri? – La mediana di una serie di numeri può non coincidere con nessuno dei numeri della serie? – Quale numero è la mediana di una serie ordinata contenente 2 P numeri? 2 P– 1 numero? Come trovare la mediana di una serie non ordinata?
Compiti a casa:
№ 187, № 190, № 191, № 254. 10 11 35 35 22 xx + + =

Nella sezione educazione generale di base

Modalità e mediana

I valori medi includono anche la moda e la mediana.

La mediana e la moda sono spesso utilizzate come caratteristica media in quelle popolazioni in cui il calcolo della media (aritmetica, armonica, ecc.) è impossibile o impraticabile.

Ad esempio, un'indagine campionaria nella città di Omsk di 12 uffici di cambio valuta commerciale ha permesso di fissare vari prezzi per il dollaro quando è stato venduto (dati al 10 ottobre 1995 al tasso di cambio del dollaro -4493 rubli) .

Poiché il ricercatore non dispone di dati sul volume delle vendite in ogni ufficio di cambio, il calcolo della media aritmetica per determinare il prezzo medio per dollaro è inappropriato. Tuttavia, è possibile determinare il valore dell'attributo, che è chiamato mediana (Me). Mediano si trova al centro della riga classificata e la divide in due.

Il calcolo della mediana per i dati non raggruppati viene eseguito come segue:

a) disporre i singoli valori della caratteristica in ordine crescente:

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570 4570

b) determinare il numero di serie della mediana con la formula:

nel nostro esempio ciò significa che la mediana in questo caso si trova tra il sesto e il settimo valore delle caratteristiche della serie classificata, poiché la serie ha un numero pari di valori individuali. Quindi, Me è uguale alla media aritmetica dei valori vicini: 4550, 4560.

c) considerare la procedura di calcolo della mediana nel caso di un numero dispari di valori individuali.

Supponiamo di osservare non 12, ma 11 punti di cambio valuta, quindi la serie classificata sarà simile a questa (eliminiamo il 12° punto):

4500 4500 4535 4540 4550 4560 4560 4560 4560 4570 4570

Numero mediano: NoMe = ;

al sesto posto è = 4560, che è la mediana: Me = 4560. Su entrambi i lati c'è lo stesso numero di punti.

Moda- questo è il valore più comune dell'attributo nelle unità di questa popolazione. Corrisponde ad un certo valore caratteristico.

Nel nostro caso, il prezzo modale per dollaro può essere chiamato 4560 rubli: questo valore viene ripetuto 4 volte, più spesso di tutti gli altri.

In pratica, la moda e la mediana si trovano solitamente da dati raggruppati. A seguito del raggruppamento si è ottenuta una serie di distribuzioni delle banche in base all'ammontare dell'utile percepito nell'esercizio (Tabella 3.6.).

Tabella 3.6.

Raggruppamento delle banche per l'importo dell'utile ricevuto per l'anno

Per determinare la mediana è necessario calcolare la somma delle frequenze cumulative. L'aumento del totale continua fino a quando la somma cumulativa delle frequenze supera la metà della somma delle frequenze. Nel nostro esempio, la somma delle frequenze accumulate (12) supera la metà di tutti i valori (20:2). Questo valore corrisponde all'intervallo mediano, che contiene la mediana (5,5 - 6,4). Determiniamo il suo valore con la formula:

dove è il valore iniziale dell'intervallo contenente la mediana;

- il valore dell'intervallo mediano;

fè la somma delle frequenze della serie;

è la somma delle frequenze cumulative che precedono l'intervallo mediano;

è la frequenza dell'intervallo mediano.

Pertanto, il 50% delle banche ha un profitto di 6,1 milioni di rubli e il 50% delle banche - oltre 6,1 milioni di rubli.

La frequenza più alta corrisponde anche all'intervallo 5,5 - 6,4, cioè la modalità deve essere in questo intervallo. Il suo valore è determinato dalla formula:

dove è il valore iniziale dell'intervallo contenente la moda;

- il valore dell'intervallo modale;

è la frequenza dell'intervallo modale;

- la frequenza dell'intervallo che precede il modale;

- la frequenza dell'intervallo che segue il modale.

La formula della moda data può essere utilizzata in serie variazionali con intervalli uguali.

Pertanto, in questo aggregato, il profitto più comune è di 6,10 milioni di rubli.

Mediana e moda possono essere determinate graficamente. La mediana è determinata dal cumulato (Fig. 3.1.). Per costruirlo, è necessario calcolare le frequenze e le frequenze cumulative. Le frequenze cumulative mostrano quante unità della popolazione hanno valori caratteristici non superiori al valore considerato, ed è determinata dalla successiva somma delle frequenze di intervallo. Quando si costruisce la serie di distribuzione dell'intervallo cumulativo, il limite inferiore del primo intervallo corrisponde a una frequenza uguale a zero e il limite superiore corrisponde all'intera frequenza dell'intervallo dato. Il limite superiore del secondo intervallo corrisponde alla frequenza cumulativa pari alla somma delle frequenze dei primi due intervalli, e così via.

Costruiamo una curva cumulativa secondo la tabella. 6 sulla distribuzione degli utili delle banche.

S frequenze cumulative

12_

_

3.7-4.6 4.6-5.5 5.5-6.4 6.4-7.3 7.3-8.2 Х profitto

Riso. 3.1. La distribuzione cumulativa delle banche per profitto:

x è l'importo del profitto, milioni di rubli,

S sono frequenze accumulate.

Per determinare la mediana, l'altezza dell'ordinata più grande, che corrisponde alla popolazione totale, è divisa a metà. Si traccia una retta passante per il punto ottenuto, parallela all'asse delle ascisse, fino a quando non si interseca con il cumulo. L'ascissa del punto di intersezione è la mediana.

La modalità è determinata dall'istogramma della distribuzione. L'istogramma è costruito in questo modo:

segmenti uguali sono tracciati sull'asse delle ascisse, che, sulla scala accettata, corrispondono alla dimensione degli intervalli della serie di variazioni. I rettangoli sono costruiti sui segmenti, le cui aree sono proporzionali alle frequenze (o frequenze) dell'intervallo.

Mediana nelle statistiche

3.2. Viene mostrato un istogramma di una serie di distribuzione delle banche per profitto (secondo la tabella 3.6.).

3.7-4.6 4.6-5.5 5.5-6.4 6.4-7.3 7.3-8.2 Х

Riso. 3.2. Distribuzione delle banche commerciali per profitto:

x è l'importo del profitto, milioni di rubli,

f è il numero di banche.

Per determinare la moda, colleghiamo il vertice destro del rettangolo modale con l'angolo superiore destro del rettangolo precedente e il vertice sinistro del rettangolo modale con l'angolo superiore sinistro del rettangolo successivo. L'ascissa del punto di intersezione di queste linee sarà il modo di distribuzione.

Mediana (statistica)

Mediana (statistica), in statistica matematica, un numero che caratterizza un campione (ad esempio, un insieme di numeri). Se tutti gli elementi del campione sono diversi, la mediana è il numero del campione tale che esattamente la metà degli elementi nel campione sia maggiore di esso e l'altra metà sia minore di esso. In un caso più generale, la mediana può essere trovata ordinando gli elementi del campione in ordine crescente o decrescente e prendendo l'elemento centrale. Ad esempio, il campione (11, 9, 3, 5, 5) dopo l'ordine diventa (3, 5, 5, 9, 11) e la sua mediana è il numero 5. Se il campione ha un numero pari di elementi, il la mediana potrebbe non essere determinata in modo univoco: per i dati numerici, viene spesso utilizzata la semisomma di due valori adiacenti (ovvero, la mediana dell'insieme (1, 3, 5, 7) è 4).

In altre parole, la mediana in statistica è il valore che divide a metà la serie in modo tale che su entrambi i lati (alto o basso) si trovi lo stesso numero di unità della popolazione data.

Compito numero 1. Calcolo della media aritmetica, del valore modale e della mediana

A causa di questa proprietà, questo indicatore ha molti altri nomi: il 50° percentile o il quantile 0,5.

  • Significare
  • Mediano
  • Moda

Mediana (statistica)

Mediana (statistica), in statistica matematica, un numero che caratterizza un campione (ad esempio, un insieme di numeri). Se tutti gli elementi del campione sono diversi, la mediana è il numero del campione tale che esattamente la metà degli elementi nel campione sia maggiore di esso e l'altra metà sia minore di esso. In un caso più generale, la mediana può essere trovata ordinando gli elementi del campione in ordine crescente o decrescente e prendendo l'elemento centrale. Ad esempio, il campione (11, 9, 3, 5, 5) dopo l'ordine si trasforma in (3, 5, 5, 9, 11) e la sua mediana è il numero 5.

5.5 Modalità e mediana. Il loro calcolo in serie variazionali discrete e di intervallo

Se il campione ha un numero pari di elementi, la mediana potrebbe non essere determinata in modo univoco: per i dati numerici, viene utilizzata più spesso la semisomma di due valori adiacenti (cioè la mediana dell'insieme (1, 3, 5, 7) è preso uguale a 4).

In altre parole, la mediana in statistica è il valore che divide a metà la serie in modo tale che su entrambi i lati (alto o basso) si trovi lo stesso numero di unità della popolazione data. A causa di questa proprietà, questo indicatore ha molti altri nomi: il 50° percentile o il quantile 0,5.

La mediana viene utilizzata al posto della media aritmetica quando le varianti estreme della serie classificata (la più piccola e la più grande) rispetto alle altre risultano essere eccessivamente grandi o eccessivamente piccole.

La funzione MEDIANA misura la tendenza centrale, che è il centro di un insieme di numeri in una distribuzione statistica. Esistono tre modi più comuni per determinare la tendenza centrale:

  • Significare- la media aritmetica, che si calcola sommando un insieme di numeri, quindi dividendo la somma risultante per il loro numero.
    Ad esempio, la media per i numeri 2, 3, 3, 5, 7 e 10 è 5, che è il risultato della divisione della loro somma, che è 30, per il loro numero, che è 6.
  • Mediano- un numero che è la metà di un insieme di numeri: metà dei numeri ha valori maggiori della mediana e metà dei numeri sono più piccoli.
    Ad esempio, la mediana dei numeri 2, 3, 3, 5, 7 e 10 è 4.
  • Modaè il numero che ricorre più frequentemente in un dato insieme di numeri.
    Ad esempio, la modalità per i numeri 2, 3, 3, 5, 7 e 10 sarebbe 3.

Lezione di algebra in 7a elementare.

Argomento "Mediana come caratteristica statistica".

Insegnante Egorova N.I.

Scopo della lezione: formare gli studenti alla comprensione della mediana di un insieme di numeri e alla capacità di calcolarla per semplici insiemi numerici, fissando il concetto di media aritmetica dell'insieme dei numeri.

Tipo di lezione: spiegazione di nuovo materiale.

Durante le lezioni

1. Momento organizzativo.

Informare l'argomento della lezione e formularne gli obiettivi.

2. Attualizzazione delle conoscenze pregresse.

Domande per gli studenti:

Qual è la media aritmetica di un insieme di numeri?

Dove si trova la media aritmetica all'interno di un insieme di numeri?

Cosa caratterizza la media aritmetica di un insieme di numeri?

Dov'è usata spesso la media aritmetica di un insieme di numeri?

Compiti orali:

Trova la media aritmetica di un insieme di numeri:

Controllo dei compiti.

Libro di testo: n. 169, n. 172.

3. Imparare nuovo materiale.

Nella lezione precedente, abbiamo conosciuto una caratteristica statistica come la media aritmetica di un insieme di numeri. Oggi dedicheremo una lezione a un'altra caratteristica statistica: la mediana.

Non solo la media aritmetica mostra dove si trovano sulla linea dei numeri i numeri di qualsiasi insieme e dove si trova il loro centro. Un altro indicatore è la mediana.

La mediana di un insieme di numeri è il numero che divide l'insieme in due parti uguali. Invece di "mediana" si potrebbe dire "medio".

Per prima cosa, usando degli esempi, analizzeremo come trovare la mediana, quindi daremo una definizione rigida.

Considera il seguente esempio verbale usando un proiettore

Alla fine dell'anno scolastico, 11 studenti del 7° anno hanno superato lo standard per la corsa di 100 metri. Sono stati registrati i seguenti risultati:

Dopo che i ragazzi hanno corso la distanza, Petya si è avvicinato all'insegnante e ha chiesto quale fosse il suo risultato.

"La maggior parte della media: 16,9 secondi", ha risposto l'insegnante

"Perché?" Petya fu sorpresa. - Dopotutto, la media aritmetica di tutti i risultati è di circa 18,3 secondi e ho corso un secondo o più meglio. E in generale, il risultato di Katya (18,4) è molto più vicino alla media del mio".

“Il tuo risultato è nella media perché cinque persone hanno corso meglio di te e cinque peggio. Quindi sei proprio nel mezzo", ha detto l'insegnante.

Scrivi un algoritmo per trovare la mediana di un insieme di numeri:

Ordina il set numerico (componi una serie classificata).

Allo stesso tempo, cancelliamo i numeri "più grande" e "più piccolo" di questo insieme di numeri fino a quando rimangono uno o due numeri.

Se c'è un solo numero, allora è la mediana.

Se rimangono due numeri, la mediana sarà la media aritmetica dei due numeri rimanenti.

Invitare gli studenti a formulare autonomamente la definizione di mediana di un insieme di numeri, quindi leggere la definizione di mediana nel libro di testo (p. 40), quindi risolvere n. 186 (a, b), n. 187 (a) di il libro di testo (pag. 41).

Commento:

Attira l'attenzione degli studenti su una circostanza importante: la mediana è praticamente insensibile alle deviazioni significative dei valori estremi individuali di insiemi di numeri. In statistica, questa proprietà è chiamata stabilità. La stabilità di un indicatore statistico è una proprietà molto importante, ci assicura contro errori casuali e dati individuali inaffidabili.

4. Consolidamento del materiale studiato.

Risoluzione dei problemi.

Denota x-media aritmetica, Me-mediana.

Serie di numeri: 1,3,5,7,9.

x=(1+3+5+7+9):5=25:5=5,

Serie di numeri: 1,3,5,7,14.

x=(1+3+5+7+14):5=30:5=6.

a) Serie di numeri: 3,4,11,17,21

b) Serie di numeri: 17,18,19,25,28

c) Serie di numeri: 25, 25, 27, 28, 29, 40, 50

Conclusione: la mediana di un insieme di numeri composto da un numero dispari di membri è uguale al numero nel mezzo.

a) Un insieme di numeri: 2, 4, 8, 9.

Io = (4+8):2=12:2=6

b) Un insieme di numeri: 1,3,5,7,8,9.

Io = (5+7):2=12:2=6

La mediana di un insieme di numeri contenente un numero pari di membri è la metà della somma dei due numeri nel mezzo.

Lo studente ha ricevuto i seguenti voti in algebra durante il trimestre:

5, 4, 2, 5, 5, 4, 4, 5, 5, 5.

Trova il punteggio medio e la mediana di questo set.

Troviamo il punteggio medio, cioè la media aritmetica:

x= (5+4+2+5+5+4+4+5+5+5): 10=44:10 = 4,4

Trova la mediana di questo insieme di numeri:

Ordiniamo un insieme di numeri: 2,4,4,4,5,5,5,5,5,5

Solo 10 numeri, per trovare la mediana devi prendere due numeri centrali e trovare la loro metà somma.

Io = (5+5):2 = 5

Domanda agli studenti: se tu fossi un insegnante, che voto daresti a questo studente per un trimestre? Giustifica la risposta.

Il presidente dell'azienda riceve uno stipendio di 300.000 rubli. tre dei suoi vice ricevono 150.000 rubli ciascuno, quaranta dipendenti - 50.000 rubli ciascuno. e lo stipendio di un addetto alle pulizie è di 10.000 rubli. Trova la media aritmetica e la mediana degli stipendi in azienda. Quale di queste caratteristiche è più redditizio per il presidente utilizzare a fini pubblicitari?

x \u003d (300000 + 3 150000 + 40 50000 + 10000): (1 + 3 + 40 + 1) \u003d 2760000: 45 \u003d 61333.33 (rubli)

No. 6. Oralmente.

A) Quanti numeri ci sono nell'insieme se la sua mediana è il nono termine?

B) Quanti numeri ci sono nell'insieme se la sua mediana è la media aritmetica del 7° e 8° membro?

C) In un insieme di sette numeri, il numero più grande è stato aumentato di 14. Questo cambierà sia la media aritmetica che la mediana?

D) Ciascuno dei numeri nell'insieme è stato aumentato di 3. Cosa accadrà alla media aritmetica e alla mediana?

I dolci nel negozio sono venduti a peso. Per scoprire quanti dolci sono contenuti in un chilogrammo, Masha ha deciso di trovare il peso di una caramella. Pesò diverse caramelle e ottenne i seguenti risultati:

12, 13, 14, 12, 15, 16, 14, 13, 11.

Entrambe le caratteristiche sono adatte per stimare il peso di una caramella, poiché non sono molto diversi tra loro.

Quindi, per caratterizzare le informazioni statistiche, vengono utilizzate la media aritmetica e la mediana. In molti casi, alcune delle caratteristiche possono non avere alcun significato significativo (per esempio, avendo informazioni sull'ora degli incidenti stradali, non ha senso parlare della media aritmetica di questi dati).

Compiti a casa: comma 10, n. 186 (c, d), n. 190.

5. I risultati della lezione. Riflessione.

  1. "Ricerca statistica: raccolta e raggruppamento di dati statistici"

    Lezione

    Temi proposto per il settimo classe. PROGETTAZIONE TEMATICA. § uno. Statisticocaratteristiche. P 1. Media aritmetica, range e modo 1h. P2. Medianocomestatisticocaratteristica

  2. Il programma di lavoro del corso di formazione "algebra" nella nota esplicativa di 7° grado (livello base).

    Programma di lavoro

    ... articolo 10 Medianocomestatisticocaratteristica 23 p.9 Media aritmetica, range e modalità 24 Esame n. 2 on argomento

  3. Programma di lavoro. Matematica. 5a classe pag. Kanashi. 2011

    Programma di lavoro

    ... equazioni. Media aritmetica, intervallo e modo. Medianocomestatisticocaratteristica. L'obiettivo è sistematizzare e riassumere le informazioni su ... e le competenze acquisite a Lezioni secondo temi(bene algebra 10 classe). 11 Classe(4 ore settimanali...

  4. Ordinanza n. 51 del 30 agosto 2012 Algebra Work Program Grade 7

    Programma di lavoro

    ... materiale didattico Medianocomestatisticocaratteristica Conoscere la definizione di media aritmetica, intervallo, modo e medianicomestatisticocaratteristiche Frontale e individuale...

  5. Programma di lavoro in matematica grado 7 ii livello livello base (1)

    Programma di lavoro

    Come trovare la mediana di una serie

    stesso, come alle 6 aula. Lo studio Temi termina introducendo gli studenti al più semplice statisticocaratteristiche: medio ... M .: Casa editrice "Genzher", 2009. 3. Zhokhov, V.I. Lezionialgebra alle 7 aula: prenotare. per l'insegnante / V. I. Zhokhov ...

Altri documenti correlati..

Nel 1906, il grande scienziato e famoso eugenetico Francis Galton visitò l'annuale Mostra di animali e pollame nell'Inghilterra occidentale, dove, per caso, condusse un interessante esperimento.

Secondo James Surowetsky, autore di The Wisdom of the Crowd, c'era un concorso alla Fiera di Galton in cui le persone dovevano indovinare il peso di un toro macellato. Vinceva colui che aveva indicato il numero più vicino al vero.

Galton era noto per il suo disprezzo per le capacità intellettuali della gente comune. Credeva che solo i veri esperti sarebbero stati in grado di fare affermazioni accurate sul peso del toro. E 787 partecipanti al concorso non erano esperti.

Lo scienziato avrebbe dimostrato l'incompetenza della folla calcolando il numero medio dalle risposte dei partecipanti. Qual è stata la sua sorpresa quando si è scoperto che il risultato ricevuto corrispondeva quasi esattamente al peso reale del toro!

Valore medio - tarda invenzione

Naturalmente, l'accuratezza della risposta ha stupito il ricercatore. Ma ancora più notevole è il fatto che Galton abbia pensato di usare la media.

Nel mondo di oggi, le medie, e le cosiddette mediane, sono ovunque: la temperatura media a New York ad aprile è di 52 gradi Fahrenheit; Stephen Curry ha una media di 30 punti a partita; Il reddito familiare medio negli Stati Uniti è di $ 51.939 all'anno.

Tuttavia, l'idea che molti risultati diversi possano essere rappresentati da un unico numero è piuttosto nuova. Fino al 17° secolo, le medie non erano generalmente utilizzate.

Come è nato e si è sviluppato il concetto di media e mediana? E come è riuscita a diventare la principale tecnica di misurazione del nostro tempo?

Il predominio dei mezzi sulle mediane ha avuto conseguenze di vasta portata per la nostra comprensione delle informazioni. E spesso ha portato le persone fuori strada.

Valori medi e mediani

Immagina di raccontare una storia su quattro persone che hanno cenato con te la scorsa notte in un ristorante. Daresti a uno di loro 20 anni, un altro 30, il terzo 40 e il quarto 50. Cosa diresti della loro età nella tua storia?

Molto probabilmente, li chiamerai età media.

La media viene spesso utilizzata per trasmettere informazioni su qualcosa, nonché per descrivere una serie di misurazioni. Tecnicamente, la media è ciò che i matematici chiamano "media aritmetica" - la somma di tutte le misurazioni divisa per il numero di misurazioni.

Sebbene la parola "media" sia spesso usata come sinonimo della parola "mediana" (mediana), quest'ultima è più spesso indicata come la metà di qualcosa. Questa parola deriva dal latino "medianus", che significa "mezzo".

Valore mediano nell'antica Grecia

La storia del valore mediano trae origine dagli insegnamenti dell'antico matematico greco Pitagora. Per Pitagora e la sua scuola, la mediana aveva una definizione chiara ed era molto diversa da come la intendiamo oggi. Era usato solo in matematica, non nell'analisi dei dati.

Nella scuola pitagorica, il valore mediano era il numero medio in una sequenza di numeri a tre termini, in relazione "uguale" ai termini vicini. Il rapporto "uguale" potrebbe significare la stessa distanza. Ad esempio, il numero 4 nella riga 2,4,6. Tuttavia, potrebbe anche esprimere una progressione geometrica, come 10 nella sequenza 1,10,100.

Lo statistico Churchill Eisenhart spiega che nell'antica Grecia la mediana non era usata come rappresentante o sostituto di nessun insieme di numeri. Indicava semplicemente il centro ed era spesso usato nelle dimostrazioni matematiche.

Eisenhart ha trascorso dieci anni a studiare la media e la mediana. Inizialmente, ha cercato di trovare la funzione rappresentativa della mediana nelle prime costruzioni scientifiche. Invece, ha scoperto che la maggior parte dei primi fisici e astronomi si basava su misurazioni singole, abilmente fatte, e non avevano una metodologia per scegliere il miglior risultato tra molte osservazioni.

I ricercatori moderni basano le loro conclusioni sulla raccolta di grandi quantità di dati, come, ad esempio, i biologi che studiano il genoma umano. Gli scienziati antichi, d'altra parte, potevano effettuare diverse misurazioni, ma sceglievano solo il meglio per costruire le loro teorie.

Come scrisse lo storico dell'astronomia Otto Neugebauer, "questo è coerente con il desiderio consapevole degli antichi di ridurre al minimo la quantità di dati empirici nella scienza, perché non credevano nell'accuratezza delle osservazioni dirette".

Ad esempio, il matematico e astronomo greco Tolomeo calcolò il diametro angolare della luna usando il metodo di osservazione e la teoria del moto della terra. Il suo punteggio era 31'20. Oggi sappiamo che il diametro della Luna varia da 29'20 a 34'6, a seconda della distanza dalla Terra. Tolomeo usava pochi dati nei suoi calcoli, ma aveva tutte le ragioni per credere che fossero accurati.

Eisenhart scrive: “Bisogna tenere presente che il rapporto tra osservazione e teoria nell'antichità era diverso da quello che è oggi. I risultati delle osservazioni sono stati intesi non come fatti a cui la teoria dovrebbe essere adeguata, ma come casi concreti che possono essere utili solo come esempi illustrativi della verità della teoria.

Alla fine, gli scienziati si rivolgeranno a misurazioni rappresentative dei dati, ma inizialmente né i mezzi né le mediane sono stati utilizzati in questo ruolo. Dall'antichità ai giorni nostri, un altro concetto matematico è stato utilizzato come mezzo rappresentativo: la mezza somma dei valori estremi.

Mezza somma di valori estremi

Nuovi strumenti scientifici nascono quasi sempre dalla necessità di risolvere un certo problema in qualche disciplina. La necessità di trovare il valore migliore tra molte misurazioni è nata dall'esigenza di determinare con precisione la posizione geografica.

Il gigante intellettuale dell'XI secolo Al-Biruni è conosciuto come una delle prime persone a utilizzare la metodologia dei significati rappresentativi. Al-Biruni scriveva che quando aveva a disposizione molte misure e voleva trovarne la migliore, usava la seguente "regola": bisogna trovare un numero corrispondente alla metà tra due valori estremi. Quando si calcola la metà della somma dei valori estremi, non vengono presi in considerazione tutti i numeri compresi tra i valori massimo e minimo, ma viene trovata solo la media di questi due numeri.

Al-Biruni ha applicato questo metodo in vari campi, incluso il calcolo della longitudine della città di Ghazni, che si trova sul territorio dell'Afghanistan moderno, nonché nei suoi studi sulle proprietà dei metalli.

Tuttavia, negli ultimi secoli, la metà della somma degli estremi è stata utilizzata sempre meno. In effetti, nella scienza moderna, non è affatto rilevante. Il valore mediano ha sostituito la mezza somma.

Transizione alle medie

All'inizio del XIX secolo, l'uso della mediana/media era diventato un metodo comune per trovare il valore rappresentativo più accuratamente da un gruppo di dati. Friedrich von Gauss, eminente matematico del suo tempo, scrisse nel 1809: “Si credeva che se un certo numero fosse determinato da diverse osservazioni dirette fatte nelle stesse condizioni, allora la media aritmetica fosse il valore più vero. Se non è del tutto rigoroso, almeno è vicino alla realtà, e quindi ci si può sempre fare affidamento.

Perché c'è stato un tale cambiamento nella metodologia?

È piuttosto difficile rispondere a questa domanda. Nella sua ricerca, Churchill Eisenhart suggerisce che il metodo per trovare la media aritmetica potrebbe aver avuto origine nel campo della misurazione della deviazione magnetica, cioè nel trovare la differenza tra la direzione dell'ago della bussola che punta a nord e il nord reale. Questa misurazione era estremamente importante durante l'Era della Scoperta.

Eisenhart scoprì che fino alla fine del XVI secolo la maggior parte degli scienziati che misuravano la deviazione magnetica utilizzava il metodo ad hoc (dal latino "a questo, per questa occasione, per questo scopo") nella scelta della misurazione più accurata.

Ma nel 1580, lo scienziato William Borough affrontò il problema in modo diverso. Ha preso otto diverse misurazioni della deflessione e le ha confrontate, e ha concluso che la lettura più accurata era compresa tra 11 ⅓ e 11 ¼ gradi. Probabilmente ha calcolato la media aritmetica, che era in questo intervallo. Tuttavia, lo stesso Borough non ha chiamato apertamente il suo approccio il nuovo metodo.

Prima del 1635 non c'erano casi inequivocabili di utilizzo del valore medio come numero rappresentativo. Tuttavia, fu allora che l'astronomo inglese Henry Gellibrand effettuò due diverse misurazioni della deflessione magnetica. Uno è stato fatto al mattino (11 gradi) e l'altro al pomeriggio (11 gradi e 32 minuti). Calcolando il valore più vero, scrisse:

"Se troviamo la media aritmetica, possiamo dire con alta probabilità che il risultato di una misurazione accurata dovrebbe essere di circa 11 gradi e 16 minuti".

È probabile che questa sia stata la prima volta che la media è stata utilizzata come la più vicina al vero!

La parola "media" era usata in inglese all'inizio del XVI secolo per riferirsi alle perdite finanziarie dovute ai danni subiti da una nave o da un carico durante un viaggio. Per i successivi cento anni denotò proprio queste perdite, che furono calcolate come media aritmetica. Ad esempio, se una nave è stata danneggiata durante un viaggio e l'equipaggio ha dovuto gettare delle merci fuori bordo per risparmiare peso della nave, gli investitori hanno subito una perdita finanziaria equivalente all'importo del loro investimento: queste perdite sono state calcolate allo stesso modo del Media aritmetica. Quindi gradualmente i valori della media (media) e della media aritmetica convergevano.

Valore mediano

Oggi, la media o media aritmetica viene utilizzata come metodo principale per selezionare un valore rappresentativo di un insieme di misurazioni. Come è successo? Perché questo ruolo non è stato assegnato al valore mediano?

Francis Galton era il campione mediano

Il termine "valore mediano" (mediana) - il termine medio in una serie di numeri, che divide questa serie per metà - è apparso all'incirca nello stesso momento della media aritmetica. Nel 1599, il matematico Edward Wright, che stava lavorando al problema della deviazione normale in una bussola, suggerì per la prima volta di utilizzare il valore mediano.

“... Diciamo che molti arcieri sparano a qualche bersaglio. Il bersaglio viene successivamente rimosso. Come scoprire dove si trovava l'obiettivo? Devi trovare il punto intermedio tra tutte le frecce. Allo stesso modo, tra l'insieme dei risultati delle osservazioni, il più vicino alla verità sarà quello nel mezzo.

La mediana è stata ampiamente utilizzata nell'Ottocento, diventando una parte indispensabile di qualsiasi analisi dei dati dell'epoca. Fu usato anche da Francis Galton, l'eminente analista del diciannovesimo secolo. Nella storia della pesatura del toro all'inizio di questo articolo, Galton originariamente usava la mediana per rappresentare l'opinione della folla.

Molti analisti, incluso Galton, hanno preferito la mediana perché è più facile da calcolare per set di dati più piccoli.

Tuttavia, la mediana non è mai stata più popolare della media. Molto probabilmente, ciò è accaduto a causa delle speciali proprietà statistiche inerenti al valore medio, nonché alla sua relazione con la distribuzione normale.

Relazione tra distribuzione media e normale

Quando prendiamo molte misurazioni, i risultati sono, come dicono gli statistici, "normalmente distribuiti". Ciò significa che se questi dati vengono tracciati su un grafico, i punti su di esso rappresenteranno qualcosa di simile a una campana. Se li colleghi, ottieni una curva "a campana". Molte statistiche si adattano alla distribuzione normale, come l'altezza delle persone, il QI e la temperatura annuale più alta.

Quando i dati sono distribuiti normalmente, la media sarà molto vicina al punto più alto della curva a campana e un numero molto elevato di misurazioni sarà vicino alla media. C'è anche una formula che prevede quante misurazioni saranno a una certa distanza dalla media.

Pertanto, il calcolo della media fornisce ai ricercatori molte informazioni aggiuntive.

Il rapporto tra la media e la deviazione standard gli dà un grande vantaggio, perché la mediana non ha tale relazione. Questa connessione è una parte importante dell'analisi dei dati sperimentali e dell'elaborazione statistica delle informazioni. Ecco perché la media è diventata il fulcro della statistica e di tutte le scienze che si basano su più dati per le loro conclusioni.

Il vantaggio della media è anche dovuto al fatto che è facilmente calcolabile dai computer. Sebbene il valore mediano per un piccolo gruppo di dati sia abbastanza facile da calcolare da soli, è molto più facile scrivere un programma per computer che trovi il valore medio. Se usi Microsoft Excel, probabilmente sai che la funzione mediana non è facile da calcolare come la funzione del valore medio.

Di conseguenza, per il suo grande valore scientifico e facilità d'uso, il valore medio è diventato il principale valore rappresentativo. Tuttavia, questa opzione non è sempre la migliore.

Vantaggi del valore mediano

In molti casi in cui si vuole calcolare il centro di una distribuzione, la mediana è la misura migliore. Questo perché il valore medio è in gran parte determinato dalle misurazioni estreme.

Molti analisti ritengono che l'uso sconsiderato della media influisca negativamente sulla nostra comprensione delle informazioni quantitative. Le persone guardano alla media e pensano che sia "normale". Ma in effetti può essere definito da qualche termine che si distingue fortemente dalla serie omogenea.

Immagina un analista che voglia conoscere un valore rappresentativo per il valore di cinque case. Quattro case valgono $ 100.000 e la quinta è $ 900.000. La media sarebbe quindi di $ 200.000 e la mediana sarebbe di $ 100.000. In questo, come in molti altri casi, il valore mediano dà una migliore comprensione di quello che può essere definito uno "standard".

Comprendendo come i valori estremi possono influenzare la media, il valore mediano viene utilizzato per riflettere le variazioni del reddito delle famiglie statunitensi.

La mediana è anche meno sensibile ai dati "sporchi" di cui si occupano oggi gli analisti. Molti statistici e analisti raccolgono informazioni intervistando persone su Internet. Se l'utente aggiunge accidentalmente uno zero extra alla risposta, che trasforma 100 in 1000, questo errore influenzerà la media molto più della mediana.

Media o mediana?

La scelta tra la mediana e la media ha implicazioni di vasta portata, dalla nostra comprensione degli effetti dei farmaci sulla salute alla nostra conoscenza di quale sia il budget standard di una famiglia.

Poiché la raccolta e l'analisi dei dati determina sempre più il modo in cui comprendiamo il mondo, così fa anche il valore delle quantità che utilizziamo. In un mondo ideale, gli analisti userebbero sia la media che la mediana per tracciare i dati.

Ma viviamo in condizioni di tempo e attenzione limitati. A causa di queste limitazioni, spesso dobbiamo sceglierne solo uno. E in molti casi è preferibile il valore mediano.

CATEGORIE

ARTICOLI POPOLARI

2022 "kingad.ru" - esame ecografico di organi umani