Desviación estadística. Estimación de la varianza, desviación estándar.

En pruebas estadísticas de hipótesis, al medir una relación lineal entre variables aleatorias.

Desviación Estándar:

Desviación Estándar(estimación de la desviación estándar de la variable aleatoria Piso, las paredes que nos rodean y el techo, X en relación con su expectativa matemática basada en una estimación insesgada de su varianza):

¿Dónde está la dispersión? - El suelo, las paredes que nos rodean y el techo, iº elemento de la selección; - tamaño de la muestra; - media aritmética de la muestra:

Cabe señalar que ambas estimaciones están sesgadas. En el caso general, es imposible elaborar una estimación insesgada. Sin embargo, la estimación basada en la estimación de la varianza insesgada es consistente.

regla tres sigma

regla tres sigma(): casi todos los valores de una variable aleatoria distribuida normalmente se encuentran en el intervalo. Más estrictamente, con al menos un 99,7% de confianza, el valor de una variable aleatoria distribuida normalmente se encuentra en el intervalo especificado (siempre que el valor sea verdadero y no se obtenga como resultado del procesamiento de la muestra).

Si se desconoce el valor real, entonces no deberíamos utilizarlo, sino el suelo, las paredes que nos rodean y el techo. s. Así, la regla de tres sigma se transforma en regla de tres Piso, paredes que nos rodean y techo, s .

Interpretación del valor de la desviación estándar.

Un valor grande de la desviación estándar muestra una gran dispersión de valores en el conjunto presentado con el valor promedio del conjunto; En consecuencia, un valor pequeño muestra que los valores del conjunto están agrupados alrededor del valor medio.

Por ejemplo, tenemos tres conjuntos de números: (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8). Los tres conjuntos tienen valores medios iguales a 7 y desviaciones estándar, respectivamente, iguales a 7, 5 y 1. El último conjunto tiene una desviación estándar pequeña, ya que los valores del conjunto se agrupan alrededor del valor medio; el primer conjunto tiene el valor de desviación estándar más grande: los valores dentro del conjunto difieren mucho del valor promedio.

En sentido general, la desviación estándar puede considerarse una medida de incertidumbre. Por ejemplo, en física, la desviación estándar se utiliza para determinar el error de una serie de mediciones sucesivas de alguna cantidad. Este valor es muy importante para determinar la plausibilidad del fenómeno en estudio en comparación con el valor predicho por la teoría: si el valor promedio de las mediciones difiere mucho de los valores predichos por la teoría (gran desviación estándar), luego se deben volver a verificar los valores obtenidos o el método para obtenerlos.

Uso práctico

En la práctica, la desviación estándar le permite determinar cuánto pueden diferir los valores de un conjunto del valor promedio.

Clima

Supongamos que hay dos ciudades con la misma temperatura máxima diaria promedio, pero una está ubicada en la costa y la otra en el interior. Se sabe que las ciudades ubicadas en la costa tienen muchas temperaturas máximas diurnas diferentes que son más bajas que las ciudades ubicadas en el interior. Por lo tanto, la desviación estándar de las temperaturas máximas diarias para una ciudad costera será menor que para la segunda ciudad, a pesar de que el valor promedio de este valor es el mismo, lo que en la práctica significa que la probabilidad de que la temperatura máxima del aire en cualquier día del año será mayor que el valor medio, mayor para una ciudad situada en el interior.

Deporte

Supongamos que hay varios equipos de fútbol que se clasifican según algún conjunto de parámetros, por ejemplo, el número de goles marcados y concedidos, oportunidades de gol, etc. Lo más probable es que el mejor equipo de este grupo tenga mejores valores. en más parámetros. Cuanto menor sea la desviación estándar del equipo para cada uno de los parámetros presentados, más predecible será el resultado del equipo; dichos equipos están equilibrados. Por otro lado, un equipo con una desviación estándar grande es difícil de predecir el resultado, lo que a su vez se explica por un desequilibrio, por ejemplo, una defensa fuerte pero un ataque débil.

El uso de la desviación estándar de los parámetros del equipo permite, en un grado u otro, predecir el resultado de un partido entre dos equipos, evaluando las fortalezas y debilidades de los equipos y, por lo tanto, los métodos de lucha elegidos.

Análisis técnico

ver también

Literatura

* Borovikov, V. ESTADÍSTICAS. El arte del análisis de datos en una computadora: para profesionales / V. Borovikov. - San Petersburgo. : Pedro, 2003. - 688 p. -ISBN 5-272-00078-1.

Un método aproximado para evaluar la variabilidad de una serie de variaciones es determinar el límite y la amplitud, pero no se tienen en cuenta los valores de la variante dentro de la serie. La principal medida generalmente aceptada de la variabilidad de una característica cuantitativa dentro de una serie de variación es desviación estándar (σ - sigma). Cuanto mayor sea la desviación estándar, mayor será el grado de fluctuación de esta serie.

El método para calcular la desviación estándar incluye los siguientes pasos:

1. Encuentra la media aritmética (M).

2. Determine las desviaciones de las opciones individuales de la media aritmética (d=V-M). En estadística médica, las desviaciones del promedio se designan como d (desviación). La suma de todas las desviaciones es cero.

3. Eleva al cuadrado cada desviación d 2.

4. Multiplica los cuadrados de las desviaciones por las frecuencias correspondientes d 2 *p.

5. Encuentra la suma de los productos å(d 2 *p)

6. Calcule la desviación estándar usando la fórmula:

Cuando n es mayor que 30, o cuando n es menor o igual a 30, donde n es el número de todas las opciones.

Valor de desviación estándar:

1. La desviación estándar caracteriza la dispersión de la variante en relación con el valor promedio (es decir, la variabilidad de la serie de variación). Cuanto mayor sea la sigma, mayor será el grado de diversidad de esta serie.

2. La desviación estándar se utiliza para una evaluación comparativa del grado de correspondencia de la media aritmética con la serie de variación para la cual fue calculada.

Las variaciones de los fenómenos de masas obedecen a la ley de distribución normal. La curva que representa esta distribución parece una curva simétrica suave en forma de campana (curva gaussiana). Según la teoría de la probabilidad, en los fenómenos que obedecen a la ley de distribución normal, existe una estricta relación matemática entre los valores de la media aritmética y la desviación estándar. La distribución teórica de una variante en una serie de variación homogénea obedece a la regla de tres sigma.

Si en un sistema de coordenadas rectangulares los valores de una característica cuantitativa (variantes) se trazan en el eje de abscisas y la frecuencia de aparición de una variante en una serie de variaciones se traza en el eje de ordenadas, entonces las variantes con mayor y menor los valores están ubicados uniformemente a los lados de la media aritmética.



Se ha establecido que con una distribución normal del rasgo:

El 68,3% de los valores de las variantes están dentro de M±1s.

El 95,5% de los valores de las variantes están dentro de M±2s.

El 99,7% de los valores de las variantes están dentro de M±3s.

3. La desviación estándar permite establecer valores normales de parámetros clínicos y biológicos. En medicina, el intervalo M±1s suele tomarse como el rango normal para el fenómeno en estudio. La desviación del valor estimado de la media aritmética en más de 1 segundo indica una desviación del parámetro estudiado de la norma.

4. En medicina, la regla de los tres sigma se utiliza en pediatría para la evaluación individual del nivel de desarrollo físico de los niños (método de desviación sigma), para el desarrollo de estándares para la ropa de los niños.

5. La desviación estándar es necesaria para caracterizar el grado de diversidad de la característica en estudio y calcular el error de la media aritmética.

El valor de la desviación estándar se suele utilizar para comparar la variabilidad de series del mismo tipo. Si se comparan dos series con características diferentes (altura y peso, duración media del tratamiento hospitalario y mortalidad hospitalaria, etc.), es imposible una comparación directa de los tamaños sigma. , porque La desviación estándar es un valor con nombre expresado en números absolutos. En estos casos, utilice coeficiente de variación (Cv), que es un valor relativo: la relación porcentual entre la desviación estándar y la media aritmética.

El coeficiente de variación se calcula mediante la fórmula:

Cuanto mayor sea el coeficiente de variación , cuanto mayor sea la variabilidad de esta serie. Se cree que un coeficiente de variación superior al 30% indica la heterogeneidad cualitativa de la población.

En pruebas estadísticas de hipótesis, al medir una relación lineal entre variables aleatorias.

Desviación Estándar:

Desviación Estándar(estimación de la desviación estándar de la variable aleatoria Piso, las paredes que nos rodean y el techo, X en relación con su expectativa matemática basada en una estimación insesgada de su varianza):

¿Dónde está la dispersión? - El suelo, las paredes que nos rodean y el techo, iº elemento de la selección; - tamaño de la muestra; - media aritmética de la muestra:

Cabe señalar que ambas estimaciones están sesgadas. En el caso general, es imposible elaborar una estimación insesgada. Sin embargo, la estimación basada en la estimación de la varianza insesgada es consistente.

regla tres sigma

regla tres sigma(): casi todos los valores de una variable aleatoria distribuida normalmente se encuentran en el intervalo. Más estrictamente, con al menos un 99,7% de confianza, el valor de una variable aleatoria distribuida normalmente se encuentra en el intervalo especificado (siempre que el valor sea verdadero y no se obtenga como resultado del procesamiento de la muestra).

Si se desconoce el valor real, entonces no deberíamos utilizarlo, sino el suelo, las paredes que nos rodean y el techo. s. Así, la regla de tres sigma se transforma en regla de tres Piso, paredes que nos rodean y techo, s .

Interpretación del valor de la desviación estándar.

Un valor grande de la desviación estándar muestra una gran dispersión de valores en el conjunto presentado con el valor promedio del conjunto; En consecuencia, un valor pequeño muestra que los valores del conjunto están agrupados alrededor del valor medio.

Por ejemplo, tenemos tres conjuntos de números: (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8). Los tres conjuntos tienen valores medios iguales a 7 y desviaciones estándar, respectivamente, iguales a 7, 5 y 1. El último conjunto tiene una desviación estándar pequeña, ya que los valores del conjunto se agrupan alrededor del valor medio; el primer conjunto tiene el valor de desviación estándar más grande: los valores dentro del conjunto difieren mucho del valor promedio.

En sentido general, la desviación estándar puede considerarse una medida de incertidumbre. Por ejemplo, en física, la desviación estándar se utiliza para determinar el error de una serie de mediciones sucesivas de alguna cantidad. Este valor es muy importante para determinar la plausibilidad del fenómeno en estudio en comparación con el valor predicho por la teoría: si el valor promedio de las mediciones difiere mucho de los valores predichos por la teoría (gran desviación estándar), luego se deben volver a verificar los valores obtenidos o el método para obtenerlos.

Uso práctico

En la práctica, la desviación estándar le permite determinar cuánto pueden diferir los valores de un conjunto del valor promedio.

Clima

Supongamos que hay dos ciudades con la misma temperatura máxima diaria promedio, pero una está ubicada en la costa y la otra en el interior. Se sabe que las ciudades ubicadas en la costa tienen muchas temperaturas máximas diurnas diferentes que son más bajas que las ciudades ubicadas en el interior. Por lo tanto, la desviación estándar de las temperaturas máximas diarias para una ciudad costera será menor que para la segunda ciudad, a pesar de que el valor promedio de este valor es el mismo, lo que en la práctica significa que la probabilidad de que la temperatura máxima del aire en cualquier día del año será mayor que el valor medio, mayor para una ciudad situada en el interior.

Deporte

Supongamos que hay varios equipos de fútbol que se clasifican según algún conjunto de parámetros, por ejemplo, el número de goles marcados y concedidos, oportunidades de gol, etc. Lo más probable es que el mejor equipo de este grupo tenga mejores valores. en más parámetros. Cuanto menor sea la desviación estándar del equipo para cada uno de los parámetros presentados, más predecible será el resultado del equipo; dichos equipos están equilibrados. Por otro lado, un equipo con una desviación estándar grande es difícil de predecir el resultado, lo que a su vez se explica por un desequilibrio, por ejemplo, una defensa fuerte pero un ataque débil.

El uso de la desviación estándar de los parámetros del equipo permite, en un grado u otro, predecir el resultado de un partido entre dos equipos, evaluando las fortalezas y debilidades de los equipos y, por lo tanto, los métodos de lucha elegidos.

Análisis técnico

ver también

Literatura

* Borovikov, V. ESTADÍSTICAS. El arte del análisis de datos en una computadora: para profesionales / V. Borovikov. - San Petersburgo. : Pedro, 2003. - 688 p. -ISBN 5-272-00078-1.

Según la encuesta por muestreo, los depositantes se agruparon según el tamaño de su depósito en el Sberbank de la ciudad:

Definir:

1) alcance de la variación;

2) tamaño promedio de los depósitos;

3) desviación lineal promedio;

4) dispersión;

5) desviación estándar;

6) coeficiente de variación de las cotizaciones.

Solución:

Esta serie de distribución contiene intervalos abiertos. En tales series, se supone convencionalmente que el valor del intervalo del primer grupo es igual al valor del intervalo del siguiente, y que el valor del intervalo del último grupo es igual al valor del intervalo del el anterior.

El valor del intervalo del segundo grupo es igual a 200, por lo tanto, el valor del primer grupo también es igual a 200. El valor del intervalo del penúltimo grupo es igual a 200, lo que significa que el último intervalo también tiene un valor de 200.

1) Definamos el rango de variación como la diferencia entre el valor mayor y menor del atributo:

El rango de variación en el tamaño del depósito es de 1000 rublos.

2) El tamaño promedio de la contribución se determinará utilizando la fórmula del promedio aritmético ponderado.

Primero determinemos el valor discreto del atributo en cada intervalo. Para ello, utilizando la fórmula de la media aritmética simple, encontramos los puntos medios de los intervalos.

El valor medio del primer intervalo será:

el segundo - 500, etc.

Ingresemos los resultados del cálculo en la tabla:

Monto del depósito, frote.Número de depositantes, fMitad del intervalo, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

El depósito medio en el Sberbank de la ciudad será de 780 rublos:

3) La desviación lineal promedio es la media aritmética de las desviaciones absolutas de los valores individuales de una característica del promedio general:

El procedimiento para calcular la desviación lineal promedio en la serie de distribución de intervalos es el siguiente:

1. Se calcula la media aritmética ponderada, como se indica en el apartado 2).

2. Las desviaciones absolutas de la media se determinan:

3. Las desviaciones resultantes se multiplican por frecuencias:

4. Calcula la suma de las desviaciones ponderadas sin tener en cuenta el signo:

5. La suma de las desviaciones ponderadas se divide por la suma de frecuencias:

Es conveniente utilizar la tabla de datos de cálculo:

Monto del depósito, frote.Número de depositantes, fMitad del intervalo, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

La desviación lineal promedio del tamaño del depósito de los clientes de Sberbank es de 203,2 rublos.

4) La dispersión es la media aritmética de las desviaciones al cuadrado de cada valor de atributo de la media aritmética.

El cálculo de la varianza en una serie de distribución de intervalos se realiza mediante la fórmula:

El procedimiento para calcular la varianza en este caso es el siguiente:

1. Determine la media aritmética ponderada, como se muestra en el párrafo 2).

2. Encuentre desviaciones del promedio:

3. Eleva al cuadrado la desviación de cada opción del promedio:

4. Multiplicar los cuadrados de las desviaciones por los pesos (frecuencias):

5. Resuma los productos resultantes:

6. La cantidad resultante se divide por la suma de los pesos (frecuencias):

Pongamos los cálculos en una tabla:

Monto del depósito, frote.Número de depositantes, fMitad del intervalo, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000

Instrucciones

Sean varios números que caractericen cantidades homogéneas. Por ejemplo, los resultados de mediciones, pesajes, observaciones estadísticas, etc. Todas las cantidades presentadas deben medirse utilizando la misma medida. Para encontrar la desviación estándar, haga lo siguiente:

Determinar la media aritmética de todos los números: sumar todos los números y dividir la suma por el número total de números.

Determine la dispersión (dispersión) de números: sume los cuadrados de las desviaciones encontradas anteriormente y divida la suma resultante por el número de números.

Hay siete pacientes en la sala con temperaturas de 34, 35, 36, 37, 38, 39 y 40 grados centígrados.

Se requiere determinar la desviación promedio de la media.
Solución:
“en la sala”: (34+35+36+37+38+39+40)/7=37 ºС;

Desviaciones de temperatura del promedio (en este caso, el valor normal): 34-37, 35-37, 36-37, 37-37, 38-37, 39-37, 40-37, lo que da como resultado: -3, - 2, -1 , 0, 1, 2, 3 (ºС);

Divide la suma de los números obtenidos anteriormente por su número. Para cálculos precisos, es mejor utilizar una calculadora. El resultado de la división es la media aritmética de los números sumados.

Preste atención a todas las etapas del cálculo, ya que un error incluso en uno de los cálculos conducirá a un indicador final incorrecto. Verifique sus cálculos en cada etapa. El promedio aritmético tiene el mismo medidor que los números sumados, es decir, si determinas la asistencia promedio, entonces todos tus indicadores serán "personas".

Este método de cálculo se utiliza únicamente en cálculos matemáticos y estadísticos. Por ejemplo, la media aritmética en informática tiene un algoritmo de cálculo diferente. La media aritmética es un indicador muy relativo. Muestra la probabilidad de un evento, siempre que tenga un solo factor o indicador. Para realizar un análisis más profundo, se deben tener en cuenta muchos factores. Para ello se utiliza el cálculo de cantidades más generales.

La media aritmética es una de las medidas de tendencia central, muy utilizada en matemáticas y cálculos estadísticos. Encontrar la media aritmética de varios valores es muy sencillo, pero cada tarea tiene sus propios matices, que simplemente es necesario conocer para realizar los cálculos correctos.

Resultados cuantitativos de experimentos similares.

Cómo encontrar la media aritmética

Para encontrar la media aritmética de una serie de números se debe comenzar determinando la suma algebraica de estos valores. Por ejemplo, si la matriz contiene los números 23, 43, 10, 74 y 34, entonces su suma algebraica será igual a 184. Al escribir, la media aritmética se denota con la letra μ (mu) o x (x con una bar). A continuación, la suma algebraica debe dividirse por la cantidad de números en la matriz. En el ejemplo considerado había cinco números, por lo que la media aritmética será igual a 184/5 y será 36,8.

Características de trabajar con números negativos.

Si la matriz contiene números negativos, entonces la media aritmética se encuentra utilizando un algoritmo similar. La diferencia sólo existe cuando se calcula en el entorno de programación, o si el problema tiene condiciones adicionales. En estos casos, encontrar la media aritmética de números con diferentes signos se reduce a tres pasos:

1. Encontrar la media aritmética general utilizando el método estándar;
2. Encontrar la media aritmética de números negativos.
3. Cálculo de la media aritmética de números positivos.

Las respuestas para cada acción se escriben separadas por comas.

Fracciones naturales y decimales

Si una matriz de números se representa mediante fracciones decimales, la solución se lleva a cabo utilizando el método de cálculo de la media aritmética de números enteros, pero el resultado se reduce de acuerdo con los requisitos de la tarea en cuanto a la precisión de la respuesta.

Cuando se trabaja con fracciones naturales, se deben reducir a un denominador común, que se multiplica por la cantidad de números en la matriz. El numerador de la respuesta será la suma de los numeradores dados de los elementos fraccionarios originales.

CATEGORÍAS

ARTICULOS POPULARES

2023 “kingad.ru” - examen por ultrasonido de órganos humanos