Construyamos un intervalo de confianza en MS EXCEL para estimar el valor medio de la distribución en el caso de un valor de dispersión conocido.

Por supuesto la elección nivel de confianza Depende completamente del problema que se resuelva. Por tanto, el grado de confianza de un pasajero aéreo en la fiabilidad de un avión debería ser sin duda mayor que el grado de confianza de un comprador en la fiabilidad de una bombilla eléctrica.

Formulación del problema

Supongamos que desde población habiendo sido tomado muestra tamaño n. Se asume que Desviación Estándar esta distribución es conocida. Es necesario en base a esto muestras evaluar lo desconocido media de distribución(μ, ) y construir el correspondiente doble cara intervalo de confianza.

Punto estimado

Como se sabe de Estadísticas(denotémoslo X promedio) es estimación insesgada de la media este población y tiene una distribución N(μ;σ 2 /n).

Nota: Qué hacer si necesitas construir intervalo de confianza en el caso de una distribución que no es ¿normal? En este caso viene al rescate quien afirma que con un tamaño suficientemente grande muestras n de distribución no ser normal, distribución muestral de estadísticas X promedio voluntad aproximadamente corresponder distribución normal con parámetros N(μ;σ 2 /n).

Entonces, punto estimado promedio valores de distribución tenemos - esto muestra promedio, es decir. X promedio. Ahora comencemos intervalo de confianza.

Construyendo un intervalo de confianza

Normalmente, conociendo la distribución y sus parámetros, podemos calcular la probabilidad de que la variable aleatoria tome un valor del intervalo que especificamos. Ahora hagamos lo contrario: encuentre el intervalo en el que caerá la variable aleatoria con una probabilidad dada. Por ejemplo, de las propiedades distribución normal Se sabe que con una probabilidad del 95%, una variable aleatoria distribuida sobre ley normal, estará dentro del rango de aproximadamente +/- 2 desde valor promedio(ver artículo sobre). Este intervalo nos servirá de prototipo. intervalo de confianza.

Ahora veamos si conocemos la distribución. , calcular este intervalo? Para responder a la pregunta debemos indicar la forma de la distribución y sus parámetros.

Conocemos la forma de distribución: esto es distribución normal(recuerda que estamos hablando de distribución muestral Estadísticas X promedio).

El parámetro μ nos es desconocido (solo es necesario estimarlo usando intervalo de confianza), pero tenemos una estimación del mismo X promedio, calculado en base a muestras, que se puede utilizar.

Segundo parámetro - desviación estándar de la media muestral lo daremos por conocido, es igual a σ/√n.

Porque no sabemos μ, entonces construiremos el intervalo +/- 2 desviaciones estandar no de valor promedio, y de su estimación conocida X promedio. Aquellos. al calcular intervalo de confianza NO asumiremos que X promedio cae dentro del rango +/- 2 desviaciones estandar de μ con una probabilidad del 95%, y asumiremos que el intervalo es +/- 2 desviaciones estandar de X promedio con 95% de probabilidad cubrirá μ – promedio de la población general, de donde se toma muestra. Estas dos afirmaciones son equivalentes, pero la segunda nos permite construir intervalo de confianza.

Además, aclaremos el intervalo: una variable aleatoria distribuida en ley normal, con un 95% de probabilidad cae dentro del intervalo +/- 1,960 desviaciones estandar, no +/- 2 desviaciones estandar. Esto se puede calcular usando la fórmula =REV.EST.NORM((1+0.95)/2), cm. archivo de ejemplo Intervalo de hoja.

Ahora podemos formular un enunciado probabilístico que nos servirá para formar intervalo de confianza:
"La probabilidad de que media poblacional ubicado desde promedio de la muestra dentro de 1.960 " desviaciones estándar de la media muestral", igual al 95%".

El valor de probabilidad mencionado en la declaración tiene un nombre especial. , que está asociado con nivel de significancia α (alfa) mediante una expresión simple nivel de confianza =1 . En nuestro caso Nivel significativo α =1-0,95=0,05 .

Ahora, basándonos en este enunciado probabilístico, escribimos una expresión para calcular intervalo de confianza:

donde Z α/2 estándar distribución normal(este valor de la variable aleatoria z, Qué PAG(z>=Zα/2 )=α/2).

Nota: Cuantil α/2 superior define el ancho intervalo de confianza V desviaciones estandar muestra promedio. Cuantil α/2 superior estándar distribución normal siempre mayor que 0, lo cual es muy conveniente.

En nuestro caso, con α=0,05, cuantil α/2 superior es igual a 1,960. Para otros niveles de significancia α (10%; 1%) cuantil α/2 superior Zα/2 se puede calcular usando la fórmula =NORM.ST.REV(1-α/2) o, si se conoce nivel de confianza, =NORM.ST.OBR((1+nivel de confianza)/2).

Generalmente al construir intervalos de confianza para estimar la media Usar unicamente α superior/2-cuantil y no usar α inferior/2-cuantil. Esto es posible porque estándar distribución normal simétricamente respecto al eje x ( su densidad de distribución simétrico sobre promedio, es decir 0). Por lo tanto, no es necesario calcular cuantil α/2 inferior(simplemente se llama α /2-cuantil), porque es igual α superior/2-cuantil con un signo menos.

Recordemos que, a pesar de la forma de la distribución del valor x, la variable aleatoria correspondiente X promedio repartido aproximadamente Bien N(μ;σ 2 /n) (ver artículo sobre). Por lo tanto, en general, la expresión anterior para intervalo de confianza es sólo una aproximación. Si el valor x se distribuye entre ley normal N(μ;σ 2 /n), entonces la expresión para intervalo de confianza es preciso.

Cálculo del intervalo de confianza en MS EXCEL.

Resolvamos el problema.
El tiempo de respuesta de un componente electrónico a una señal de entrada es una característica importante del dispositivo. Un ingeniero quiere construir un intervalo de confianza para el tiempo de respuesta promedio con un nivel de confianza del 95%. Por experiencia previa, el ingeniero sabe que la desviación estándar del tiempo de respuesta es de 8 ms. Se sabe que para evaluar el tiempo de respuesta el ingeniero realizó 25 mediciones, el valor promedio fue de 78 ms.

Solución: Un ingeniero quiere saber el tiempo de respuesta de un dispositivo electrónico, pero entiende que el tiempo de respuesta no es un valor fijo, sino una variable aleatoria que tiene su propia distribución. Entonces, lo mejor que puede esperar es determinar los parámetros y la forma de esta distribución.

Desafortunadamente, a partir de las condiciones del problema no conocemos la forma de la distribución del tiempo de respuesta (no tiene por qué ser así). normal). , esta distribución también se desconoce. solo el es conocido Desviación Estándarσ=8. Por lo tanto, si bien no podemos calcular las probabilidades y construir intervalo de confianza.

Sin embargo, a pesar de que desconocemos la distribución tiempo respuesta separada, sabemos que según CPT, distribución muestral tiempo promedio de respuesta es aproximadamente normal(asumiremos que las condiciones CPT se llevan a cabo, porque tamaño muestras bastante grande (n=25)) .

Además, promedio esta distribución es igual a valor promedio distribución de una única respuesta, es decir µ. A Desviación Estándar de esta distribución (σ/√n) se puede calcular usando la fórmula =8/ROOT(25) .

También se sabe que el ingeniero recibió punto estimado parámetro μ igual a 78 ms (X avg). Por lo tanto, ahora podemos calcular probabilidades, porque conocemos la forma de distribución ( normal) y sus parámetros (X avg y σ/√n).

El ingeniero quiere saber valor esperado Distribuciones de tiempo de respuesta μ. Como se indicó anteriormente, este μ es igual a expectativa matemática de la distribución muestral del tiempo de respuesta promedio. si usamos distribución normal N(X avg; σ/√n), entonces el μ deseado estará en el rango +/-2*σ/√n con una probabilidad de aproximadamente el 95%.

Nivel significativo es igual a 1-0,95=0,05.

Finalmente, busquemos el borde izquierdo y derecho. intervalo de confianza.
Borde izquierdo: =78-REV.ST.NORM(1-0.05/2)*8/RAÍZ(25) = 74,864
Borde derecho: =78+INV.EST.NORM.(1-0.05/2)*8/RAÍZ(25)=81.136

Borde izquierdo: =REV.NORM(0.05/2; 78; 8/RAÍZ(25))
Borde derecho: =REV.NORM(1-0.05/2; 78; 8/RAÍZ(25))

Respuesta: intervalo de confianza en Nivel de confianza del 95% y σ=8mseg es igual 78+/-3,136 ms.

EN archivo de ejemplo en la hoja Sigma conocido, creó un formulario para el cálculo y la construcción. doble cara intervalo de confianza por arbitrario muestras con σ dado y nivel de significancia.

Función CONFIANZA.NORM()

Si los valores muestras están en el rango B20:B79 , A Nivel significativo igual a 0,05; luego la fórmula de MS EXCEL:
=PROMEDIO(B20:B79)-CONFIANZA.NORM(0.05;σ; CONTAR(B20:B79))
devolverá el borde izquierdo intervalo de confianza.

El mismo límite se puede calcular mediante la fórmula:
=PROMEDIO(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/RAÍZ(COUNT(B20:B79))

Nota: La función CONFIDENCE.NORM() apareció en MS EXCEL 2010. En versiones anteriores de MS EXCEL, se utilizaba la función TRUST().

Intervalo de confianza para la expectativa matemática - este es un intervalo calculado a partir de datos que, con una probabilidad conocida, contiene la expectativa matemática de la población general. Una estimación natural de la expectativa matemática es la media aritmética de sus valores observados. Por lo tanto, a lo largo de la lección usaremos los términos “promedio” y “valor promedio”. En los problemas de cálculo de un intervalo de confianza, la respuesta que con mayor frecuencia se requiere es algo así como "El intervalo de confianza del número promedio [valor en un problema particular] es de [valor menor] a [valor mayor]". Utilizando un intervalo de confianza, es posible evaluar no solo los valores promedio, sino también la proporción de una característica particular de la población general. En la lección se analizan los valores medios, la dispersión, la desviación estándar y el error, a través de los cuales llegaremos a nuevas definiciones y fórmulas. Características de la muestra y la población. .

Estimaciones puntuales y de intervalo de la media.

Si el valor promedio de la población se estima mediante un número (punto), entonces se toma como estimación del valor promedio desconocido de la población un promedio específico, que se calcula a partir de una muestra de observaciones. En este caso, el valor de la media muestral (una variable aleatoria) no coincide con el valor medio de la población general. Por lo tanto, al indicar la media muestral, se debe indicar simultáneamente el error muestral. La medida del error muestral es el error estándar, que se expresa en las mismas unidades que la media. Por lo tanto, se suele utilizar la siguiente notación: .

Si es necesario asociar la estimación del promedio con una cierta probabilidad, entonces el parámetro de interés en la población debe evaluarse no mediante un número, sino mediante un intervalo. Un intervalo de confianza es un intervalo en el que, con una cierta probabilidad PAG Se encuentra el valor del indicador de población estimada. Intervalo de confianza en el que es probable PAG = 1 - α Se encuentra la variable aleatoria, calculada de la siguiente manera:

,

α = 1 - PAG, que se puede encontrar en el apéndice de casi cualquier libro sobre estadística.

En la práctica, la media poblacional y la varianza no se conocen, por lo que la varianza poblacional se reemplaza por la varianza muestral y la media poblacional por la media muestral. Por tanto, el intervalo de confianza en la mayoría de los casos se calcula de la siguiente manera:

.

La fórmula del intervalo de confianza se puede utilizar para estimar la media poblacional si

  • se conoce la desviación estándar de la población;
  • o se desconoce la desviación estándar de la población, pero el tamaño de la muestra es mayor que 30.

La media muestral es una estimación insesgada de la media poblacional. A su vez, la varianza muestral no es una estimación insesgada de la varianza poblacional. Para obtener una estimación insesgada de la varianza poblacional en la fórmula de varianza muestral, el tamaño de la muestra norte debe ser reemplazado por norte-1.

Ejemplo 1. Se recopiló información de 100 cafés seleccionados al azar en una determinada ciudad de que el número promedio de empleados en ellos es 10,5 con una desviación estándar de 4,6. Determine el intervalo de confianza del 95% para el número de empleados de una cafetería.

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Así, el intervalo de confianza del 95% para el número medio de empleados de cafeterías osciló entre 9,6 y 11,4.

Ejemplo 2. Para una muestra aleatoria de una población de 64 observaciones, se calcularon los siguientes valores totales:

suma de valores en observaciones,

suma de desviaciones al cuadrado de valores de la media .

Calcule el intervalo de confianza del 95% para la expectativa matemática.

Calculemos la desviación estándar:

,

Calculemos el valor medio:

.

Sustituimos los valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

Así, el intervalo de confianza del 95% para la expectativa matemática de esta muestra osciló entre 7,484 y 11,266.

Ejemplo 3. Para una muestra de población aleatoria de 100 observaciones, la media calculada es 15,2 y la desviación estándar es 3,2. Calcule el intervalo de confianza del 95% para el valor esperado y luego el intervalo de confianza del 99%. Si el poder de la muestra y su variación permanecen sin cambios y el coeficiente de confianza aumenta, ¿se estrechará o ampliará el intervalo de confianza?

Sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

.

Así, el intervalo de confianza del 95% para la media de esta muestra osciló entre 14,57 y 15,82.

Nuevamente sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,01 .

Obtenemos:

.

Así, el intervalo de confianza del 99% para la media de esta muestra osciló entre 14,37 y 16,02.

Como vemos, a medida que aumenta el coeficiente de confianza, el valor crítico de la distribución normal estándar también aumenta y, en consecuencia, los puntos inicial y final del intervalo se ubican más lejos de la media y, por lo tanto, aumenta el intervalo de confianza para la expectativa matemática. .

Estimaciones puntuales y de intervalo de gravedad específica.

La proporción de algún atributo de la muestra se puede interpretar como una estimación puntual de la proporción. pag de la misma característica en la población general. Si es necesario asociar este valor con la probabilidad, entonces se debe calcular el intervalo de confianza de la gravedad específica. pag característica en la población con probabilidad PAG = 1 - α :

.

Ejemplo 4. En alguna ciudad hay dos candidatos. A Y B se postulan para alcalde. Se encuestó aleatoriamente a 200 vecinos de la ciudad, de los cuales el 46% respondió que votaría por el candidato A, 26% - para el candidato B y el 28% no sabe por quién votará. Determine el intervalo de confianza del 95% para la proporción de residentes de la ciudad que apoyan al candidato. A.

Intervalo de confianza– los valores límite de una cantidad estadística que, con una probabilidad de confianza dada γ, estarán en este intervalo al muestrear un volumen mayor. Se denota como P(θ - ε. En la práctica, la probabilidad de confianza γ se elige entre valores bastante cercanos a la unidad: γ = 0,9, γ = 0,95, γ = 0,99.

Objeto del servicio. Con este servicio, puede determinar:

  • intervalo de confianza para la media general, intervalo de confianza para la varianza;
  • intervalo de confianza para la desviación estándar, intervalo de confianza para la participación general;
La solución resultante se guarda en un archivo de Word (ver ejemplo). A continuación se muestra una instrucción en video sobre cómo completar los datos iniciales.

Ejemplo No. 1. En una granja colectiva, de un rebaño total de 1.000 ovejas, 100 fueron sometidas a una esquila de control selectiva. Como resultado se estableció un recorte de lana promedio de 4,2 kg por oveja. Determine con una probabilidad de 0,99 el error cuadrático medio de la muestra al determinar el esquileo promedio de lana por oveja y los límites dentro de los cuales se contiene el valor de esquileo si la varianza es 2,5. La muestra no es repetitiva.
Ejemplo No. 2. De un lote de productos importados en el puesto de Aduanas del Norte de Moscú, se tomaron 20 muestras del producto "A" mediante muestreo aleatorio repetido. Como resultado de la prueba se estableció el contenido de humedad promedio del producto “A” en la muestra, el cual resultó ser igual al 6% con una desviación estándar del 1%.
Determine con probabilidad 0.683 los límites del contenido de humedad promedio del producto en todo el lote de productos importados.
Ejemplo No. 3. Una encuesta de 36 estudiantes mostró que el número promedio de libros de texto leídos por ellos durante el año académico era igual a 6. Suponiendo que el número de libros de texto leídos por un estudiante por semestre tiene una ley de distribución normal con una desviación estándar igual a 6, encuentre : A) con una confiabilidad de 0,99 estimación de intervalo para la expectativa matemática de esta variable aleatoria; B) ¿Con qué probabilidad podemos decir que el número promedio de libros de texto leídos por un estudiante por semestre, calculado a partir de esta muestra, se desviará de la expectativa matemática en valor absoluto en no más de 2?

Clasificación de intervalos de confianza.

Por tipo de parámetro a evaluar:

Por tipo de muestra:

  1. Intervalo de confianza para una muestra infinita;
  2. Intervalo de confianza para la muestra final;
La muestra se llama remuestreo., si el objeto seleccionado se devuelve a la población antes de seleccionar el siguiente. La muestra se llama no repetida., si el objeto seleccionado no se devuelve a la población. En la práctica, normalmente trabajamos con muestras no repetitivas.

Cálculo del error muestral promedio para muestreo aleatorio.

La discrepancia entre los valores de los indicadores obtenidos de la muestra y los parámetros correspondientes de la población general se denomina error de representatividad.
Designaciones de los principales parámetros de la población general y muestral.

Matemáticas e informática. Guía de estudio para todo el curso.

Sea la variable aleatoria X de la población una distribución normal, teniendo en cuenta que se conocen la varianza y la desviación estándar s de esta distribución. Se requiere estimar la expectativa matemática desconocida utilizando la media muestral. En este caso, la tarea se reduce a encontrar un intervalo de confianza para la expectativa matemática con confiabilidad b. Si especifica el valor de la probabilidad de confianza (confiabilidad) b, entonces puede encontrar la probabilidad de caer en el intervalo para la expectativa matemática desconocida usando la fórmula (6.9a):

donde Ф(t) es la función de Laplace (5.17a).

Como resultado, podemos formular un algoritmo para encontrar los límites del intervalo de confianza de la expectativa matemática si se conoce la varianza D = s 2:

  1. Establezca el valor de confiabilidad – b.
  2. De (6.14) exprese Ф(t) = 0,5× b. Seleccione el valor de t de la tabla para la función de Laplace basándose en el valor Ф(t) (ver Apéndice 1).
  3. Calcule la desviación e usando la fórmula (6.10).
  4. Escriba un intervalo de confianza usando la fórmula (6.12) tal que con probabilidad b la desigualdad se cumpla:

.

Ejemplo 5.

La variable aleatoria X tiene una distribución normal. Encuentre intervalos de confianza para una estimación con confiabilidad b = 0,96 de la expectativa matemática desconocida a, si se da:

1) desviación estándar general s = 5;

2) promedio muestral;

3) tamaño de muestra n = 49.

En la fórmula (6.15) de la estimación de intervalo de la expectativa matemática A con confiabilidad b se conocen todas las cantidades excepto t. El valor de t se puede encontrar usando (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Usando la tabla del Apéndice 1 para la función de Laplace Ф(t) = 0,48, encuentre el valor correspondiente t = 2,06. Por eso, . Al sustituir el valor calculado de e en la fórmula (6.12), puede obtener un intervalo de confianza: 30-1,47< a < 30+1,47.

El intervalo de confianza requerido para una estimación con confiabilidad b = 0,96 de la expectativa matemática desconocida es igual a: 28,53< a < 31,47.

Fórmulas de error de muestreo promedio
reselecciónrepetir la selección
para promediopara compartirpara promediopara compartir
La relación entre el límite de error muestral (Δ) garantizado con cierta probabilidad Р(t), y el error de muestreo promedio tiene la forma: o Δ = t·μ, donde t– coeficiente de confianza, determinado en función del nivel de probabilidad P(t) según la tabla de la función integral de Laplace.

Fórmulas para calcular el tamaño de la muestra utilizando un método de muestreo puramente aleatorio.

Sea CB X la población general y sea β el parámetro desconocido CB X. Si la estimación estadística en * es consistente, cuanto mayor sea el tamaño de la muestra, con mayor precisión obtendremos el valor de β. Sin embargo, en la práctica no disponemos de muestras muy grandes, por lo que no podemos garantizar una mayor precisión.

Sea b* una estimación estadística de c. Valor |pulg* - pulg| se llama precisión de la estimación. Está claro que la precisión es CB, ya que β* es una variable aleatoria. Especifiquemos un pequeño número positivo 8 y exijamos que la precisión de la estimación |в* - в| era menor que 8, es decir | en* - en |< 8.

La confiabilidad g o probabilidad de confianza de una estimación en in * es la probabilidad g con la que se cumple la desigualdad |en * - en|< 8, т. е.

Normalmente, la confiabilidad g se especifica de antemano y se considera que g es un número cercano a 1 (0,9; 0,95; 0,99; ...).

Dado que la desigualdad |en * - en|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

El intervalo (en * - 8, en * + 5) se llama intervalo de confianza, es decir, el intervalo de confianza cubre el parámetro desconocido en con probabilidad y. Tenga en cuenta que los extremos del intervalo de confianza son aleatorios y varían de una muestra a otra, por lo que es más exacto decir que el intervalo (en * - 8, en * + 8) cubre el parámetro desconocido en, en lugar de pertenecer a este. intervalo.

Sea la población definida por una variable aleatoria X, distribuida según una ley normal, y se conoce la desviación estándar a. La incógnita es la expectativa matemática a = M (X). Se requiere encontrar el intervalo de confianza para a para una confiabilidad dada y.

Muestra promedio

es una estimación estadística para xr = a.

Teorema. Una variable aleatoria xB tiene una distribución normal si X tiene una distribución normal y M (XB) = a,

A (XB) = a, donde a = y/B (X), a = M (X). l/yo

El intervalo de confianza para a tiene la forma:

Encontramos 8.

Usando la proporción

donde Ф(r) es la función de Laplace, tenemos:

P ( | XB - a |<8} = 2Ф

tabla de valores de la función de Laplace encontramos el valor de t.

Habiendo designado

T, obtenemos F(t) = g Dado que g está dado, entonces por

De la igualdad encontramos que la estimación es exacta.

Esto significa que el intervalo de confianza para a tiene la forma:

Dada una muestra de la población X

ng A" X2 xm
norte. n1 n2 Nuevo Méjico

n = U1 + ... + nm, entonces el intervalo de confianza será:

Ejemplo 6.35. Encuentre el intervalo de confianza para estimar la expectativa matemática a de la distribución normal con una confiabilidad de 0.95, conociendo la media muestral Xb = 10.43, el tamaño de la muestra n = 100 y la desviación estándar s = 5.

Usemos la fórmula

CATEGORÍAS

ARTICULOS POPULARES

2023 “kingad.ru” - examen por ultrasonido de órganos humanos