Processing math: 100%

LaTex

martes, 8 de noviembre de 2016

Conceptos básicos para optometristas. 4/4

La distribución normal estándar.

La distribución normal estándar tiene una media de cero y una SD de 1 (se denota N(0,1)) y es la base de muchas pruebas estadísticas útiles. Por ejemplo, puede ser importante determinar si una observación x es un miembro típico o atípico de una población.

Una medida de un parámetro visual se hace en un individuo y se quiere determinar si este valor es típico de la población completa. Para hacer esta prueba, la observación original x tiene que convertirse para que sea parte de la distribución normal estándar Z, es decir Z=±(xμ)/σ.

Esta fórmula convierte a x, un miembro de la distribución original N(μ,σ), en miembro de Z, (N(0,1)). Las tablas de la distribución normal estándar pueden entonces ser usadas para determinar dónde está localizada z con respecto a su media, es decir, ¿cae cerca de la media de la distribución (valor típico), o lejos en una de las colas de la distribución (un valor atípico)?

Una cuestión importante es qué tan atípica tiene que ser la observación z antes de que consideremos que es atípica. Mediante la conversión, consideraremos a x un miembro típico de la población a menos que esté localizado en las colas de la distribución que incluye el 5% de los valores más extremos.

El valor de Z que separa los valores típicos (95% de la distribución) de los atípicos (5% de la distribución) es en realidad 1.96. Así, si nuestro valor calculado de z es igual o mayor que 1.96, consideraríamos el parámetro visual medido en el sujeto como atípico. Tales pruebas son útiles en un contexto clínico donde puede ser necesario juzgar si un parámetro visual medido en un paciente cae dentro o fuera del rango normal.

Variación de las medias muestrales.

En muchos estudios, las observaciones individuales pueden no ser de un interés supremo y puede ser que estemos más interesados en la media ˉx de una muestra de medidas.

Por ejemplo, quisiéramos determinar la presión intraocular de individuos de 80 años, mediríamos una muestra de unos 10 pacientes de esa edad, y reportamos la media de la muestra con su SD. Sin embargo, si repetimos el estudio con varios grupos de 10 personas de 80 años no necesariamente obtendríamos el mismo valor de la media, es decir, las medias de las muestras también muestran variabilidad.

En este caso queremos saber qué tan bien representa un estimado de la media muestral a la media poblacional. Contestar esta pregunta requiere del conocimiento de cómo varían las medias de una distribución normal.

Para entender este concepto, es necesario recurrir a un importante resultado estadístico llamado el Teorema del Límite Central. Este teorema establece que las medias de una distribución normal N(μ,σ) se distribuyen, ellas mismas, normalmente con media μ y SD σ/n, donde n es el número de observaciones de la muestra.

Además, las medias de distribuciones no normales se distribuirán normalmente si las muestras son lo suficientemente grandes. También es importante que la cantidad σ/n, la desviación estándar de la población de las medias muestrales o “error estándar de la media” se distinga de σ o s la SD de la población o la muestra de medidas individuales.

Intervalo de confianza para la media de una muestra.

El error estándar de la media puede ser usado para calcular el grado de error involucrado en estimar la media poblacional. Este error con frecuencia es graficado como un “intervalo de confianza” que indica el grado de confianza que tenemos en nuestra media muestral como un estimador de la media poblacional.

Este error es calculado como sigue:
a. Si una observación individual x viene de una distribución normal entonces la probabilidad es 95% (p=0.95) de que x esté localizada en algún lugar de la distribución entre μ±1.96σ.
b. Similarmente, si una media muestral ˉx viene de una población normal de medias muestrales entonces p=0.95 de que ˉx esté entre μ±1.96σ/n .

Nótese que en esta ecuación, el error estándar de la media σ/n es sustituido por σ porque estamos interesados en la variación de las medias muestrales y no de las observaciones individuales.
c. Así, podemos escribir p=0.95 de que μ esté entre ˉx±1.96σ/n.

Hay dos problemas con este enfoque. Primero, en la mayoría de los estudios, la media muestral ˉx se basa en una pequeña muestra de medidas. Así que no sabemos el valor de σ sino solo la SD muestral s. Entonces sustituímos s por σ. Segundo si sustituímos s por σ, no podemos estar seguros acerca de la forma exacta de la distribución ni si el valor de Z=1.96 es suficientemente preciso para juzgar si una media muestral es atípica de la población.

En lugar de eso usamos un valor diferente, que es más preciso en describir el comportamiento de muestras pequeñas, que se toma de una distribución relacionada llamada la distribución “t”.
d. Luego, un intervalo de confianza (CI) al 95% de una media muestral está dado por CI=ˉx±t(p=0.05,DF=n1)s/n

Podemos concluir que estamos 95% seguros de que la media poblacional caerá entre los límites calculados.


Referencia


Imagen de Wikipedia