Processing math: 100%

LaTex

domingo, 6 de noviembre de 2016

Conceptos básicos para optometristas. 3/4

Distribución Normal.
Muchas de las pruebas estadísticas más útiles están basadas en la suposición de que la variabilidad natural de una medida particular es predecible. Por ejemplo, si una muestra de medidas de una variable x, digamos, la longitud axial de una muestra de ojos, es graficada como una distribución de frecuencias, las medidas estarán distribuidas simétricamente alrededor de una tendencia central o valor promedio. Una distribución de frecuencias es construida dividiendo la variable x en clases y graficando el número de medidas f(x) que caen dentro de cada clase. Si el número de medidas se incrementa y los intervalos de clases de la distribución se reducen a cero, los datos estarán muy próximos a una curva con forma de campana llamada distribución normal (también llamada distribución Gaussiana). Muchas medidas en las biociencias siguen esta distribución o no se desvían mucho de ella (Figura).

La distribución normal puede ser descrita por dos cantidades:
a. La “tendencia central” de la distribución descrita por el promedio o media aritmética de la población μ=xn.

Nótese que la media de una muestra de medidas tomadas de esta población es designada como ¯x.

b. La desviación estándar (SD) de la población, es decir, la distancia de la media al punto de máxima pendiente de la curva SD=(μx)2n Así, la SD describe qué tan cerca se agrupan los datos alrededor de la medida de tendencia central. Nótese que la SD de una población se designa como σ mientras la de una muestra se designa con s.

Para entender el significado de SD, puede verse de dónde sale. Un método para determinar la variabilidad de una población de valores es calcular su media μ, restar cada observación x de la media y sumar las desviaciones: (μx).
Si los datos son altamente variables, las desviaciones de la media serán grandes y si los datos no son particularmente variables, estarán más agrupados alrededor de su media.

Sin embargo, debido a que aproximadamente la mitad de las observaciones serán mayores que la media y la mitad menores, la mitad de las desviaciones serán positivas y la mitad negativas y por lo tanto, su suma será cero. Así que para resolver este problema cada desviación se eleva al cuadrado antes de sumarla para dar una cantidad que se conoce como la suma de cuadrados es decir, la suma de los cuadrados de las desviaciones de las observaciones originales respecto a su media: (μx)2.

Pero, la suma de los cuadrados de una cantidad depende del tamaño de la muestra N. Así que para describir la variabilidad de los datos y ser capaces de comparar la variabilidad de un conjunto de datos con otro que tiene diferente tamaño de muestra calculamos el promedio de la desviación dividiendo por N: (μx)2/N.
Esta cantidad también es conocida como varianza. Dado que cada desviación de la media fué elevada al cuadrado antes de sumarla, tomamos la raíz cuadrada de la varianza para tener las misma unidades que las medidas originales. Esto nos da la desviación estandar (SD):
SD=(μx)2N
La desviación estándar describe el promedio de la desviación de las observaciones individuales x de su media. Para calcular la SD necesitamos conocer μ la media de la población. Sin embargo, en muchas ocasiones deseamos calcular la SD de una pequeña muestra de medidas tomadas de una población más grande. En este caso, no conocemos el valor exacto de la media poblacional, pero podemos calcular la media de la muestra de medidas ˉx.

Así, para calcular la SD de una muestra de medidas podemos usar la fórmula original para la SD pero con tres cambios:
a. La SD de la población σ es reemplazada por s, la SD de la muestra.
b. μ es reemplazada por ˉx, la media de la muestra.
c. “n” es reemplazada por “n-1”, una cantidad llamada grados de libertad.

Los grados de libertad o DF es un concepto importante en estadística. El cálculo de la SD incluye la resta de observaciones individuales de su media y sumar los resultados. Sin embargo, si hay N observaciones, una vez que N-1 observaciones han sido restadas de la media y sumadas, podemos inmediatamente calcular la última desviación de la media porque el total de desviaciones suman cero. En otras palabras N observaciones solo brindan N-1 estimados independientes de las desviaciones de su media. La cantidad N-1 es conocida como los DF. Como una regla general, los DF de una cantidad estadística es el número de observaciones que componen esa cantidad menos el número de parámetros que tienen que ser calculados de los datos para obtener la cantidad. Así que cuando calculamos la SD de N observaciones, los DF es N-1 porque tenemos que calcular un parámetro, la media de los datos, para calcular la suma de cuadrados.
Entonces, la fórmula para la SD de una muestra es dada como sigue:
s=(ˉxx)2n1
Si varios estimados de una cantidad, como la presión intraocular de los individuos a la edad de 60, son calculados, es práctica común reportar la media y la desviación estándar de la muestra, es decir, ˉx, s.


Ecuación de la Distribución Normal.

La ecuación matemática que describe la curva con forma de campana de la distribución normal está dada como sigue:
F(x)=1σ2πe12(xμσ)2

Esta ecuación hace posible la frecuencia F(x), es decir, permite calcular la altura de la curva para cada valor individual de “x” siempre que μ y σ sean conocidas, es decir, una distribución normal es definida completamente por su media y su desviación estándar. Esta ecuación también permite calcular la proporción de observaciones que están a una distancia dada de la media.

En cualquier distribución normal, 68% de las observaciones caerán a 1 SD arriba y abajo de la media. Así, la probabilidad es 68% o p=0.68 de que una medida de una distribución normal caerá en esos límites. Similarmente, la probabilidad es p=0.95 de que una medida caiga aproximadamente a 2 SD por arriba y debajo de la media.

Cada tipo de variable tiene su propia distribución normal de valores con una media y una SD. Sin embargo, las tablas estadísticas de la distribución normal, llamadas tablas Z, han sido calculadas para la distribución normal llamada “normal estándar”. Si queremos usar estas tablas en pruebas estadísticas, tenemos que convertir nuestras medidas para que formen parte de una distribución normal estándar.


Referencia

Imagen de Wolfram