Processing math: 0%

LaTex

sábado, 26 de agosto de 2017

Prueba de bondad de ajuste con diferentes valores esperados. (Segunda de dos partes).


Resumen del artículo escrito por Richard Armstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.



En los ejemplos descritos hasta ahora, las frecuencias esperadas han sido las mismas en cada categoría de la variable. En ciertas circunstancias, sin embargo, las frecuencias esperadas o predichas pueden variar de categoría en categoría. Esta es una circunstancia común en investigación genética, donde un investigador puede predecir de una teoría genética la frecuencia de un genotipo particular en la descendencia. Por ejemplo, dos padres heterocigóticos portadores de un rasgo anormal autosómico dominante tienen una probabilidad de 3:1 de transmitir la característica a su descendencia.

En optometría, las expectativas de la variable pueden surgir si un investigador deseara probar si una distribución estadística particular puede ser ajustada a una muestra de datos. Por ejemplo, un optometrista hace una medida de un parámetro visual en 20 pacientes tomados aleatoriamente de una población y desea determinar si los datos se desvían significativamente de una distribución normal (Tabla 4).


Clases de Frecuencia \hspace{16mm} Frec. Observada (F_o) \hspace{5mm} Frec. Esperada (F_e) \hspace{5mm} Contribución \chi^2


< \mu -1.5 \alpha \hspace{50mm} 0 \hspace{45mm} 1.3362 \hspace{45mm} 1.34
\mu -1.5 \alpha \hspace{2mm} a \hspace{2mm} \mu -0.5 \alpha \hspace{30mm} 6 \hspace{45mm} 4.8346 \hspace{45mm} 0.28

\mu -0.5 \alpha \hspace{2mm} a \hspace{2mm} \mu \hspace{45mm} 7 \hspace{45mm} 3.8292 \hspace{45mm} 2.63

\mu \hspace{2mm} a \hspace{2mm} \mu +0.5 \alpha \hspace{45mm} 0 \hspace{45mm} 3.8292 \hspace{45mm} 3.83

\mu +0.5 \alpha \hspace{2mm} a \hspace{2mm} \mu +1.5 \alpha \hspace{30mm} 6 \hspace{45mm} 4.8346 \hspace{45mm} 0.28

> \mu -1.5 \alpha \hspace{50mm} 1 \hspace{45mm} 1.3362 \hspace{45mm} 0.08

totales \hspace{57mm} 20 \hspace{45mm} 20.00 \hspace{45mm} 8.44

Por lo tanto, la prueba de bondad de ajuste de los datos observados a una distribución normal \chi^2=8.44, 3 gl, p>0.05


Tabla 4. El método de la Ji-cuadrada para probar el ajuste de los datos observados a una distribución normal (\mu=media y \sigma= desviación estándar de las observaciones)

Para ajustar la distribución normal, la variable estudiada primero fué dividida en clases de frecuencia describiendo el rango de la variable en la población. En este caso fueron consideradas seis clases. Los límites de estas clases se convierten para que sean miembros de la distribución normal estándar usando el método descrito en el primer artículo.

Para llevar a cabo este cálculo, la media muestral y la desviación estándar de las 20 medidas se calculan primero. Luego la media muestral se resta de cada límite de clase y se divide por la desviación estándar, que convierte las medidas originales a sus correspondientes en la distribución normal estándar. Entonces pueden ser usadas las tablas de la distribución normal estándar para determinar el número esperado de observaciones, de las 20, que deberían caer dentro de cada clase si los datos estuvieran normalmente distribuídos.

Notemos que la F_e varía de una clase a otra. Luego la F_e es comparada con la F_o usando la prueba de bondad de ajuste \chi^2.

En el caso presente el valor de \chi^2, totalizado sobre todas las clases, igualó 8.44 y esto excede el valor al 5% de probabilidad para 3 gl.

La Ji-cuadrada tiene 3 gl en este ejemplo porque la media, la desviación estándar y la frecuencia total tienen que ser calculadas de los datos para hacer la prueba. Así, los gl=número de frecuencias (6)-3 parámetros. La hipótesis nula es rechazada y concluímos que la población no está normalmente distribuída. Notemos que este ejemplo usa un número relativamente pequeño de observaciones y normalmente se requeriría una muestra mucho más grande de medidas para ajustar la distribución normal adecuadamente.

Tablas de contingencia de la Ji-cuadrada.

Tabla 2X2

En los ejemplos discutidos anteriormente los datos han consistido en dos o más categorías de una sola variable, por ejemplo, hombres/mujeres o meses del año. El mismo principio, sin embargo, puede ser extendido al análisis de dos diferentes variables. Por ejemplo, consideremos el siguiente estudio del posible efecto de fumar en la incidencia de degeneración macular relacionada con la edad (DMRE).
Fué tomada aleatoriamente una muestra de 1429 personas mayores de una población y clasificada de acuerdo a si eran o no fumadores y si había evidencia de la presencia de DMRE. Los datos obtenidos en el estudio (Tabla 5) constituyen una tabla de contingencia de 2X2, es decir, hay dos variables, cada una con dos categorías.

Tabla5No-fumadoresFumadoresTotal renglones
DMRE10744151
no-DMRE9403381278
Total columnas1047382Gran total
% con DMRE10.2%11.5%1429
  1. La frecuencia esperada en cada celda es calculada como: \frac{Total renglon \times Total columna}{Gran Total}
  2. Por tanto, la F_e de no-fumadores con DMRE es (151*1047)/1429=110.63. Esta cantidad se repite en cada celda de la tabla.
  3. Calcular \chi^2 de acuerdo a la ecuación 1. En este caso \chi^2=0.50 con 1 gl.
Tabla 5.¿Está la incidencia de DMRE relacionada con fumar? Los datos son el número de pacientes, de un total de 1429, que caen en cada categoría.

Notemos que en la Tabla 5 el 10% de los no-fumadores exhibieron signos y síntomas de DMRE contra el 11.5% de los fumadores. Podemos preguntar si la diferencia es suficiente para concluir que fumar provoca un efecto en la incidencia de DMRE.

La prueba se describe en la Tabla 5. Notemos que en una tabla de 2X2, la F_e tiene que ser calculada para cada celda en la tabla separadamente, es decir, hay cuatro diferentes valores para la F_e. Una tabla de 2X2, sin embargo, solo tiene un grado de libertad.

Para entender porqué una tabla de 2X2 solo tiene 1 gl, se debe calcular cada F_e y examinar las desviaciones de las frecuencias observadas con respecto a las esperadas para cada celda de la tabla. Examinar estas desviaciones mostrará que son la misma, es decir, en una tabla de 2X2 solo hay un estimado independiente de la desviación de las frecuencias observadas respecto a las esperadas.

En este caso, el valor calculado de \chi^2 es menor que el valor tabulado al 5% de probabilidad. Este es un valor que podría ocurrir bastante frecuentemente por casualidad y, por lo tanto, podríamos concluir, al menos de este estudio, que no hay pruebas concluyentes de que fumar esté relacionado con DMRE.

Nótese que hay estudios en la literatura que sugieren una posible conexión entre DMRE y fumar. Los resultados de un estudio individual con frecuencia no son concluyentes y conclusiones como si fumar está considerado un “factor de riesgo” para DMRE con frecuencia se basan en una combinación de muchos estudios individuales.

Tabla de Contingencia RXC.

También es posible analizar dos variables con cualquier número de categorías por variable y ésto a veces se menciona como una tabla de contingencia de renglón R X columna C.

En el siguiente ejemplo un optometrista quiere determinar si la precisión en la lectura, determinada como el total de errores cometidos en una prueba, varía entre un grupo de sujetos controles mayores y un grupo de pacientes con DMRE cuando se presentan con cuatro diferentes filtros de color (Tabla 6).

Tabla6: filtrosrojoverdeazulamarillo Total renglones
Control4793188824909
DMRE50845890351091
Total columnas98777617859N=2000
  1. La frecuencia esperada en cada celda es calculada como: \frac{Total renglon \times Total columna}{Gran Total}
  2. Por tanto, la F_e de los errores con el filtro rojo en los controles es (909*987)/2000=448.59.
  3. Repetir para cada celda de la tabla y calcular la \chi^2 usando la ecuación 1.
  4. En este caso la \chi^2=11.72 (3gl) p<0 .001="" ol="">

Tabla 6.¿La frecuencia de los errores en la lectura usando diferentes colores en los filtros varía entre las personas mayores, controles y pacientes con DMRE? Los datos son el número total de errores cometidos por el paciente en cada prueba.

Para hacer la prueba, la F_e es calculada para cada celda de la tabla usando la misma fórmula que se usó para la tabla de 2X2. Entonces el valor de la \chi^2 es calculada usando la ecuación 1. En este ejemplo, el valor \chi^2=11.72. Este valor es llevado a la tabla \chi^2, usando el renglón (R-1)(C-1) gl. Este valor excede el valor de \chi^2 en la tabla al nivel p=0.01, es decir, la incidencia de los errores en la lectura usando los diferentes filtros de colores varía entre los dos grupos de pacientes.

Se requerirá un examen más detallado de los datos para determinar si las diferencias entre los dos grupos estuvieron presentes usando todos los tipos de filtros o solo un subconjunto de filtros. Este proceso puede incluir partir los datos en pequeñas tablas de contingencia cada una de las cuales puede ser probada usando la \chi^2.

Referencia

Foto de Joffi

jueves, 10 de agosto de 2017

Métodos de análisis de datos en Optometría. (Primera de dos partes)

Resumen del artículo escrito por Richard Armstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

Análisis de Frecuencias y Proporciones.

En los escritos anteriores se describió la aplicación de métodos estadísticos a problemas clínicos en optometría que han sido aplicados a datos de medidas por ejemplo la longitud axial del ojo o la presión intraocular. Los datos de medidas son expresados en unidades; son variables continuas y, en muchos casos, llenan los requerimientos de la distribución normal.

En algunos estudios, sin embargo, los datos no son medidas sino cantidades o frecuencias de eventos particulares. En tales casos, un investigador puede estar interesado en saber si un evento específico sucede más frecuentemente que otro, o si un evento ocurre con la frecuencia predicha por un modelo científico.

Por ejemplo, un oftalmólogo cree que la prevalencia de una enfermedad ocular, según indica el número de pacientes referidos a los hospitales en West Midlands, es igualmente común entre hombres y mujeres. Así que el investigador quiere determinar si el número de hombres y mujeres observados se desvía significativamente de una razón esperada 1:1.

Además, un optometrista puede creer que el uso de un particular lente de contacto es un factor de riesgo para desarrollar úlceras corneales. En este caso puede ser interesante determinar si la proporción de individuos que desarrollan úlceras corneales fué el mismo en los grupos de pacientes clasificados de acuerdo al uso de diferentes tipos de lentes de contacto.

Pruebas estadísticas previas aplicadas a datos de medidas han sido basadas en las distribuciones t y z. Para analizar los datos de frecuencia, sin embargo, se requiere un diferente tipo de prueba estadística y una nueva distribución: la distribución Ji-cuadrada.

Este artículo revisa el uso de la distribución Ji-cuadrada al analizar frecuencias y proporciones sacados de una variedad de problemas clínicos en optometría. Además, serán descritas algunas de las pruebas alternativas a la Ji-cuadrada, que son útiles en circunstancias particulares, como la prueba exacta de Fisher y la prueba de Kolmogorov-Smirnov.

Como en los artículos previos, los métodos de análisis de datos son ilustrados con conjuntos de datos simples. Estos datos son usados solamente para ilustrar la metodología, y los efectos experimentales revelados no son necesariamente indicativos de los resultados, que hubieran sido obtenidos mediante experimentos más detallados.

La distribución Ji-cuadrada.

Ejemplo.

Un oftalmólogo cree que una enfermedad ocular es igualmente común entre hombres y mujeres. Una revisión de casos referidos a los hospitales en West Midlands durante los últimos 10 años produjo la frecuencia de ocurrencia de la enfermedad como se muestra en la Tabla 1.


Tabla \hspace{3mm} 1 HombresMujeresTotal
Razón Esperada 11
Frecuencia Observada (F_o) 480420900
Frecuencia Esperada (F_e) 450450900
F_o-F_e +30-30
(F_o-F_e)^2 900900
(F_o-F_e)^2/F_e 22
\chi^2=\sum (F_o-F_e)^2/F_e=4

¿Estos resultados apoyan o contradicen la hipótesis nula de que no hay diferencia en la ocurrencia de la enfermedad entre hombres y mujeres, es decir, los datos refutan una razón hombre:mujer de 1:1?

Cálculo de la Ji-cuadrado.

En 1899, el estadístico Karl Pearson ideó una prueba estadística para responder este tipo de pregunta. Pearson ideó un “índice de dispersión”, llamado Ji-cuadrada (\chi^2), que mide la desviación de una frecuencia observada (F_o) de una frecuencia esperada o predicha (F_e). Junto con las distribuciones t y z descritas en artículos previos, la distribución Ji-cuadrada es una de las más importantes en estadística. La Ji-cuadrada se define como la suma de los cuadrados de las diferencias entre cada frecuencia observada (F_o) y cada frecuencia esperada (F_e), cada diferencia dividida por la frecuencia esperada:

\chi^2=\sum\frac{(F_o-F_e)^2}{F_e} \hspace {20mm} \dots (1)

Si los movimientos observados y esperados son idénticos, el valor de la \chi^2 es cero. El valor de \chi^2 se incrementa a medida que la diferencia entre los valores observado y esperado se incrementa.

En el ejemplo dado en la Tabla 1, el valor calculado de \chi^2 es 4. Nótese que la F_e de hombres y mujeres con una enfermedad particular es calculada de la F_o. Para juzgar si es probable que un valor de \chi^2 de 4 se obtenga por casualidad mediante una muestra aleatoria, se consulta la tabla \chi^2 para n-1 grados de libertad gl donde n es igual al número de categorías de la variable.

Grados de Libertad.

La consideración de este ejemplo nos da un contexto útil en el cuál explicar el significado de los grados de libertad gl en más detalle. Como se describe en un artículo anterior, el número de gl hace posible tener una tabla estadística para buscar en el renglón correcto basado en el número de observaciones.

En la mayoría de las aplicaciones, los gl de una cantidad estadística se define como el número de observaciones menos el número de parámetros que tienen que ser calculados de los datos para estimar la cantidad estadística. Así, en el presente ejemplo, hay dos observaciones (las dos frecuencias, hombres y mujeres) pero la F_e tiene que ser calculada de la F_o para hacer la prueba \chi^2, por lo tanto, gl=2-1=1.

Reduciendo el número de observaciones “efectivas” de esta manera parecería ser un procedimiento lógico dado que los datos están siendo usados para probar una hipótesis y para calcular el estadístico necesario para hacer la prueba.

Cuando una prueba estadística se hace por primera vez, es útil calcular los grados de libertad apropiados y asegurarnos de que coinciden con los que indica el programa estadístico. Esta verificación puede ser particularmente importante cuando se usan pruebas estadísticas más complejas, como el análisis de varianza, que será discutido posteriormente.

La distribución Ji-cuadrada 1 gl

La distribución estadística Ji-cuadrada con un grado de libertad es mostrada en la figura.

Esta distribución describe los valores de Ji-cuadrada, que resultarían por casualidad al comparar dos frecuencias tomadas aleatoriamente, por ejemplo de una tabla de números aleatorios.

Comparada con las tablas z y t, la distribución \chi^2 para 1 gl es asimétrica en su forma, pero como en las distribuciones z y t, el cálculo de la \chi^2 convierte las diferencias entre las frecuencias observadas y las esperadas a un solo estadístico, que es un miembro de esta distribución.

Se obtiene un valor significativo de la \chi^2 cuando cae en la cola de la distribución, que incluye el 5% de las observaciones más extremas. La gráfica indica que todos los valores de \chi^2 iguales o mayores que 3.84 caerían dentro de esta categoría.

En el ejemplo de la Tabla 1, se obtuvo un valor de \chi^2=4 que es más grande que el valor crítico al 5% del nivel de probabilidad. Es improbable que este valor de \chi^2 se haya obtenido por casualidad.

La probabilidad es, de hecho, menor a 5% y, por lo tanto, concluímos que las frecuencias observadas se separan significativamente de las razones esperadas, es decir, hay un exceso de hombres referidos a los hospitales de West Midlands con la enfermedad ocular en cuestión.

Este tipo de prueba estadística con frecuencia es descrita como “prueba de bondad de ajuste”.

Esencialmente, una serie de frecuencias observadas son comparadas con una distribución de resultados esperada o predicha. Un importante hecho acerca de este tipo de pruebas es que la distribución \chi^2 está basada en la frecuencia de eventos y no puede ser aplicada a datos de medida, es decir, cualquier dato de medida en unidades.

Esta prueba puede ser extendida para cualquier número de categorías de frecuencias y el caso general, para n categorías es descrito en la Tabla 2.

Tabla 2

Categorías =\{1,2,3, \dots n\}

F_o=\{ O_1,O_2,O_3, \dots O_n\}

F_e=\{ E_1,E_2,E_3, \dots E_n\}

  1. Calcular las frecuencias esperadas F_e. En el caso simple serán las mismas para cada categoría. Así, si las frecuencias observadas F_o suman N, entonces F_e será N/n.
  2. Calcular la Ji-cuadrada \chi^2=\sum\frac{(F_o-F_e)^2}{F_e}
  3. El valor de \chi^2 es llevado a la tabla \chi^2 para compararlo con el renglón con n-1\hspace{3mm} gl donde n es el número de categorías.
  4. El valor de Ji-cuadrada tiene que ser igual o más grande que el valor tabulado para p=0.05 para indicar una diferencia significativa de los datos observados respecto a los esperados.

Prueba de bondad de ajuste con 12 categorías y la misma expectativa.

Un médico contó el número de niños nacidos cada mes en la maternidad del hospital con una específica anormalidad genética (Tabla 3). ¿El número de niños nacidos con esta anormalidad varían mensualmente?

Tabla 3
Categorías (meses) E \hspace{5mm} F \hspace{5mm} M \hspace{5mm} A \hspace{5mm}M \hspace{5mm}J \hspace{5mm}J \hspace{5mm}A \hspace{5mm}S \hspace{5mm}O \hspace{5mm}N \hspace{3mm}D Suma \hspace{3mm}
F_o 8 \hspace{5mm}19 \hspace{5mm}11 \hspace{5mm}12 \hspace{5mm}16 \hspace{5mm}8 \hspace{5mm}7 \hspace{6mm}5 \hspace{6mm}8 \hspace{6mm}3 \hspace{6mm}8 \hspace{6mm}8 113

  1. La frecuencias esperada F_e en cada mes es \sum F_o/n donde n es el número de categorías=113/12=9.42
  2. En este caso \chi^2=23.5 que excede el valor en la tabla para 11 gl al p=0.05.

En este caso, la F_e, asumiendo igual número de nacimientos anormales por mes, es el total de las frecuencias sumadas de los meses, dividido por el número de meses. El valor de \chi^2 calculado fué de 23.5 y excede el valor del estadístico para 11 gl con nivel de probabilidad p=0.05.

Así, el número de niños nacidos con esta anormalidad genética parece variar mensualmente.

Es necesario tener cuidado en la interpretación de este resultado, sin embargo, porque es probable que haya una variación en el número total de niños nacidos cada mes y este hecho no ha sido tomado en cuenta. Por lo tanto, podría ser más apropiado analizar la proporción del número total de niños nacidos cada mes con la anormalidad más que las frecuencias absolutas.

Referencia








lunes, 7 de agosto de 2017

¿Hay diferencia entre dos muestras? (5 de 5)


Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.



Pruebas no paramétricas

La moda y la mediana.

Un enfoque alternativo al análisis de datos que no se distribuyen normalmente es usar una prueba con una distribución libre o no paramétrica (el término no paramétrico se usa para distinguir estas pruebas de las paramétricas, que están basadas en la distribución normal). Estas pruebas son fáciles de hacer y pueden ser usadas a pesar de la forma de la distribución subyacente, siempre y cuando pueda asumirse que las muestras que van a ser comparadas vienen de una distribución que tiene la misma forma.

Como se vió antes, cuando una distribución se desvía significativamente de la normal, la media aritmética con frecuencia es una descripción pobre de su tendencia central.

Sin embargo, hay dos estadísticos adicionales que pueden ser usados para describir la tendencia central de tal distribución. Primero, la moda que es el valor de la variable x con la frecuencia más alta, es decir, el punto máximo de la curva. Segundo, la mediana que es el valor de la x que se encuentra en medio, es decir, si todos los valores de x fueran enlistados en un orden ascendente o descendente, la mediana sería el valor de enmedio del listado.

Ha habido poco progreso ideando pruebas estadísticas que estén basadas en la moda pero hay dos pruebas que pueden ser usadas para probar las diferencias entre las medianas de dos muestras: la prueba U Mann-Whitney y la prueba Wilcoxon. Enseguida se expondra la primera.


La prueba U de Mann-Whitney (para datos no pareados)


Consideremos un experimento diseñado para investigar la habilidad de personas normales mayores y personas con degeneración macular relacionada con la edad DMRE para leer acertadamente una página impresa.
La hipótesis nula es que la DMRE no afecta la habilidad de los sujetos para leer acertadamente, siendo la habilidad para leer acertadamente calificada en una escala de 15 puntos.

Los datos en este experimento incluyen números enteros pequeños y como tal, pueden no estar distribuídos normalmente. Un enfoque para este problema podría ser transformar los valores a una diferente escala y usar la prueba t no pareada. Sin embargo, un método alternativo es hacer una prueba U de Mann-Whitney, el equivalente no paramétrico de la prueba t no pareada como se ve en la siguiente tabla:

DMRE(A) \hspace{3mm}4\hspace{3mm}5\hspace{3mm}6\hspace{3mm}7\hspace{3mm}10\hspace{3mm}14
Control(B) \hspace{3mm}8\hspace{3mm}9\hspace{3mm}11\hspace{3mm}12\hspace{3mm}13\hspace{3mm}15
Rango A \hspace{3mm}1\hspace{3mm}2\hspace{3mm}3\hspace{3mm}4\hspace{3mm}7\hspace{3mm}11
Rango B \hspace{3mm}5\hspace{3mm}6\hspace{3mm}8\hspace{3mm}9\hspace{3mm}10\hspace{3mm}12

  1. Ordenar las observaciones juntas de los dos grupos . Asignar rangos ascendentes 1,2,3,… al conjunto completo de observaciones. A los valores repetidos, llamados “ligaduras”, se les asigna el valor de la media de sus rangos. Por ejemplo: si tenemos las observaciones 4, 5, 6, 6, 7, sus rangos serían 1, 2, 3, 4, 5, pero como el seis se repite (ligadura), deberán promediarse sus rangos: en este caso el promedio, llamado rango de orden medio, de 3 y 4 que es 3.5. Luego los rangos quedarían 1, 2, 3.5, 3.5, 5.
  2. Sumar los rangos de cada renglón R_A=28 y R_B=50.
  3. Calcular los estadísticos U_A y U_B, por ejemplo
    U_A=\left(\frac{n_A(n_A+1)}{2}+(n_An_B)\right)-R_A donde n_A y n_B es el número de pacientes en cada grupo. Una ecuación similar puede ser construída para U_B sustituyendo n_B y R_B.
  4. Tomar el valor más pequeño entre U_A y U_B y compararlo en la tabla del U tabulado de Wilcoxon. El menor U (en este caso U_B=7) tiene que ser igual o menor que el valor tabulado para significancia, es decir, valores pequeños de U indican significancia.

Para una explicación más detallada de la prueba U de Mann-Whitney puede consultarse el video de la Maestra Purificación Galindo de la Universidad de Salamanca sobre el tema.

Referencia




Foto de Engin Akyurt

miércoles, 2 de agosto de 2017

¿Hay diferencia entre dos muestras? (4 de 5)

Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

Suposiciones y limitaciones de las pruebas estadísticas.

Las pruebas estadísticas descritas hacen una serie de suposiciones acerca de los datos experimentales que tienen que ser, al menos, aproximadamente ciertas antes de que la prueba pueda ser aplicada válidamente. La más importante de estas suposiciones es que las medidas individuales, las medias de los tratamientos o las diferencias entre medias son variables paramétricas, es decir, miembros de una población que se distribuye normalmente. Cuando esto es cierto, la distribución normal estándar y la distribución t pueden ser usadas para hacer juicios estadísticos acerca de los datos.

En algunos casos, sin embargo, una variable puede alejarse significativamente de una distribución normal. Las distribuciones pueden diferir de la normal de dos maneras, por el sesgo y por la curtosis. En una distribución sesgada, el pico de la distribución está desplazado hacia la derecha (sesgo positivo) o hacia la izquierda (sesgo negativo) como se ve en la figura, y como resultado, la media aritmética ya no es una buena descripción de la tendencia central de esa distribución.

Por otro lado, distribuciones que exhiben kurtosis son más planas que la normal o tienen un exceso de observaciones cerca de la media y menos en las colas en comparación con la distribución normal. En distribuciones que exhiben kurtosis, la desviación estándar no es un descriptor acertado de la dispersión de la distribución con una media dada. Una mayor curtosis implica una mayor concentración de datos muy cerca de la media de la distribución.

En algunas circunstancias, el investigador puede saber si los datos se distribuyen normalmente o no. En otros casos, puede ser necesario recolectar suficientes observaciones experimetnales para probar si una distribución es normal.

En muchas situaciones experimentales, sin embargo, podemos no saber si los datos vienen de una distribución normal o no, y podemos tener datos insuficientes para hacer una prueba de normalidad. En situaciones como ésta deben considerarse los siguientes puntos. Primero, la mayoría de las medidas hechas en al menos tres cifras significativas tienen una probabilidad más alta de distribuirse normalmente o no desviarse demasiado de la normal. Segundo, la distribución de medias muestrales, si se basa en un número razonable de observaciones -digamos de 10 a 20- será una distribución normal incluso si las medidas individuales no lo son. Tercero, pequeñas desviaciones de los datos con respecto a la normalidad no afectan significativamente la validez de las pruebas que se han descrito.

Transformación de los datos.

En algunas situaciones los datos se apartarán radicalemente de la distribución normal y se requerirá un nuevo enfoque para analizar los datos. Un método es convertir las medidas originales para que puedan ser expresadas en una nueva escala que sea más parecida a la distribución normal que la escala original. Las pruebas estadísticas paramétricas originales pueden entonces ser aplicadas en los valores transformados.

Hay tres circunstancias comunes en las cuales debería ser considerada esa transformación.

  • Primero, si los datos están en forma de porcentajes. Por ejemplo, considerar los porcentajes de disminución de la presión intraocular en un intervalo específico de tiempo cuando al paciente se le dan gotas para los ojos, y especialmente si la mayoría de las observaciones están cercanas a cero o 100%. Los datos en porcentajes pueden ser transformados a una escala angular o arcoseno definida como sigue:
    Angulo=sen^{-1} \sqrt{\frac{\%}{100}} \hspace{20mm}\dots (3)


    La aplicación de la transformación a los % aproxima la distribución a una normal. El programa estadístico con frecuencia brindará esta transformación. Los datos en porcentajes con frecuencia están significativamente sesgados cuando la media es muy pequeña o muy grande y consecuentemente, en la escala del arcoseno, los porcentajes cercanos a 0% o a 100% son dispersados para incrementar su varianza. Entonces puede hacerse una prueba t pareada o no pareada, usando los datos transformados como se describió.

  • Segundo, los datos que incluyan números enteros pequeños o cantidades evaluadas utilizando una puntuación a escala limitada, por ejemplo de 0 a 5, es menos probable que se distribuyan normalmente. En este caso, una transformación a \sqrt{x} (o \sqrt{x+1} si hay muchos ceros presentes) puede hacer que la escala se distribuya más normalmente.

  • Tercero, la prueba t también asume homogeneidad de varianzas, es decir, que el grado de variabilidad es similar en los grupos de controles y los de tratados. No es raro, sin embargo, para los valores de los controles que exhiban mayor o menor variabilidad que el grupo de los tratados experimentalmente. En este caso, una transformación de las medidas originales a logaritmos o una de las otras transformaciones puede ecualizar la varianza y además, también puede mejorar el grado de normalidad de los datos.

Referencia

Foto de Scara