Processing math: 100%

LaTex

miércoles, 2 de agosto de 2017

¿Hay diferencia entre dos muestras? (4 de 5)

Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

Suposiciones y limitaciones de las pruebas estadísticas.

Las pruebas estadísticas descritas hacen una serie de suposiciones acerca de los datos experimentales que tienen que ser, al menos, aproximadamente ciertas antes de que la prueba pueda ser aplicada válidamente. La más importante de estas suposiciones es que las medidas individuales, las medias de los tratamientos o las diferencias entre medias son variables paramétricas, es decir, miembros de una población que se distribuye normalmente. Cuando esto es cierto, la distribución normal estándar y la distribución t pueden ser usadas para hacer juicios estadísticos acerca de los datos.

En algunos casos, sin embargo, una variable puede alejarse significativamente de una distribución normal. Las distribuciones pueden diferir de la normal de dos maneras, por el sesgo y por la curtosis. En una distribución sesgada, el pico de la distribución está desplazado hacia la derecha (sesgo positivo) o hacia la izquierda (sesgo negativo) como se ve en la figura, y como resultado, la media aritmética ya no es una buena descripción de la tendencia central de esa distribución.

Por otro lado, distribuciones que exhiben kurtosis son más planas que la normal o tienen un exceso de observaciones cerca de la media y menos en las colas en comparación con la distribución normal. En distribuciones que exhiben kurtosis, la desviación estándar no es un descriptor acertado de la dispersión de la distribución con una media dada. Una mayor curtosis implica una mayor concentración de datos muy cerca de la media de la distribución.

En algunas circunstancias, el investigador puede saber si los datos se distribuyen normalmente o no. En otros casos, puede ser necesario recolectar suficientes observaciones experimetnales para probar si una distribución es normal.

En muchas situaciones experimentales, sin embargo, podemos no saber si los datos vienen de una distribución normal o no, y podemos tener datos insuficientes para hacer una prueba de normalidad. En situaciones como ésta deben considerarse los siguientes puntos. Primero, la mayoría de las medidas hechas en al menos tres cifras significativas tienen una probabilidad más alta de distribuirse normalmente o no desviarse demasiado de la normal. Segundo, la distribución de medias muestrales, si se basa en un número razonable de observaciones -digamos de 10 a 20- será una distribución normal incluso si las medidas individuales no lo son. Tercero, pequeñas desviaciones de los datos con respecto a la normalidad no afectan significativamente la validez de las pruebas que se han descrito.

Transformación de los datos.

En algunas situaciones los datos se apartarán radicalemente de la distribución normal y se requerirá un nuevo enfoque para analizar los datos. Un método es convertir las medidas originales para que puedan ser expresadas en una nueva escala que sea más parecida a la distribución normal que la escala original. Las pruebas estadísticas paramétricas originales pueden entonces ser aplicadas en los valores transformados.

Hay tres circunstancias comunes en las cuales debería ser considerada esa transformación.

  • Primero, si los datos están en forma de porcentajes. Por ejemplo, considerar los porcentajes de disminución de la presión intraocular en un intervalo específico de tiempo cuando al paciente se le dan gotas para los ojos, y especialmente si la mayoría de las observaciones están cercanas a cero o 100%. Los datos en porcentajes pueden ser transformados a una escala angular o arcoseno definida como sigue:
    Angulo=sen1%100(3)


    La aplicación de la transformación a los % aproxima la distribución a una normal. El programa estadístico con frecuencia brindará esta transformación. Los datos en porcentajes con frecuencia están significativamente sesgados cuando la media es muy pequeña o muy grande y consecuentemente, en la escala del arcoseno, los porcentajes cercanos a 0% o a 100% son dispersados para incrementar su varianza. Entonces puede hacerse una prueba t pareada o no pareada, usando los datos transformados como se describió.

  • Segundo, los datos que incluyan números enteros pequeños o cantidades evaluadas utilizando una puntuación a escala limitada, por ejemplo de 0 a 5, es menos probable que se distribuyan normalmente. En este caso, una transformación a x (o x+1 si hay muchos ceros presentes) puede hacer que la escala se distribuya más normalmente.

  • Tercero, la prueba t también asume homogeneidad de varianzas, es decir, que el grado de variabilidad es similar en los grupos de controles y los de tratados. No es raro, sin embargo, para los valores de los controles que exhiban mayor o menor variabilidad que el grupo de los tratados experimentalmente. En este caso, una transformación de las medidas originales a logaritmos o una de las otras transformaciones puede ecualizar la varianza y además, también puede mejorar el grado de normalidad de los datos.

Referencia

Foto de Scara

No hay comentarios: