LaTex

martes, 21 de noviembre de 2017

La clase del 18 de noviembre.

Los jardines de la Universidad de Sonora son, posiblemente, los más bonitos de Hermosillo. Los mejores adornan la escuela de Psicología, pero los de Física no se quedan muy atrás. En esos jardines de Física pasan el receso los niños que vienen a clases los sábados.

La clase de este sábado estuvo muy asistida. Primero vimos un video explicativo sobre las clasificación de los triángulos según sus lados y según sus ángulos.

Luego estuvimos usando algunos problemas de solución muy sencilla para aprender a construir ecuaciones. Esto nos llevó más tiempo porque es un tema nuevo para muchos niños, pero de fundamental importancia como introducción al Álgebra.

Las cosas fueron más fáciles cuando escribimos en el pizarrón un diagrama de flujo para construir ecuaciones a partir de problemas de Aritmética, después de repasar las propiedades de la suma con sus respectivos ejemplos.

Después del receso vimos un video divertido mientras esperábamos que llegaran todos y se acomodaran en sus asientos.

Hicimos problemas de Probabilidad basados en un pequeño video explicativo sobre el tema y más ejercicios de construcción de ecuaciones.

Nos quedó pendiente graficar puntos en el plano cartesiano y algunos temas divertidos que saldrán de esas gráficas.

El sábado anterior iniciamos con el tema ¿qué es la velocidad? y quedó pendiente hacer problemas de cálculo de velocidades, que veremos la próxima semana.



Foto de la clase del sábado 18 de noviembre.

sábado, 26 de agosto de 2017

Prueba de bondad de ajuste con diferentes valores esperados. (Segunda de dos partes).


Resumen del artículo escrito por Richard Armstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.



En los ejemplos descritos hasta ahora, las frecuencias esperadas han sido las mismas en cada categoría de la variable. En ciertas circunstancias, sin embargo, las frecuencias esperadas o predichas pueden variar de categoría en categoría. Esta es una circunstancia común en investigación genética, donde un investigador puede predecir de una teoría genética la frecuencia de un genotipo particular en la descendencia. Por ejemplo, dos padres heterocigóticos portadores de un rasgo anormal autosómico dominante tienen una probabilidad de 3:1 de transmitir la característica a su descendencia.

En optometría, las expectativas de la variable pueden surgir si un investigador deseara probar si una distribución estadística particular puede ser ajustada a una muestra de datos. Por ejemplo, un optometrista hace una medida de un parámetro visual en 20 pacientes tomados aleatoriamente de una población y desea determinar si los datos se desvían significativamente de una distribución normal (Tabla 4).


\(Clases de Frecuencia \hspace{16mm} Frec. Observada (F_o) \hspace{5mm} Frec. Esperada (F_e) \hspace{5mm} Contribución \chi^2 \)


\(< \mu -1.5 \alpha \hspace{50mm} 0 \hspace{45mm} 1.3362 \hspace{45mm} 1.34 \)
\( \mu -1.5 \alpha \hspace{2mm} a \hspace{2mm} \mu -0.5 \alpha \hspace{30mm} 6 \hspace{45mm} 4.8346 \hspace{45mm} 0.28 \)

\( \mu -0.5 \alpha \hspace{2mm} a \hspace{2mm} \mu \hspace{45mm} 7 \hspace{45mm} 3.8292 \hspace{45mm} 2.63 \)

\( \mu \hspace{2mm} a \hspace{2mm} \mu +0.5 \alpha \hspace{45mm} 0 \hspace{45mm} 3.8292 \hspace{45mm} 3.83 \)

\( \mu +0.5 \alpha \hspace{2mm} a \hspace{2mm} \mu +1.5 \alpha \hspace{30mm} 6 \hspace{45mm} 4.8346 \hspace{45mm} 0.28 \)

\( > \mu -1.5 \alpha \hspace{50mm} 1 \hspace{45mm} 1.3362 \hspace{45mm} 0.08 \)

\(totales \hspace{57mm} 20 \hspace{45mm} 20.00 \hspace{45mm} 8.44\)

Por lo tanto, la prueba de bondad de ajuste de los datos observados a una distribución normal \(\chi^2=8.44\), 3 \(gl\), p>0.05


Tabla 4. El método de la Ji-cuadrada para probar el ajuste de los datos observados a una distribución normal (\(\mu=media\) y \(\sigma=\) desviación estándar de las observaciones)

Para ajustar la distribución normal, la variable estudiada primero fué dividida en clases de frecuencia describiendo el rango de la variable en la población. En este caso fueron consideradas seis clases. Los límites de estas clases se convierten para que sean miembros de la distribución normal estándar usando el método descrito en el primer artículo.

Para llevar a cabo este cálculo, la media muestral y la desviación estándar de las 20 medidas se calculan primero. Luego la media muestral se resta de cada límite de clase y se divide por la desviación estándar, que convierte las medidas originales a sus correspondientes en la distribución normal estándar. Entonces pueden ser usadas las tablas de la distribución normal estándar para determinar el número esperado de observaciones, de las 20, que deberían caer dentro de cada clase si los datos estuvieran normalmente distribuídos.

Notemos que la \(F_e\) varía de una clase a otra. Luego la \(F_e\) es comparada con la \(F_o\) usando la prueba de bondad de ajuste \(\chi^2\).

En el caso presente el valor de \(\chi^2\), totalizado sobre todas las clases, igualó 8.44 y esto excede el valor al 5% de probabilidad para 3 \(gl\).

La Ji-cuadrada tiene 3 \(gl\) en este ejemplo porque la media, la desviación estándar y la frecuencia total tienen que ser calculadas de los datos para hacer la prueba. Así, los \(gl=\)número de frecuencias (6)-3 parámetros. La hipótesis nula es rechazada y concluímos que la población no está normalmente distribuída. Notemos que este ejemplo usa un número relativamente pequeño de observaciones y normalmente se requeriría una muestra mucho más grande de medidas para ajustar la distribución normal adecuadamente.

Tablas de contingencia de la Ji-cuadrada.

Tabla 2X2

En los ejemplos discutidos anteriormente los datos han consistido en dos o más categorías de una sola variable, por ejemplo, hombres/mujeres o meses del año. El mismo principio, sin embargo, puede ser extendido al análisis de dos diferentes variables. Por ejemplo, consideremos el siguiente estudio del posible efecto de fumar en la incidencia de degeneración macular relacionada con la edad (DMRE).
Fué tomada aleatoriamente una muestra de 1429 personas mayores de una población y clasificada de acuerdo a si eran o no fumadores y si había evidencia de la presencia de DMRE. Los datos obtenidos en el estudio (Tabla 5) constituyen una tabla de contingencia de 2X2, es decir, hay dos variables, cada una con dos categorías.

Tabla5No-fumadoresFumadoresTotal renglones
DMRE10744151
no-DMRE9403381278
Total columnas1047382Gran total
% con DMRE10.2%11.5%1429
  1. La frecuencia esperada en cada celda es calculada como: \(\frac{Total renglon \times Total columna}{Gran Total}\)
  2. Por tanto, la \(F_e\) de no-fumadores con DMRE es (151*1047)/1429=110.63. Esta cantidad se repite en cada celda de la tabla.
  3. Calcular \(\chi^2\) de acuerdo a la ecuación 1. En este caso \(\chi^2=0.50\) con 1 \(gl\).
Tabla 5.¿Está la incidencia de DMRE relacionada con fumar? Los datos son el número de pacientes, de un total de 1429, que caen en cada categoría.

Notemos que en la Tabla 5 el 10% de los no-fumadores exhibieron signos y síntomas de DMRE contra el 11.5% de los fumadores. Podemos preguntar si la diferencia es suficiente para concluir que fumar provoca un efecto en la incidencia de DMRE.

La prueba se describe en la Tabla 5. Notemos que en una tabla de 2X2, la \(F_e\) tiene que ser calculada para cada celda en la tabla separadamente, es decir, hay cuatro diferentes valores para la \(F_e\). Una tabla de 2X2, sin embargo, solo tiene un grado de libertad.

Para entender porqué una tabla de 2X2 solo tiene 1 \(gl\), se debe calcular cada \(F_e\) y examinar las desviaciones de las frecuencias observadas con respecto a las esperadas para cada celda de la tabla. Examinar estas desviaciones mostrará que son la misma, es decir, en una tabla de 2X2 solo hay un estimado independiente de la desviación de las frecuencias observadas respecto a las esperadas.

En este caso, el valor calculado de \(\chi^2\) es menor que el valor tabulado al 5% de probabilidad. Este es un valor que podría ocurrir bastante frecuentemente por casualidad y, por lo tanto, podríamos concluir, al menos de este estudio, que no hay pruebas concluyentes de que fumar esté relacionado con DMRE.

Nótese que hay estudios en la literatura que sugieren una posible conexión entre DMRE y fumar. Los resultados de un estudio individual con frecuencia no son concluyentes y conclusiones como si fumar está considerado un “factor de riesgo” para DMRE con frecuencia se basan en una combinación de muchos estudios individuales.

Tabla de Contingencia RXC.

También es posible analizar dos variables con cualquier número de categorías por variable y ésto a veces se menciona como una tabla de contingencia de renglón R X columna C.

En el siguiente ejemplo un optometrista quiere determinar si la precisión en la lectura, determinada como el total de errores cometidos en una prueba, varía entre un grupo de sujetos controles mayores y un grupo de pacientes con DMRE cuando se presentan con cuatro diferentes filtros de color (Tabla 6).

Tabla6: filtrosrojoverdeazulamarillo Total renglones
Control4793188824909
DMRE50845890351091
Total columnas98777617859N=2000
  1. La frecuencia esperada en cada celda es calculada como: \(\frac{Total renglon \times Total columna}{Gran Total}\)
  2. Por tanto, la \(F_e\) de los errores con el filtro rojo en los controles es (909*987)/2000=448.59.
  3. Repetir para cada celda de la tabla y calcular la \(\chi^2\) usando la ecuación 1.
  4. En este caso la \(\chi^2=11.72\) (3gl) p<0 .001="" ol="">

Tabla 6.¿La frecuencia de los errores en la lectura usando diferentes colores en los filtros varía entre las personas mayores, controles y pacientes con DMRE? Los datos son el número total de errores cometidos por el paciente en cada prueba.

Para hacer la prueba, la \(F_e\) es calculada para cada celda de la tabla usando la misma fórmula que se usó para la tabla de 2X2. Entonces el valor de la \(\chi^2\) es calculada usando la ecuación 1. En este ejemplo, el valor \(\chi^2=11.72\). Este valor es llevado a la tabla \(\chi^2\), usando el renglón \((R-1)(C-1) gl\). Este valor excede el valor de \(\chi^2\) en la tabla al nivel p=0.01, es decir, la incidencia de los errores en la lectura usando los diferentes filtros de colores varía entre los dos grupos de pacientes.

Se requerirá un examen más detallado de los datos para determinar si las diferencias entre los dos grupos estuvieron presentes usando todos los tipos de filtros o solo un subconjunto de filtros. Este proceso puede incluir partir los datos en pequeñas tablas de contingencia cada una de las cuales puede ser probada usando la \(\chi^2\).

Referencia

Foto de Joffi

jueves, 10 de agosto de 2017

Métodos de análisis de datos en Optometría. (Primera de dos partes)

Resumen del artículo escrito por Richard Armstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

Análisis de Frecuencias y Proporciones.

En los escritos anteriores se describió la aplicación de métodos estadísticos a problemas clínicos en optometría que han sido aplicados a datos de medidas por ejemplo la longitud axial del ojo o la presión intraocular. Los datos de medidas son expresados en unidades; son variables continuas y, en muchos casos, llenan los requerimientos de la distribución normal.

En algunos estudios, sin embargo, los datos no son medidas sino cantidades o frecuencias de eventos particulares. En tales casos, un investigador puede estar interesado en saber si un evento específico sucede más frecuentemente que otro, o si un evento ocurre con la frecuencia predicha por un modelo científico.

Por ejemplo, un oftalmólogo cree que la prevalencia de una enfermedad ocular, según indica el número de pacientes referidos a los hospitales en West Midlands, es igualmente común entre hombres y mujeres. Así que el investigador quiere determinar si el número de hombres y mujeres observados se desvía significativamente de una razón esperada 1:1.

Además, un optometrista puede creer que el uso de un particular lente de contacto es un factor de riesgo para desarrollar úlceras corneales. En este caso puede ser interesante determinar si la proporción de individuos que desarrollan úlceras corneales fué el mismo en los grupos de pacientes clasificados de acuerdo al uso de diferentes tipos de lentes de contacto.

Pruebas estadísticas previas aplicadas a datos de medidas han sido basadas en las distribuciones \(t\) y \(z\). Para analizar los datos de frecuencia, sin embargo, se requiere un diferente tipo de prueba estadística y una nueva distribución: la distribución Ji-cuadrada.

Este artículo revisa el uso de la distribución Ji-cuadrada al analizar frecuencias y proporciones sacados de una variedad de problemas clínicos en optometría. Además, serán descritas algunas de las pruebas alternativas a la Ji-cuadrada, que son útiles en circunstancias particulares, como la prueba exacta de Fisher y la prueba de Kolmogorov-Smirnov.

Como en los artículos previos, los métodos de análisis de datos son ilustrados con conjuntos de datos simples. Estos datos son usados solamente para ilustrar la metodología, y los efectos experimentales revelados no son necesariamente indicativos de los resultados, que hubieran sido obtenidos mediante experimentos más detallados.

La distribución Ji-cuadrada.

Ejemplo.

Un oftalmólogo cree que una enfermedad ocular es igualmente común entre hombres y mujeres. Una revisión de casos referidos a los hospitales en West Midlands durante los últimos 10 años produjo la frecuencia de ocurrencia de la enfermedad como se muestra en la Tabla 1.


\(Tabla \hspace{3mm} 1\) \(Hombres\)\(Mujeres\)\(Total\)
\(Razón Esperada\) \(1\)\(1\)
\(Frecuencia Observada (F_o)\) \(480\)\(420\)\(900\)
\(Frecuencia Esperada (F_e)\) \(450\)\(450\)\(900\)
\(F_o-F_e\) \(+30\)\(-30\)
\((F_o-F_e)^2\) \(900\)\(900\)
\((F_o-F_e)^2/F_e\) \(2\)\(2\)
\(\chi^2=\sum (F_o-F_e)^2/F_e=4\)

¿Estos resultados apoyan o contradicen la hipótesis nula de que no hay diferencia en la ocurrencia de la enfermedad entre hombres y mujeres, es decir, los datos refutan una razón hombre:mujer de 1:1?

Cálculo de la Ji-cuadrado.

En 1899, el estadístico Karl Pearson ideó una prueba estadística para responder este tipo de pregunta. Pearson ideó un “índice de dispersión”, llamado Ji-cuadrada (\(\chi^2\)), que mide la desviación de una frecuencia observada (\(F_o\)) de una frecuencia esperada o predicha (\(F_e\)). Junto con las distribuciones \(t\) y \(z\) descritas en artículos previos, la distribución Ji-cuadrada es una de las más importantes en estadística. La Ji-cuadrada se define como la suma de los cuadrados de las diferencias entre cada frecuencia observada (\(F_o\)) y cada frecuencia esperada (\(F_e\)), cada diferencia dividida por la frecuencia esperada:

\[\chi^2=\sum\frac{(F_o-F_e)^2}{F_e} \hspace {20mm} \dots (1)\]

Si los movimientos observados y esperados son idénticos, el valor de la \(\chi^2\) es cero. El valor de \(\chi^2\) se incrementa a medida que la diferencia entre los valores observado y esperado se incrementa.

En el ejemplo dado en la Tabla 1, el valor calculado de \(\chi^2\) es 4. Nótese que la \(F_e\) de hombres y mujeres con una enfermedad particular es calculada de la \(F_o\). Para juzgar si es probable que un valor de \(\chi^2\) de 4 se obtenga por casualidad mediante una muestra aleatoria, se consulta la tabla \(\chi^2\) para \(n-1\) grados de libertad \(gl\) donde \(n\) es igual al número de categorías de la variable.

Grados de Libertad.

La consideración de este ejemplo nos da un contexto útil en el cuál explicar el significado de los grados de libertad \(gl\) en más detalle. Como se describe en un artículo anterior, el número de \(gl\) hace posible tener una tabla estadística para buscar en el renglón correcto basado en el número de observaciones.

En la mayoría de las aplicaciones, los \(gl\) de una cantidad estadística se define como el número de observaciones menos el número de parámetros que tienen que ser calculados de los datos para estimar la cantidad estadística. Así, en el presente ejemplo, hay dos observaciones (las dos frecuencias, hombres y mujeres) pero la \(F_e\) tiene que ser calculada de la \(F_o\) para hacer la prueba \(\chi^2\), por lo tanto, \(gl=2-1=1\).

Reduciendo el número de observaciones “efectivas” de esta manera parecería ser un procedimiento lógico dado que los datos están siendo usados para probar una hipótesis y para calcular el estadístico necesario para hacer la prueba.

Cuando una prueba estadística se hace por primera vez, es útil calcular los grados de libertad apropiados y asegurarnos de que coinciden con los que indica el programa estadístico. Esta verificación puede ser particularmente importante cuando se usan pruebas estadísticas más complejas, como el análisis de varianza, que será discutido posteriormente.

La distribución Ji-cuadrada 1 \(gl\)

La distribución estadística Ji-cuadrada con un grado de libertad es mostrada en la figura.

Esta distribución describe los valores de Ji-cuadrada, que resultarían por casualidad al comparar dos frecuencias tomadas aleatoriamente, por ejemplo de una tabla de números aleatorios.

Comparada con las tablas \(z\) y \(t\), la distribución \(\chi^2\) para 1 \(gl\) es asimétrica en su forma, pero como en las distribuciones \(z\) y \(t\), el cálculo de la \(\chi^2\) convierte las diferencias entre las frecuencias observadas y las esperadas a un solo estadístico, que es un miembro de esta distribución.

Se obtiene un valor significativo de la \(\chi^2\) cuando cae en la cola de la distribución, que incluye el 5% de las observaciones más extremas. La gráfica indica que todos los valores de \(\chi^2\) iguales o mayores que 3.84 caerían dentro de esta categoría.

En el ejemplo de la Tabla 1, se obtuvo un valor de \(\chi^2=4\) que es más grande que el valor crítico al 5% del nivel de probabilidad. Es improbable que este valor de \(\chi^2\) se haya obtenido por casualidad.

La probabilidad es, de hecho, menor a 5% y, por lo tanto, concluímos que las frecuencias observadas se separan significativamente de las razones esperadas, es decir, hay un exceso de hombres referidos a los hospitales de West Midlands con la enfermedad ocular en cuestión.

Este tipo de prueba estadística con frecuencia es descrita como “prueba de bondad de ajuste”.

Esencialmente, una serie de frecuencias observadas son comparadas con una distribución de resultados esperada o predicha. Un importante hecho acerca de este tipo de pruebas es que la distribución \(\chi^2\) está basada en la frecuencia de eventos y no puede ser aplicada a datos de medida, es decir, cualquier dato de medida en unidades.

Esta prueba puede ser extendida para cualquier número de categorías de frecuencias y el caso general, para \(n\) categorías es descrito en la Tabla 2.

Tabla 2

\(Categorías =\{1,2,3, \dots n\}\)

\(F_o=\{ O_1,O_2,O_3, \dots O_n\}\)

\(F_e=\{ E_1,E_2,E_3, \dots E_n\}\)

  1. Calcular las frecuencias esperadas \(F_e\). En el caso simple serán las mismas para cada categoría. Así, si las frecuencias observadas \(F_o\) suman \(N\), entonces \(F_e\) será \(N/n\).
  2. Calcular la Ji-cuadrada \[\chi^2=\sum\frac{(F_o-F_e)^2}{F_e} \]
  3. El valor de \(\chi^2\) es llevado a la tabla \(\chi^2\) para compararlo con el renglón con \(n-1\hspace{3mm} gl\) donde \(n\) es el número de categorías.
  4. El valor de Ji-cuadrada tiene que ser igual o más grande que el valor tabulado para p=0.05 para indicar una diferencia significativa de los datos observados respecto a los esperados.

Prueba de bondad de ajuste con 12 categorías y la misma expectativa.

Un médico contó el número de niños nacidos cada mes en la maternidad del hospital con una específica anormalidad genética (Tabla 3). ¿El número de niños nacidos con esta anormalidad varían mensualmente?

Tabla 3
Categorías (meses) \(E \hspace{5mm} F \hspace{5mm} M \hspace{5mm} A \hspace{5mm}M \hspace{5mm}J \hspace{5mm}J \hspace{5mm}A \hspace{5mm}S \hspace{5mm}O \hspace{5mm}N \hspace{3mm}D\) \(Suma \hspace{3mm}\)
\(F_o\) \(8 \hspace{5mm}19 \hspace{5mm}11 \hspace{5mm}12 \hspace{5mm}16 \hspace{5mm}8 \hspace{5mm}7 \hspace{6mm}5 \hspace{6mm}8 \hspace{6mm}3 \hspace{6mm}8 \hspace{6mm}8\) 113

  1. La frecuencias esperada \(F_e\) en cada mes es \(\sum F_o/n\) donde \(n \) es el número de categorías=113/12=9.42
  2. En este caso \(\chi^2=23.5\) que excede el valor en la tabla para 11 \(gl\) al p=0.05.

En este caso, la \(F_e\), asumiendo igual número de nacimientos anormales por mes, es el total de las frecuencias sumadas de los meses, dividido por el número de meses. El valor de \(\chi^2\) calculado fué de 23.5 y excede el valor del estadístico para 11 \(gl\) con nivel de probabilidad p=0.05.

Así, el número de niños nacidos con esta anormalidad genética parece variar mensualmente.

Es necesario tener cuidado en la interpretación de este resultado, sin embargo, porque es probable que haya una variación en el número total de niños nacidos cada mes y este hecho no ha sido tomado en cuenta. Por lo tanto, podría ser más apropiado analizar la proporción del número total de niños nacidos cada mes con la anormalidad más que las frecuencias absolutas.

Referencia








lunes, 7 de agosto de 2017

¿Hay diferencia entre dos muestras? (5 de 5)


Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.



Pruebas no paramétricas

La moda y la mediana.

Un enfoque alternativo al análisis de datos que no se distribuyen normalmente es usar una prueba con una distribución libre o no paramétrica (el término no paramétrico se usa para distinguir estas pruebas de las paramétricas, que están basadas en la distribución normal). Estas pruebas son fáciles de hacer y pueden ser usadas a pesar de la forma de la distribución subyacente, siempre y cuando pueda asumirse que las muestras que van a ser comparadas vienen de una distribución que tiene la misma forma.

Como se vió antes, cuando una distribución se desvía significativamente de la normal, la media aritmética con frecuencia es una descripción pobre de su tendencia central.

Sin embargo, hay dos estadísticos adicionales que pueden ser usados para describir la tendencia central de tal distribución. Primero, la moda que es el valor de la variable \(x\) con la frecuencia más alta, es decir, el punto máximo de la curva. Segundo, la mediana que es el valor de la \(x\) que se encuentra en medio, es decir, si todos los valores de \(x\) fueran enlistados en un orden ascendente o descendente, la mediana sería el valor de enmedio del listado.

Ha habido poco progreso ideando pruebas estadísticas que estén basadas en la moda pero hay dos pruebas que pueden ser usadas para probar las diferencias entre las medianas de dos muestras: la prueba U Mann-Whitney y la prueba Wilcoxon. Enseguida se expondra la primera.


La prueba U de Mann-Whitney (para datos no pareados)


Consideremos un experimento diseñado para investigar la habilidad de personas normales mayores y personas con degeneración macular relacionada con la edad DMRE para leer acertadamente una página impresa.
La hipótesis nula es que la DMRE no afecta la habilidad de los sujetos para leer acertadamente, siendo la habilidad para leer acertadamente calificada en una escala de 15 puntos.

Los datos en este experimento incluyen números enteros pequeños y como tal, pueden no estar distribuídos normalmente. Un enfoque para este problema podría ser transformar los valores a una diferente escala y usar la prueba \(t\) no pareada. Sin embargo, un método alternativo es hacer una prueba U de Mann-Whitney, el equivalente no paramétrico de la prueba \(t\) no pareada como se ve en la siguiente tabla:

\(DMRE(A)\) \(\hspace{3mm}4\)\(\hspace{3mm}5\)\(\hspace{3mm}6\)\(\hspace{3mm}7\)\(\hspace{3mm}10\)\(\hspace{3mm}14\)
\(Control(B)\) \(\hspace{3mm}8\)\(\hspace{3mm}9\)\(\hspace{3mm}11\)\(\hspace{3mm}12\)\(\hspace{3mm}13\)\(\hspace{3mm}15\)
\(Rango A\) \(\hspace{3mm}1\)\(\hspace{3mm}2\)\(\hspace{3mm}3\)\(\hspace{3mm}4\)\(\hspace{3mm}7\)\(\hspace{3mm}11\)
\(Rango B\) \(\hspace{3mm}5\)\(\hspace{3mm}6\)\(\hspace{3mm}8\)\(\hspace{3mm}9\)\(\hspace{3mm}10\)\(\hspace{3mm}12\)

  1. Ordenar las observaciones juntas de los dos grupos . Asignar rangos ascendentes 1,2,3,… al conjunto completo de observaciones. A los valores repetidos, llamados “ligaduras”, se les asigna el valor de la media de sus rangos. Por ejemplo: si tenemos las observaciones 4, 5, 6, 6, 7, sus rangos serían 1, 2, 3, 4, 5, pero como el seis se repite (ligadura), deberán promediarse sus rangos: en este caso el promedio, llamado rango de orden medio, de 3 y 4 que es 3.5. Luego los rangos quedarían 1, 2, 3.5, 3.5, 5.
  2. Sumar los rangos de cada renglón \(R_A=28\) y \(R_B=50\).
  3. Calcular los estadísticos \(U_A\) y \(U_B\), por ejemplo
    \[U_A=\left(\frac{n_A(n_A+1)}{2}+(n_An_B)\right)-R_A\] donde \(n_A\) y \(n_B\) es el número de pacientes en cada grupo. Una ecuación similar puede ser construída para \(U_B\) sustituyendo \(n_B\) y \(R_B\).
  4. Tomar el valor más pequeño entre \(U_A\) y \(U_B\) y compararlo en la tabla del \(U\) tabulado de Wilcoxon. El menor \(U\) (en este caso \(U_B=7\)) tiene que ser igual o menor que el valor tabulado para significancia, es decir, valores pequeños de \(U\) indican significancia.

Para una explicación más detallada de la prueba U de Mann-Whitney puede consultarse el video de la Maestra Purificación Galindo de la Universidad de Salamanca sobre el tema.

Referencia




Foto de Engin Akyurt

miércoles, 2 de agosto de 2017

¿Hay diferencia entre dos muestras? (4 de 5)

Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

Suposiciones y limitaciones de las pruebas estadísticas.

Las pruebas estadísticas descritas hacen una serie de suposiciones acerca de los datos experimentales que tienen que ser, al menos, aproximadamente ciertas antes de que la prueba pueda ser aplicada válidamente. La más importante de estas suposiciones es que las medidas individuales, las medias de los tratamientos o las diferencias entre medias son variables paramétricas, es decir, miembros de una población que se distribuye normalmente. Cuando esto es cierto, la distribución normal estándar y la distribución \(t\) pueden ser usadas para hacer juicios estadísticos acerca de los datos.

En algunos casos, sin embargo, una variable puede alejarse significativamente de una distribución normal. Las distribuciones pueden diferir de la normal de dos maneras, por el sesgo y por la curtosis. En una distribución sesgada, el pico de la distribución está desplazado hacia la derecha (sesgo positivo) o hacia la izquierda (sesgo negativo) como se ve en la figura, y como resultado, la media aritmética ya no es una buena descripción de la tendencia central de esa distribución.

Por otro lado, distribuciones que exhiben kurtosis son más planas que la normal o tienen un exceso de observaciones cerca de la media y menos en las colas en comparación con la distribución normal. En distribuciones que exhiben kurtosis, la desviación estándar no es un descriptor acertado de la dispersión de la distribución con una media dada. Una mayor curtosis implica una mayor concentración de datos muy cerca de la media de la distribución.

En algunas circunstancias, el investigador puede saber si los datos se distribuyen normalmente o no. En otros casos, puede ser necesario recolectar suficientes observaciones experimetnales para probar si una distribución es normal.

En muchas situaciones experimentales, sin embargo, podemos no saber si los datos vienen de una distribución normal o no, y podemos tener datos insuficientes para hacer una prueba de normalidad. En situaciones como ésta deben considerarse los siguientes puntos. Primero, la mayoría de las medidas hechas en al menos tres cifras significativas tienen una probabilidad más alta de distribuirse normalmente o no desviarse demasiado de la normal. Segundo, la distribución de medias muestrales, si se basa en un número razonable de observaciones -digamos de 10 a 20- será una distribución normal incluso si las medidas individuales no lo son. Tercero, pequeñas desviaciones de los datos con respecto a la normalidad no afectan significativamente la validez de las pruebas que se han descrito.

Transformación de los datos.

En algunas situaciones los datos se apartarán radicalemente de la distribución normal y se requerirá un nuevo enfoque para analizar los datos. Un método es convertir las medidas originales para que puedan ser expresadas en una nueva escala que sea más parecida a la distribución normal que la escala original. Las pruebas estadísticas paramétricas originales pueden entonces ser aplicadas en los valores transformados.

Hay tres circunstancias comunes en las cuales debería ser considerada esa transformación.

  • Primero, si los datos están en forma de porcentajes. Por ejemplo, considerar los porcentajes de disminución de la presión intraocular en un intervalo específico de tiempo cuando al paciente se le dan gotas para los ojos, y especialmente si la mayoría de las observaciones están cercanas a cero o 100%. Los datos en porcentajes pueden ser transformados a una escala angular o arcoseno definida como sigue:
    \[Angulo=sen^{-1} \sqrt{\frac{\%}{100}} \hspace{20mm}\dots (3)\]


    La aplicación de la transformación a los % aproxima la distribución a una normal. El programa estadístico con frecuencia brindará esta transformación. Los datos en porcentajes con frecuencia están significativamente sesgados cuando la media es muy pequeña o muy grande y consecuentemente, en la escala del arcoseno, los porcentajes cercanos a 0% o a 100% son dispersados para incrementar su varianza. Entonces puede hacerse una prueba \(t\) pareada o no pareada, usando los datos transformados como se describió.

  • Segundo, los datos que incluyan números enteros pequeños o cantidades evaluadas utilizando una puntuación a escala limitada, por ejemplo de 0 a 5, es menos probable que se distribuyan normalmente. En este caso, una transformación a \(\sqrt{x}\) (o \(\sqrt{x+1}\) si hay muchos ceros presentes) puede hacer que la escala se distribuya más normalmente.

  • Tercero, la prueba \(t\) también asume homogeneidad de varianzas, es decir, que el grado de variabilidad es similar en los grupos de controles y los de tratados. No es raro, sin embargo, para los valores de los controles que exhiban mayor o menor variabilidad que el grupo de los tratados experimentalmente. En este caso, una transformación de las medidas originales a logaritmos o una de las otras transformaciones puede ecualizar la varianza y además, también puede mejorar el grado de normalidad de los datos.

Referencia

Foto de Scara

lunes, 31 de julio de 2017

¿Hay diferencia entre dos muestras? (3 de 5)

Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

Pruebas pareadas y no pareadas.

El experimento descrito antes podría ser llevado a cabo de dos diferentes maneras, por ejemplo, los métodos pareado y no pareado. Cómo se lleva a cabo un experimento se refiere a su diseño y es un aspecto muy importante de la experimentación. El experimento descrito en la Tabla 1 (en la primer entrada de esta serie) fué llevado a cabo usando un diseño no pareado, es decir, los sujetos experimentales fueron asignados de manera aleatoria, y sin restricción, a los grupos de controles y de tratados. En un diseño pareado, sin embargo, los seis sujetos experimentales son, primero divididos en tres pares y segundo, el tratamiento experimental es asignado a cada par y, de manera aleatoria e independiente, a los miembros de cada par. Por lo tanto hay una restricción en la asignación de los tratamientos a los sujetos experimentales y se requiere un análisis diferente.

La mayoría de las veces, los casos pareados se hacen en base a edad, sexo o tamaño. Por ejemplo, si los seis sujetos experimentales en la Tabla 1 varían en edad, podrían haber sido divididos en tres pares para que los miembros de cada par fueran de una edad similar. En un diseño pareado, la prueba \(t\) se calcula como sigue:
\[t=\frac{\bar{d}}{sd\sqrt{n}} \hspace{20mm}\dots (2)\]

En este caso \(\bar{d}\) es la media de las diferencias entre cada uno de los tres pares de observaciones y \(sd\) es la desviación estándar de esas diferencias.

La misma tabla \(t\) es usada para determinar la probabilidad de que el valor calculado de \(t\) se haya obtenido de casualidad. Sin embargo, en una prueba \(t\) pareada, se usa una regla diferente para introducir la tabla \(t\), es decir, \(t\) ahora tiene \(n-1\) grados de libertad, donde \(n\) es el número de pares de sujetos.

Ventajas de la prueba pareada.

Uno puede ahora preguntar si el método más apropiado para llevar a cabo el experimento deseado será un diseño pareado o no pareado. Cada tipo de diseño tiene ventajas y desventajas. Un diseño pareado con frecuencia se usa para reducir el grado de variación presentada entre los sujetos experimentales.

Cómo se logra ésto puede verse examinando la fórmula para la \(t\) no pareada dada en la ecuación 1. El valor de \(t\) en la ecuación 1, es la diferencia entre las medias de los dos tratamientos dividida por el error estándar de esta diferencia. Si la variación entre los sujetos experimentales es grande, se incrementará el error estándar de la diferencia y disminuirá el valor de \(t\) incluso si la diferencia entre medias parece relativamente grande.

Notemos, sin embargo, que en un diseño no pareado, la tabla \(t\) se introduce con 4 grados de libertad. Pareando los sujetos experimentales puede reducirse el error estándar porque \(t\) en la ecuación 2 es calculada de las diferencias entre pares de observaciones. En otras palabras, el efecto del tratamiento experimental está siendo determinado dentro de pares de sujetos.

Parear debería solo ser considerado, sin embargo, si hay un método lógico para formar pares, por ejemplo por edad o tamaño donde probablemente se pueda conseguir una reducción significativa en el error estándar. Si no hay reducción en el error estándar al formar parejas, entonces sería una desventaja este diseño porque la tabla \(t\) es introducida con solo dos grados de libertad (uno menos que el número de grupos). Introducir la tabla \(t\) con un número menor de grados de libertad significa que se requerirá un valor más grande de \(t\) para demostrar una diferencia significativa entre las medias.

Referencia

Foto de Kirahoffmann

sábado, 29 de julio de 2017

¿Hay diferencia entre dos muestras? (2 de 5)

Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

La lógica de las tablas estadísticas.

Para juzgar si el valor de \(t\) es estadísticamente significativo, es llevado a una tabla estadística de la distribución \(t\). El cálculo de \(t\) usando computadora brinda un valor de probabilidad \(p\) correspondiente al valor de \(t\). Para entender el significado de \(p\), sin embargo, es necesario entender la lógica de las tablas \(t\). Todas las tablas estadísticas tienen esencialmente la misma estructura y la misma lógica básica.

  • Hay una columna de cifras, generalmente a la izquierda de la tabla, que representa los grados de libertad \(gl\) de los datos. Esto permite conectar correctamente el renglón basado en el número de observaciones que se tienen. El concepto de grados de libertad será explicado con mayor detalle en un artículo posterior. Todas las pruebas estadísticas tienen una regla que determina cómo se usará la tabla.
  • En el cuerpo de la tabla hay columnas de valores de un estadístico, como \(t\), todos los cuales pueden obtenerse solo por casualidad, es decir, cuando no hay verdaderas diferencias involucradas.
  • El primer renglón de la tabla muestra las probabilidades \(\alpha\) de que los valores del estadístico en una columna particular pudieran obtenerse por casualidad. Por lo tanto, hay una probabilidad de 10%, es decir \(p=0.10\) (o 1 en 10) de que los valores en la columna del 10% pudieran obtenerse solo por casualidad y hay 1% de probabilidad, \(p=0.01\) (1 en 100) de que los valores en la columna de 1% pudieran obtenerse por casualidad.

Como se describió anteriormente, los estadísticos usan la columna del \(p=0.05\) (o 1 en 20) para juzgar qué tan improbable tiene que ser un evento antes de que se crea que es improbable de obtenerse por casualidad y de que hay una verdadera diferencia entre las medias muestrales. Por lo tanto, si el estadístico calculado cae en una columna en la cual la probabilidad es menos de 0.05, es improbable que se haya obtenido por casualidad y si cae en una columna en la cual la probabilidad es mayor que 0.05, es más probable que se haya obtendio por casualidad. Notemos que el nivel de probabilidad de 0.05 es arbitrario y no debería ser aplicado a problemas estadísticos indiscriminadamente. Todos los efectos experimentales que resulten en valores \(t\) un poco por debajo o por arriba del 5% deberían ser considerados como efectos posibles y discutirse apropiadamente.

Aplicación a los datos en la Tabla 1 (de la entrada anterior).

  1. Calcular el valor de \(t\) usando la fórmula en la ecuación 1 (de la entrada anterior).
  2. Determinar el renglón en el cual la tabla \(t\) se ingresa, aplicando la regla de que los grados de libertad \(gl=n_1+n_2-2=4\). Esta regla aplica solo en el caso de este tipo particular de prueba \(t\) y otras pruebas estadísticas pueden tener diferentes reglas para ingresar la tabla.
  3. El valor de \(t\) al nivel de 5% de probabilidad para 4 grados de libertad tomados de la tabla \(t\) es 2.78. El programa de cómputo brindará el p valor. El valor de \(t\) obtenido en el experimento fué 3.82 y es más grande que el valor de \(t\) en \(p=0.05\). La probabilidad de obtener un valor de \(t\) de 3.82 por casualidad, cuando no hay diferencia significativa entre las medias, es menor que el 5% y por lo tanto, concluiríamos que es más probable que \(t\) no se haya obtenido por casualidad.

Así los datos se oponen a la hipótesis nula y hay un efecto del medicamento en la dilatación pupilar.

Explicación.

Para entender la lógica detrás de la prueba \(t\), es necesario examinar la distribución de \(t\) y el renglón particular de la distribución \(t\) representado por los datos que tienen 4 grados de libertad. Cuando \(t\) es calculada, la diferencia entre las dos medias es convertida para que se vuelva un miembro de esta distribución. Pequeñas diferencias entre las medias, que son más probables de obtenerse por casualidad, resultan en valores de \(t\) que están más cerca de la media de la distribución (es decir \(t=0\)). Diferencias más grandes de las medias resultan en valores \(t\) más lejanos, en las colas de la distribución. Cuando \(t\) es igual o más grande que 2.78 (el valor de \(p=0.05\)) para 4 grados de libertad, el valor está en la zona de la distribución que incluye el 5% de los valores más extremos. Este es un valor de \(t\) que es poco probable que se obtuviera por casualidad y por lo tanto concluímos que hay una real diferencia entre las dos medias.

Prueba de una y dos colas.

En el experimento que hemos descrito es posible proponer dos diferentes hipótesis nulas. En la primera podemos suponer que la aplicación del medicamento en cuestión no tiene efecto en la dilatación pupilar. Esta hipótesis no especifica si un incremento o una disminución en la dilatación pupilar refutaría la hipótesis nula. En este caso, una prueba de dos colas sería apropiada, es decir, ambas colas de la distribución \(t\) son usadas como muestra la Tabla 6 en la Figura, para probar la hipótesis de que hay un incremento o una disminución en el diámetro pupilar.

Segundo, podemos solo suponer que la aplicación del medicamento no incrementaría la dilatación pupilar dado que se sabe que no la disminuye significativamente. Este tipo de hipótesis especifica si es necesario un efecto positivo o negativo para refutar la hipótesis y por lo tanto, sería apropiada una prueba de una cola. Algunas tablas estadísticas pueden indicar las probabilidades de una y dos colas correspondientes a una columna particular. La mayoría de las tablas estadísticas, con algunas excepciones, solo indican las probabilidades de dos colas. Para encontrar las probabilidades de una cola en las tablas de dos colas, se parte la probabilidad, es decir, el 5% de las probabidades de una cola serían encontradas en la columna de 10% de dos colas.

Referencia

Foto de Lum3n