Processing math: 100%

LaTex

sábado, 29 de julio de 2017

¿Hay diferencia entre dos muestras? (2 de 5)

Este es un resumen de un artículo de Richard A. Amstrong y Frank Eperjesi dirigido al personal de optometría que requiera conocimientos básicos de estadística para analizar datos.

La lógica de las tablas estadísticas.

Para juzgar si el valor de t es estadísticamente significativo, es llevado a una tabla estadística de la distribución t. El cálculo de t usando computadora brinda un valor de probabilidad p correspondiente al valor de t. Para entender el significado de p, sin embargo, es necesario entender la lógica de las tablas t. Todas las tablas estadísticas tienen esencialmente la misma estructura y la misma lógica básica.

  • Hay una columna de cifras, generalmente a la izquierda de la tabla, que representa los grados de libertad gl de los datos. Esto permite conectar correctamente el renglón basado en el número de observaciones que se tienen. El concepto de grados de libertad será explicado con mayor detalle en un artículo posterior. Todas las pruebas estadísticas tienen una regla que determina cómo se usará la tabla.
  • En el cuerpo de la tabla hay columnas de valores de un estadístico, como t, todos los cuales pueden obtenerse solo por casualidad, es decir, cuando no hay verdaderas diferencias involucradas.
  • El primer renglón de la tabla muestra las probabilidades α de que los valores del estadístico en una columna particular pudieran obtenerse por casualidad. Por lo tanto, hay una probabilidad de 10%, es decir p=0.10 (o 1 en 10) de que los valores en la columna del 10% pudieran obtenerse solo por casualidad y hay 1% de probabilidad, p=0.01 (1 en 100) de que los valores en la columna de 1% pudieran obtenerse por casualidad.

Como se describió anteriormente, los estadísticos usan la columna del p=0.05 (o 1 en 20) para juzgar qué tan improbable tiene que ser un evento antes de que se crea que es improbable de obtenerse por casualidad y de que hay una verdadera diferencia entre las medias muestrales. Por lo tanto, si el estadístico calculado cae en una columna en la cual la probabilidad es menos de 0.05, es improbable que se haya obtenido por casualidad y si cae en una columna en la cual la probabilidad es mayor que 0.05, es más probable que se haya obtendio por casualidad. Notemos que el nivel de probabilidad de 0.05 es arbitrario y no debería ser aplicado a problemas estadísticos indiscriminadamente. Todos los efectos experimentales que resulten en valores t un poco por debajo o por arriba del 5% deberían ser considerados como efectos posibles y discutirse apropiadamente.

Aplicación a los datos en la Tabla 1 (de la entrada anterior).

  1. Calcular el valor de t usando la fórmula en la ecuación 1 (de la entrada anterior).
  2. Determinar el renglón en el cual la tabla t se ingresa, aplicando la regla de que los grados de libertad gl=n1+n22=4. Esta regla aplica solo en el caso de este tipo particular de prueba t y otras pruebas estadísticas pueden tener diferentes reglas para ingresar la tabla.
  3. El valor de t al nivel de 5% de probabilidad para 4 grados de libertad tomados de la tabla t es 2.78. El programa de cómputo brindará el p valor. El valor de t obtenido en el experimento fué 3.82 y es más grande que el valor de t en p=0.05. La probabilidad de obtener un valor de t de 3.82 por casualidad, cuando no hay diferencia significativa entre las medias, es menor que el 5% y por lo tanto, concluiríamos que es más probable que t no se haya obtenido por casualidad.

Así los datos se oponen a la hipótesis nula y hay un efecto del medicamento en la dilatación pupilar.

Explicación.

Para entender la lógica detrás de la prueba t, es necesario examinar la distribución de t y el renglón particular de la distribución t representado por los datos que tienen 4 grados de libertad. Cuando t es calculada, la diferencia entre las dos medias es convertida para que se vuelva un miembro de esta distribución. Pequeñas diferencias entre las medias, que son más probables de obtenerse por casualidad, resultan en valores de t que están más cerca de la media de la distribución (es decir t=0). Diferencias más grandes de las medias resultan en valores t más lejanos, en las colas de la distribución. Cuando t es igual o más grande que 2.78 (el valor de p=0.05) para 4 grados de libertad, el valor está en la zona de la distribución que incluye el 5% de los valores más extremos. Este es un valor de t que es poco probable que se obtuviera por casualidad y por lo tanto concluímos que hay una real diferencia entre las dos medias.

Prueba de una y dos colas.

En el experimento que hemos descrito es posible proponer dos diferentes hipótesis nulas. En la primera podemos suponer que la aplicación del medicamento en cuestión no tiene efecto en la dilatación pupilar. Esta hipótesis no especifica si un incremento o una disminución en la dilatación pupilar refutaría la hipótesis nula. En este caso, una prueba de dos colas sería apropiada, es decir, ambas colas de la distribución t son usadas como muestra la Tabla 6 en la Figura, para probar la hipótesis de que hay un incremento o una disminución en el diámetro pupilar.

Segundo, podemos solo suponer que la aplicación del medicamento no incrementaría la dilatación pupilar dado que se sabe que no la disminuye significativamente. Este tipo de hipótesis especifica si es necesario un efecto positivo o negativo para refutar la hipótesis y por lo tanto, sería apropiada una prueba de una cola. Algunas tablas estadísticas pueden indicar las probabilidades de una y dos colas correspondientes a una columna particular. La mayoría de las tablas estadísticas, con algunas excepciones, solo indican las probabilidades de dos colas. Para encontrar las probabilidades de una cola en las tablas de dos colas, se parte la probabilidad, es decir, el 5% de las probabidades de una cola serían encontradas en la columna de 10% de dos colas.

Referencia

Foto de Lum3n